Курсы по нейросетям: Подборка курсов по data science и нейроным сетям
Лучший видеокурс по нейронным сетям на русском
Искусственные нейронные сети упакованы в удобный видеокурс, который научит новичков и освежит знания тех, кто уже давно прошел базис.
Когда используют нейронные сети, и как они работают? Первый урок состоит из ответов на эти вопросы. Работа нейронной сети объясняется с помощью удобных схем, и проводится аналогия с человеческим мозгом. Стоит отметить, что каждый видеоурок дополнен выводами и заданиями.
Сравнение с биологической НС при рассмотрении нейрона и синапса позволит понять, как работают искусственные нейронные сети, изучить механизм изнутри. Это все еще относится к разделу базиса и подойдет тем, кто только начал изучать ИНС.
В уроке затрагивается структура биологических сетей, их мерность, строение ИНС и описание каждого из ее слоев.
Нейрон объясняется на примерах, а также рассказывается, что необходимо предпринять, чтобы обучение и работа нейронной сети были корректными.
В уроке подробно разобраны этапы работы НС и затрагиваются рекуррентные и feedforward сети, разница между которыми представлена схематически.
Здесь курс проходит переломный момент, когда больший упор делается на практические знания: нормализация и масштабирование, метод «один из N», организация сети, принцип работы скрытого слоя и влияние количества нейронов на результат.
Автор курса расскажет о двух этапах жизни ИНС, двух типах ее обучения, проанализирует их с использованием схем и разберет память, без которой искусственные нейронные сети бесполезны.
Самая обширная тема разбита на две части. В первой акцент делается на методе наискорейшего спуска. Сюда включены графики, расчет погрешности и визуализированное представление ошибки.
Во второй части автор коснется метода обратного распространения ошибки, расскажет об обучающей выборке и начальных значениях весов.
Подборка материалов по нейронным сетям
10 примеров машинного обучения на JS
27 шпаргалок по машинному обучению и Python в 2017
Машинное обучение за год
16 бесплатных онлайн-курсов по машинному обучению
Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах от ведущих университетов, например, МФТИ.
Большинство MOOC по машинному обучению доступны на английском языке и представлены на известных платформах онлайн-образования, таких как Coursera, Udacity, World Education University и edX.
Отдельно стоит отметить, что курсы Coursera доступны бесплатно только для прослушивания лекций. Для того, чтобы выполнять задания или получить сертификат по окончании курса, нужно оформить подписку или оплатить курс.
Видео-материалы и лекции курса можно получить бесплатно, для этого на странице курса внизу нужно нажать кнопку «прослушать курс», как показано на картинке:
Как бесплатно прослушать курсы по машинному обучению
В этой статье собраны бесплатные курсы по машинному обучению и Data Science на русском языке или с русскими субтитрами.
Курсы по data science
Введение в машинное обучение
Авторы: ВШЭ и Яндекс
Платформа: Coursera
Язык: русский
На курсе Константина Воронцова Введение в машинное обучение рассматриваются популярные задачи, решаемые с помощью машинного обучения — классификация, регрессия, кластеризация. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах, желательно иметь базовые навыки программирования и быть знакомым с python.
Продолжительность: 35 часов
Машинное обучение и анализ данных
Авторы: МФТИ и Яндекс
Платформа: Coursera
Язык: русский
Специализация Машинное обучение и анализ данных включает 6 курсов. Осваиваются основные инструменты, необходимые в работе с большим массивом данных: современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, фундаментальная математика, основы программирования на python.
Продолжительность: 8 месяцев (7 часов в неделю)
Python для анализа данных
Авторы: МФТИ, ФРОО, Mail.ru Group
Платформа: Coursera
Язык: русский
Курс Python для анализа данных ориентирован на решение практических задач. Студенты будут применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями.
Продолжительность: 25 часов
Введение в науку о данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
Курс Введение в науку о данных рассматривает постановку и решение типичных задач, с которыми может столкнуться в своей работе data scientist, подходы к сбору, анализу, обработке и визуализации массивов данных.
Продолжительность: 17 часов
Глубокое обучение в творчестве с TensorFlow
Автор: Google Magenta
Платформа: Kadenze
Язык: английский, русские субтитры
MOOC Использование глубокого обучения в творчестве с помощью TensorFlow расскажет о том, как строить алгоритмы глубокого обучения на основе сверточных, рекуррентных, генеративных нейросетей и применять их для создания творческих приложений.
Продолжительность: 60 часов
Data Science
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
В специализацию Data Science университета John Hopkins входят 10 курсов, включая сбор и сортировку данных, программирование на языке R, регрессионные модели, разработку продуктов для обработки данных и другие.
Продолжительность: 8 месяцев (5 часов в неделю)
Data science для руководителей
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
Data Science для руководителей — это ускоренная обучающая программа — 5 курсов, которые дают базовое понимание о том, что такое data science и как работать с проектами в этой сфере, собирать и развивать команду и даже лидерские качества.
Продолжительность: 40 часов
Нейронные сети
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
Бесплатный курс Нейронные сети дает основы теории нейронных сетей и практики применения. Детальный разбор процесса создания и применения нейронных сетей. Алгоритмы, лежащие в основе нейросетей и множество практических задач.
Продолжительность: 33 часа
Программирование на Python
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Программирование на Python представлены базовые понятия программирования на python и большое количество практических задач. Решения будут проверяться автоматической системой.
Продолжительность: 22 часа
Алгоритмы: теория и практика. Методы
Автор: Computer Science Center
Платформа: Stepic
Язык: русский
Рассматриваются теоретические основы создания алгоритмов и особенности реализации на языках C++, Java и Python.
Продолжительность: 35 часов
Основы программирования на R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Основы программирования на R изучаются основные типы данных и семантические правила, анализ и обработка данных.
Продолжительность: 19 часов
Анализ данных в R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе рассматриваются этапы статистического анализа на R — предварительная обработка данных, применение статистических методов анализа и визуализация данных.
Продолжительность: 21 час
Базы данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В основе курса Базы данных изучение и применение языка SQL для создания, модификации объектов и управления данными в реляционных базах данных. Рассматриваются сферы применения NoSQL баз данных и современные подходы к обработке big data.
Продолжительность: 20 часов
От Excel до MySQL: способы анализа бизнес-данных
Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры
В специализацию входят 5 курсов, которые демонстрируют, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов.
Продолжительность: 8 месяцев (5 часов в неделю)
Линейная регрессия
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В курсе Линейная регрессия разбираются основные методы описания взаимосвязей между количественными признаками, регрессионный анализ и построение моделей. Специальное место отводится операциям с матрицами. Курс ориентирован на людей, которые уже знакомы с базовыми понятиями анализа данных.
Продолжительность: 22 часа
Анализ данных
Автор: НГУ
Платформа: Coursera
Язык: русский
В специализацию Анализ данных Новосибирского государственного Университета входят 4 курса. Курсы содержат материалы по основам теории вероятностей и математической статистики, исследованию связей между признаками, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. Курсы разработаны совместно с 2GIS.
Продолжительность: 4 месяца (3 часа в неделю)
Samsung открывает бесплатный онлайн-курс по нейросетям в задачах компьютерного зрения
Вы пока не разбираетесь, почему ReLU лучше сигмоиды, чем отличается Rprop от RMSprop, зачем нормализировать сигналы и что такое skip connection? Зачем нейронной сети нужен граф, и какую он совершил ошибку, что она распространяется обратно? У вас есть проект с компьютерным зрением или, может быть, делаете межгалактического робота для борьбы с грязными тарелками, и хотите, чтобы он мог сам решать, отмывать или и так сойдет?
Мы запускаем открытый курс «Нейронные сети и компьютерное зрение», который адресован тем, кто в этой области делает первые шаги. Курс разработан экспертами Samsung Research Russia: Исследовательского центра Samsung и Центра искусственного интеллекта Samsung в Москве. Сильные стороны курса:
- авторы курса знают, о чем говорят: это инженеры московского Центра искусственного интеллекта Samsung, Михаил Романов и Игорь Слинько;
- есть как теория с задачками, так и практика на PyTorch
- приступаем к практике сразу после освоения минимальных теоретических знаний.
- лучшие студенты будут приглашены на собеседование в Samsung Research Russia!
Этот курс открылся 1 июня – первый в серии бесплатных онлайн-курсов от Samsung на платформе Stepik. Предпочтение было отдано именно российской платформе – это позволит предоставить больше возможностей для русскоязычной аудитории. Курсы преимущественно будут посвящены области Machine Learning (ML). Выбор неслучаен: в мае 2018 года в Москве открылся Центр искусственного интеллекта Samsung, где работают такие научные звезды ML, как Виктор Лемпицкий (самый цитируемый ученый России в категории Computer Science), Дмитрий Ветров, Антон Конушин, Сергей Николенко и многие другие.
Итак, за 6 недель видеолекций и практических заданий, занимаясь по 3-5 часов в неделю, вы сумеете разобраться, как решать базовые задачи машинного зрения, а также приобретете необходимую теоретическую подготовку для дальнейшего самостоятельного изучения области.
Предполагается два режима прохождения курса: базовый и продвинутый. В первом случае достаточно смотреть лекции, отвечать на вопросы по лекциям и решать семинары. Во втором случае потребуется решить теоретические задачи, в которых нужно будет применить достаточно обширные знания из математики 1-2 курсов технического университета.
В курсе последовательно излагается терминология и принципы построения нейросетей, рассказывается о современных задачах, методах оптимизации, функциях потерь и об основных архитектурах нейронных сетей. И в завершение обучения — решение наглядной прикладной задачи по компьютерному зрению.
Преподаватели курса
Михаил Романов
Выпускник МФТИ. Закончил Школу анализа данных Яндекса. Получил степень PhD в Technical University of Denmark.
Сотрудник московского Центра ИИ Samsung. Михаил занимается задачами машинного зрения для роботов и любит преподавать. У него есть много идей и тем для дальнейших курсов. Один из выпускников AI Bootcamp 2018, проходившего на базе Центра искусственного интеллекта Samsung, в выходной анкете на вопрос оценить Михаила в 5-балльной шкале как преподавателя, написал: «жаль, что нет оценки шесть!».
Игорь Слинько
Выпускник МФТИ. Закончил Школу анализа данных Яндекса. Сотрудник московского Центра ИИ Samsung. Игорь также занимается задачами машинного зрения для роботов, преподает Machine Learning в Высшей школе экономики. В прошлом и в этом году он лектор-волонтер мастерской «Deep Learning» социально-образовательного проекта Летняя школа, организованной при партнерстве Samsung Research Russia.
Программа курса
Нейронная сеть:
- Математическая модель нейрона
- Булевы операции в виде нейронов
- От нейрона к нейронной сети
- Семинар: Базовая работа в PyTorch
Строим первую нейронную сеть:
- Восстановление зависимости нейронной сетью
- Компоненты нейронной сети
- Теоретические задачи: Восстановление зависимостей
- Алгоритм настройки нейронной сети
- Теоретические задачи: Графы вычислений и BackProp
Задачи, решаемые при помощи нейронных сетей:
- Бинарная классификация? Бинарная кросс-энтропия!
- Многоклассовая классификация? Софтмакс!
- Локализация, детекция, super-resolution
- Теоретические задачи: Функции потерь
- Семинар: Строим первую нейронную сеть
- Семинар: Классификация в PyTorch
Методы оптимизации:
- Самый обычный градиентный спуск
- Модификации градиентного спуска
- Теоретические задачи: Понимаем SGD с momentum
- Семинар: Реализация градиентного спуска средствами PyTorch
- Семинар: Классификация рукописных чисел полносвязной сетью
Свёрточные неройнные сети:
- Свёртка, каскад свёрток
- История архитектур: LeNet (1998)
- История архитектур: AlexNet (2012) и VGG (2014)
- История архитектур: GoogLeNet и ResNet (2015)
- Семинар: Распознавание рукописных чисел свёрточной нейросетью
Регуляризация, нормализация, метод максимального правдоподобия:
- Регуляризация и нейронные сети
- Нормализация данных
- Семинар: Решаем задачу классификации на датасете CIFAR
- Метод максимального правдоподобия
- Семинар: Transfer learning на примере соревнования на Kaggle
Требования к студентам
Курс рассчитан на слушателей, которые делают первые шаги в области машинного обучения. Что нужно от вас?
- Иметь базовые знания в области математической статистики.
- Быть готовым программировать на Python.
- Если вы хотите пройти курс на сложном уровне, то понадобится неплохое знание математического анализа, линейной алгебры, теории вероятностей и статистики.
Вызов принят? Тогда приступайте к курсу!
Базовый курс
Развитие рынка нейронных сетей подразумевает под собой удешевление стоимости железа при постоянном росте производительности. Обычно нейронная сеть проходит три жизненных этапа: обучение, деплой и инференс. Если про обучение и деплой…
Супер-разрешение — это результат восстановления изображения с высоким разрешением (HR) из данного изображения с низким разрешением (LR). В этой статье приведены основные подходы для решения задачи генерации супер-разрешения изображения с…
Титаник — известная задача на Kaggle, ориентированная в большей мере на начинающих в машинном обучении. Датасет Титаник содержит данные пассажиров корабля. Цель задачи — построить модель, которая лучшим образом сможет…
Генетический алгоритм — это класс эволюционных алгоритмов поиска. Идея генетических алгоритмов основана на эволюционной теории Чарльза Дарвина. Этот алгоритм симулирует процесс естественного отбора, когда более сильные особи из популяции переживают…
Библиотека Scikit-learn — самый распространенный выбор для решения задач классического машинного обучения. Она предоставляет широкий выбор алгоритмов обучения с учителем и без учителя. Обучение с учителем предполагает наличие размеченного датасета,…
Рекомендательные системы, основанные на машинном обучении, получили широкое распространение для бизнеса в последние годы. В этой статье приведено описание принципов работы основных методов для реализации рекомендательных систем и метрик для…
«Единство это сила». Эта старая поговорка довольно хорошо выражает основную идею, за которой стоят очень мощные «ансамблевые методы» в машинном обучении. Ансамблевые методы часто занимают топ рейтингов во многих соревнованиях…
Есть много способов построения графиков на Python, но какой из них лучше? Когда вы делаете визуализацию, важно задать несколько вопросов о цели построения графика: пытаетесь ли вы создать первичное представление…
Cемантическая сегментация изображения означает присвоение каждому пикселю определенной метки. В этом заключается главное отличие от классификации, где всему изображению ставится в соответствие только одна метка. Сегментация работает со множеством объектов…
Практический Machine Learning — это онлайн курс от школы digital-профессий SkillFactory. Он предназначен для аналитиков, разработчиков, product-менеджеров и начинающих специалистов по data science. Курс подходит для обучения с нуля —…
Аналитик Big Data изучает большие массивы данных, которые собирает и хранит компания, чтобы разрабатывать и внедрять продукты, которые повысят эффективность решения задач, увеличат доход или улучшат обслуживание клиентов. Курсы Big…
Предложение вакансии Data scientist на рынке труда постоянно растет, количество соискателей тоже. Возможностей для входа в эту профессию много — курсы по специальности помогут получить необходимые знания. Блог Acing AI…
Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах…
Javascript-библиотеки используют для определения, обучения и запуска моделей глубокого обучения, визуализации данных полностью в браузере. Они значительно облегчают жизнь разработчику. Ниже представлены изящные библиотеки, которые объединяют Javascript, машинное обучение, глубокие…
Вам должны быть знакомы моменты, когда вы смотрите на код и удивляетесь: “Почему я использую в коде эти три параметра, в чем отличие между ними?”. И это неспроста, так как…
Глубокое обучение требует больших вычислительных ресурсов, поэтому очень важно, какой графический процессор (видеокарту) вы выберете для своих исследований. Надежный GPU позволит быстро вычислять оптимальные архитектуры и настройки глубоких сетей, и…
Сверточные сети сделали потрясающую работу, но завязли в проблемах. Настало время начать думать о новых решениях или улучшениях. Эта статья — введение в капсульные нейронные сети. После прочтения вы поймете, как…
Что делает искусственный нейрон? Простыми словами, он считает взвешенную сумму на своих входах, добавляет смещение (bias) и решает, следует это значение исключать или использовать дальше (да, функция активации так и…
Хотя большинство победителей соревнований на Kaggle используют композицию разных моделей, одна из них заслуживает особого внимания, так как является почти обязательной частью. Речь, конечно, про Градиентный бустинг (GBM) и его…
Обратное распространение ошибки — это способ обучения нейронной сети. Цели обратного распространения просты: отрегулировать каждый вес пропорционально тому, насколько он способствует общей ошибке. Если мы будем итеративно уменьшать ошибку каждого веса, в…
Дерево решений — логическая схема, позволяющие получить окончательное решение о классификации объекта после ответов на иерархически организованную систему вопросов. Стоит сказать, большинство высоко результативных решений на Kaggle — комбинация XGboost-ов,…
Новый бесплатный онлайн-курс от Samsung по анализу текста при помощи нейросетей
Мы привычно пользуемся интернет-поиском, общаемся с чат-ботами, читаем документы на любых языках благодаря переводчикам. Приказать роботу-пылесосу начать уборку при помощи голоса? Ничего особенного… Для многих голосовые помощники на смартфоне вошли в повседневность. Будущее, в котором компьютер, прочитав постороннюю заметку о футболе, соответствующим образом меняет тональность новости о погоде, уже наступило.
Как это всё работает? Как стать специалистом в NLP (расшифровывается Natural Language Processing, не путайте с нейролингвистическим программированием:) )?
Тех хабровчан, кто задается такими вопросами, мы приглашаем на открывшийся недавно онлайн- курс Samsung Research Russia. Под катом подробности…
Авторы курса “Нейронные сети и обработка текста”
В июне этого года мы писали о запуске нашего первого онлайн курса «Нейронные сети и компьютерное зрение». Он получился успешным: там уже более 20 тысяч слушателей, отличные отзывы и мы за него в сентябре даже получили премию Stepik Awards в номинации «Лучший курс от новых авторов»!
С момента запуска первого курса прошло 5 месяцев, и мы не сидели сложа руки! Вооружившись полученным опытом и вдохновившись успехом коллег, другой коллектив авторов – разработчики Центра искусственного интеллекта Samsung в Москве, эксперты в машинном обучении Роман Суворов, Анастасия Янина и Алексей Сильвестров, при неизменной редакторской поддержке Николая Капырина осилили гигантский объём работы, и 15 октября на канале «Samsung Research Russia Open Education» платформы Stepik стартовал второй курс – «Нейронные сети и обработка текста».
Курс рассчитан на 7 недель. Если тратить в среднем 3-5 часов еженедельно на просмотр видеолекций, ответы на вопросы и выполнение практических заданий, то вы разберётесь, что же под капотом у современных поисковых систем, чат-ботов и генераторов текста. Команда приложила много усилий к тому, чтобы, пройдя один только курс, слушатели смогли уверенно ориентироваться в технологиях на уровне джуниор-разработчика или любого технического специалиста, у которого за плечами нет специфического опыта в работе с NLP, а сейчас приходится иметь с ним дело.
Итак, в чем отличительные преимущества нашего курса?
- он разработан специалистами Центра искусственного интеллекта Samsung, у которых за спиной багаж коммерческих проектов в этой области
- есть теория и практика – вы увидите, как создавать нейросети для обработки текста на PyTorch, реализуете самые актуальные архитектуры и научитесь адаптировать их для ваших нужд
- как и на первом курсе по компьютерному зрению, лучшие выпускники приглашаются на собеседование в Samsung Research Russia!
На инфографике ниже мы кратко отразили содержание и текущие количественные характеристики нового курса:
Выпускники курса получают сертификаты. При этом возможны два варианта:
- обычный сертификат, баллы на который можно набрать, решив все задачи к основной части курса;
- сертификат с отличием: для него потребуется решить все задачи на высший балл, пройти теоретические треки курса (там задачи аналогичны тем, которые ставят перед сотрудниками на собеседованиях) и решить финальную задачу на Kaggle.
Преподаватели и разработчики курса
Программа курса
1. Введение
В этом модуле мы, в первом приближении, узнаем, что сегодня представляет из себя обработка текстов средствами машинного обучения, какие есть сложности и какие задачи лингвистики сегодня можно решить только методами машинного обучения.
- Всем привет! Расскажите нам о себе!
- В общих чертах: естественный язык и текст
- Особенности обработки естественных языков
- В общих чертах: Лингвистический анализ
- В общих чертах: Извлечение признаков
- Прикладные задачи обработки текста и итоги
2. Векторная модель текста и классификация длинных текстов
Начинается математика. Разреженные векторные модели, токены, взаимная информация… что это всё такое? Мы пройдём методы перевода многомерной и многогранной структуры, которая заключена в тексте – в числа, чтобы ML-алгоритмы смогли начать свою работу.
- Векторная модель текста и TF-IDF
- Создаём нейросеть для работы с текстом
- Теоретические задачи: Векторная модель текста
- Семинар: классификация новостных текстов
3. Базовые нейросетевые методы работы с текстами
Пользуемся ли мы полносвязанными нейросетями? Что такое операция «свёртка над текстами»? Вроде бы, это операция для матриц? Ответы — в этом модуле, где мы изучим первые успешные попытки научить нейронные сети работать со смыслом текста.
- Общий алгоритм работы с текстами с помощью нейросетей
- Дистрибутивная семантика и векторные представления слов
- Семинар: рецепты еды и Word2Vec на PyTorch
- Теоретические вопросы: Основы обработки текста нейросетями
- Основные виды нейросетевых моделей для обработки текстов
- Свёрточные нейросети для обработки текстов
- Семинар: POS-тэггинг свёрточными нейросетями
- Теоретические вопросы: Свёрточные нейросети в обработке текста
4. Языковые модели и генерация текста
Погрузимся глубже в нейронные сети. Текст может быть любой длины, но только рекуррентные нейронные сети позволяют без особых ухищрений дать алгоритму возможность генерировать текст. Мы попытались научить сеть читать, теперь дадим ей возможность сочинять.
- Рекуррентные нейросети
- Моделирование языка
- Семинар: генерация имён и лозунгов с помощью RNN
- Агрегация, механизм внимания
- Трансформер и self-attention
- Семинар: моделирование языка с помощью Transformer
- Теоретические вопросы: Модель языка и трансформеры
5. Преобразование последовательностей: 1-к-1 и N-к-M
А что, если на входе – текст, и на выходе нужен текст? Это работа для переводчика, которому, как мы знаем, контекст важнее всего. Если вы должны перевести один массив текста в другой, или в несколько, то этот модуль даст вам всё необходимое!
- Распознавание плоской структуры коротких текстов
- Семинар: распознавание структуры рецептов
- Семинар: аспектный сентимент-анализ как NER
- Преобразование последовательностей (seq2seq)
- Семинар: генерация кусков кода со Stack Overflow
- Теоретические вопросы
6. Transfer learning, адаптация моделей
У вас есть отличный проект, но нет супергеройских вычислительных ресурсов? Тогда возьмите готовую нейросеть и до-обучите её решать именно вашу задачу! Нужно знать несколько названий и несколько приёмов обучения, и дело в шляпе.
- Контекстуализированные представления и перенос знаний
- Семинар: pytorch-transformers или как запустить BERT
- Семинар: BERT для вопросно-ответного поиска
- Теоретические вопросы
7. Финальное соревнование на Kaggle и заключение
Приближая курсор к кнопке «Запустить обучение» вы уже видите, как разворачиваются многомерные цепочки псевдосимволов и внимание машины перетекает между концепциями? Тогда покажите себя в нашем финальном соревновании!
- Что ещё почитать, как развиваться
- Соревнование на Kaggle: обзор задачи и базового решения
Требования к студентам
Курс рассчитан на слушателей, которые немного разбираются в области машинного обучения.
Что нужно, чтобы приступить к курсу?
- Иметь базовые знания о работе нейронных сетей
- Иметь базовые знания в области математической статистики
- Быть готовым программировать на Python
Можно сказать, что курс «Нейронные сети и обработка текста» является продолжением первого курса по компьютерному зрению, потому что опирается на базовый уровень знаний по нейросетям, уже данный нами ранее.
Возможно, вы уже что-нибудь знаете про NLP – что это не только про редактирование текста; что создание чат-ботов, пересказ текста, классификация эмоций, ответы на вопросы по Википедии – это несложные задачи, которые уже не требуют исследований. Эти задачи станут вам доступны после того, как вы пройдёте этот курс. Но, важнее всего, мы научим вас задавать правильные вопросы в мире современного NLP, а найдёте ли ответы вы сами или внешняя нейросеть — есть ли разница. Что дальше? Решать вам.
Вы с нами?
Тогда добро пожаловать в онлайн-курс!
Курс о Deep Learning на пальцах / Хабр
Я все еще не до конца понял, как так получилось, но в прошлом году я слово за слово подписался прочитать курс по Deep Learning и вот, на удивление, прочитал. Обещал — выкладываю!
Курс не претендует на полноту, скорее это способ поиграться руками с основными областями, где deep learning устоялся как практический инструмент, и получить достаточную базу, чтобы свободно читать и понимать современные статьи.
Материалы курса были опробованы на студентах кафедры АФТИ Новосибирского Государственного Университета, поэтому есть шанс, что по ним действительно можно чему-то научиться.
Курс требует:
— Знания математики на уровне первого-второго курса университета: надо знать немного теории вероятностей, линейную алгебру, основы матанализа и анализ функций многих переменных. Если все это прошло мимо вас, вот все нужные курсы от MIT и Harvard. В них типично достаточно пройти первые две секции.
— Умения программировать на питоне.
В хорошем курсе должны быть доступны и лекции, и упражнения, и место, где можно задать по ним вопросы и обсудить. Здесь они собраны с миру по нитке:
— Лекции существуют как записи на Youtube.
— В качестве упражнений можно использовать задания великолепных Стенфордских курсов по DeepLearning (CS231n и CS224n), я ниже напишу какие конкретно.
— Обсуждать и спрашивать можно на ClosedCircles и ODS.ai.
Лекция 1: Введение
Лекция 2: Линейный классификатор
Лекция 2.1: Softmax
Упражнение: секции «k-Nearest Neighbor» и «Softmax classifier» отсюда
По специфике задания могут помочь вот эти lecture notes.
Лекция 3: Нейронные сети. Backpropagation
Лекция 4: Нейронные сети в деталях
Упражнение: секции «Two-Layer Neural Network» отсюда и «Fully-connected Neural Network» отсюда
Лекция 5: Сверточные нейронные сети (CNN)
Лекция 6: Библиотеки для глубокого обучения
Упражнение: секции «Convolutional Networks» и «PyTorch on CIFAR-10» отсюда
Лекция 7: Другие задачи компьютерного зрения
Лекция 8: Введение в NLP. word2vec
Упражнение: секция «word2vec» отсюда
Лекция 9: Рекуррентные нейронные сети (RNN)
Лекция 10: Машинный перевод, Seq2Seq, Attention
Здесь хорошего готового задания я не нашел, но можно реализовать на PyTorch Char-RNN из знаменитого поста Andrej Karpathy и натравить на Шекспира.
Лекция 11: Введение в обучение с подкреплением(RL), базовые алгоритмы
Лекция 12: Примеры использования RL. Alpha(Go)Zero.
Лекция 13: Нейросети в 2018.
Все вопросы по курсу можно задавать мне лично или обсуждать в кружочке #data на ClosedCircles.com (вот инвайт).
Кроме этого, задания можно обсуждать в канале #class_cs231n на ODS.ai, там помогут. Для этого придется получить туда инвайт самому, отправляйте заявки.
Ну и вообще, звоните-пишите, всегда рад.
Прежде всего, огромное спасибо buriy, с которым мы готовили курс. Спасибо родной кафедре, которая дала вообще такую возможность.
Всем в тусовках на ODS.ai и ClosedCircles, кто помогал в подготовке, отвечал на вопросы, присылал фидбек, напоминал что надо все выложить, итд итп.
Наконец, всем кто следил за стримами на канале, задавал вопросы в реалтайме и вообще создавал ощущение, что я не со стеной разговариваю.
От души.
10 курсов по машинному обучению на лето / Блог компании Университет ИТМО / Хабр
За последние десятилетия с помощью машинного обучения создали самоуправляемые автомобили, системы распознавание речи и эффективный поиск. Сейчас это одна из самых быстроразвивающихся и перспективных сфер на стыке компьютерных наук и статистики, которая активно используется в искусственном интеллекте и data science. Методы машинного обучения используются в науке, технике, медицине, ритейле, рекламе, генерации мультимедиа и других областях.
Команда Университета ИТМО собрала десять курсов по машинному обучению, которые можно успеть пройти до конца лета. Одним они помогут войти в профессию, а другим — углубиться в нее.
1. «Введение в машинное обучение»
Площадка: Coursera
Автор: Высшая школа экономики, Школа анализа данных Яндекс
Длительность: 7 недель, 3-5 часов в неделю
Стоимость: бесплатно
Язык: русский
На курсе рассказывает преимущественно про основные типы задач машинного обучения: классификацию, регрессию и кластеризацию. Преподаватели из Яндекса и Высшей школы экономики объясняют основные методы и рассказывают про их особенности, учат оценивать качество моделей и понимать, для решения какой задачи подходит каждая из них. Программа рассчитана на семь недель, но если постараться, то можно закончить курс до 1 сентября. Курс ориентирован на слушателей, которые знакомы с Python, так как используются его библиотеки numpy, pandas и scikit-learn.
2. Введение в машинное обучение от GL4G
Площадка: Great Learning
Автор: Great Learning
Длительность: 1,5 часа
Стоимость: бесплатно
Язык: английский
Короткий курс предназначен для тех, кто интересуется машинным обучением, но пока еще не знает, с чего начать. Программа состоит из 12 видеоуроков и объясняет, что такое машинное обучение и как алгоритм может учиться, рассказывает основную терминологию и методы, а также дает практические упражнения.
3. Машинное обучения от А до Я: применение Python и R в науке о данных
Площадка: Udemy
Автор: Кирилл Еременко,, Хаделин де Понтевес, команда SuperDataScience
Длительность: 41 час видеолекций
Стоимость: $10,99
Язык: английский
Курс разработан двумя дата-сайентистами, чтобы объяснить сложную теорию, алгоритмы и программирование с использованием библиотек машинного обучения. Программа состоит из десяти частей, в которых рассматривается обработка данных, регрессия, классификация, кластеризация, обучение с подкреплением, обработка естественного языка и глубокое обучение. На курсе есть практические упражнения и шаблоны кода для Python и R. Большое внимание уделяется выбору правильной модели для каждого типа задач.
4. Bootcamp-тренировка: Python для науки о данных и машинного обучения
Площадка: Udemy
Автор: Хосе Портилья
Длительность: 21,5 часов видеолекций
Стоимость: $10,99
Язык: английский
Программа курса помогает понять, как использовать Python для анализа данных, создания визуализации и использования алгоритмов машинного обучения. На курсе используются NumPy, Seaborn, Matplotlib, Pandas, Scikit-Learn, Machine Learning, Plotly, Tensorflow и другие инструменты. Также слушателям расскажут про обработку естественного языка, искусственный интеллект и глубокое обучение.
5. Наука о данных, глубокое обучение и машинное обучение с помощью Python
Площадка: Udemy
Автор: Фрэнк Кейн
Длительность: 12 часов видеолекций
Стоимость: $10,99
Язык: английский
На курсе рассказывается об использовании искусственного интеллекта и машинного обучения для решения бизнес-задач. Преподаватель Фрэнк Кейн девять лет работал в Amazon и IMDb, создавая рекомендательные системы. Каждая концепция описывается на простом языке без сложных математических терминов. После вводной части демонстрируется использование кода на Python. Основное внимание уделяется практическому пониманию и применению алгоритмов машинного обучения. В конце курса слушателям предлагают работу над итоговым проектом, чтобы применить новые знания.
6. Курс машинного обучения от Google
Площадка: Google
Автор: Google
Длительность: 15 часов видеолекций
Стоимость: бесплатно
Язык: английский
Компания предлагает быстрое и практическое введение в машинное обучение с использованием API TensorFlow. Курс включает серию уроков с видеолекциями, реальными задачами и практическими упражнениями. Всего слушателям необходимо прослушать 25 уроков и выполнить 40 упражнений. Для всех алгоритмов предлагается интерактивная визуализация.
7. Структурирование проектов по машинному обучению
Площадка: Coursera
Автор: deeplearning.ai
Длительность: две недели
Стоимость: подписка на Coursera 3 039 ₽ в месяц
Язык: английский
Преподаватели курса из Стэнфордского университета расскажут, как построить работу команды по машинному обучения. За две недели слушатели научатся находить ошибки в системе машинного обучение, расставлять приоритеты в направлении работы и понимать сложные детали машинного обучения, например, невалидные обучающие наборы данных.
8. Использование глубокого обучения в творчестве с помощью TensorFlow
Площадка: Kadenze
Автор: Google Magenta
Длительность: пять сессий по 12 часов
Стоимость: бесплатно
Язык: английский, русские субтитры
Курс создан при поддержке проекта Magenta от Google, в рамках которого компания пытается создать «творческий компьютер». Преподаватели рассказывают про основные компоненты глубокого обучения, которые необходимы для построения алгоритмов: сверточные сети, вариационные автокодеры, генеративные состязательные сети и рекурсивные нейросети. Внимание уделяется творчеству нейросетей. Например, работе с изображением и созданию контента, который будет соответствовать эстетике или содержимому другого изображения.
9. Статистическое машинное обучение
Площадка: YouTube
Автор: Университет Карнеги — Меллона
Длительность: 24 лекции по 1,5 часа
Стоимость: бесплатно
Язык: английский, русские субтитры
На YouTube есть запись цикла лекций профессора Департамента статистики и факультета машинного обучения Университета Карнеги-Меллона Ларри Вассермана. Курс рассчитан на людей с продвинутыми знаниями математики и программирования, так как ориентирован на интеграцию статистики и машинного обучения. Предпосылкой к курсу служат лекции «Промежуточная статистическая теория» и «Введение в машинное обучение».
10. «Принципы машинного обучения»
Площадка: EdX
Автор: Microsoft
Длительность: 6 недель, 2–4 часа в неделю
Стоимость: бесплатно, сертификат $99
Язык: английский
Курс входит в сертификацию Microsoft в области науки о данных. На нем рассказывают, как создавать и работать с моделями машинного обучения с использованием Python, R и Azure Machine Learning. Преподаватели рассказывают о классификации, регрессии в машинном обучении, контролируемых моделях, системах нелинейного моделирования, кластеризации и разработке рекомендаций.
Для тех, кому ближе оффлайн-встречи, Университет ИТМО со 2 по 15 августа проводит в Санкт-Петербурге Летнюю школу машинного обучения на базе Центра речевых технологий. Слушатели получат практический опыт применения методов и алгоритмов глубокого обучения для анализа аудиовизуальных данных для распознавания эмоций.
Требования к участникам:
— студенты старших курсов;
— владение Python;
— имеют опыт применения современных методов машинного обучения;
— огромное желание развиваться в области аудио- и видеоаналитики.
Прием заявок продлится до 23 июля. Зарегистрироваться можно на сайте. Участие в Школе бесплатное. Также организаторы оплачивают проживание в общежитии Университета ИТМО. А за лучшее решение тестового задания — и транспортные расходы.
Бесплатный онлайн-курс: нейронные сети и глубокое обучение от Coursera
Лучшие онлайн-курсы за все время (издание 2020 г.)
Посмотреть
Закрыть
Класс Центральный
Предметы
Субъектов
Компьютерная наука
Здоровье и медицина
Математика
Бизнес
Гуманитарные науки
Инженерное дело
Наука
Образование и обучение
Социальные науки
Художественный дизайн
Data Science
Программирование
Личное развитие
Все предметы
Просмотреть все предметы
Ежемесячные отчеты о курсе
Начиная с этого месяца
Новые онлайн-курсы
Самостоятельный темп
Самый популярный
Курсы от
900+ университетов
Меню
Компьютерная наука
Компьютерная наука
Искуственный интеллект
Алгоритмы и структуры данных
Интернет вещей
Информационные технологии
Кибер-безопасности
Компьютерная сеть
Машинное обучение
DevOps
Глубокое обучение
Блокчейн и криптовалюта
Квантовые вычисления
Посмотреть все компьютерные науки
Здоровье и медицина
Здоровье и медицина
Питание и благополучие
Болезни и расстройства
Здравоохранение
Здравоохранение
Уход
Анатомия
Ветеринарная наука
Посмотреть все Здоровье и медицина
Математика
Математика
Статистика и вероятность
Основы математики
Исчисление
Алгебра и геометрия
Посмотреть всю математику
Бизнес
Бизнес
Менеджмент и лидерство
Финансы
Предпринимательство
Развитие бизнеса
Маркетинг
Стратегический менеджмент
Специфическая отрасль
Бизнес-аналитика
Бухгалтерский учет
Отдел кадров
Управление проектом
Продажи
Дизайн-мышление
Реклама
Программное обеспечение для бизнеса
Посмотреть все Бизнес
Гуманитарные науки
Гуманитарные науки
История
Литература
Иностранный язык
Грамматика и письмо
Философия
Религия
ESL
Культура
Виды спорта
Журналистика
Этика
Лингвистика
Просмотреть все гуманитарные науки
Инженерное дело
Инженерное дело
Электротехника
.
сверточных нейронных сетей для визуального распознавания
Стэнфордский университет CS231n: сверточные нейронные сети для визуального распознавания
* Эта сеть работает прямо в вашем браузере
Сверточная нейронная сеть в этом примере классифицирует изображения в реальном времени в вашем браузере с использованием Javascript, примерно по 10 миллисекунд на изображение. Он берет входное изображение и преобразует его с помощью ряда функций в вероятности классов в конце. Преобразованные представления в этой визуализации можно ошибочно рассматривать как активацию нейронов на этом пути.Параметры этой функции изучаются с помощью обратного распространения в наборе данных пар (изображение, метка). Эта конкретная сеть классифицирует изображения CIFAR-10 в один из 10 классов и была обучена с помощью ConvNetJS. Его точная архитектура — [conv-relu-conv-relu-pool] x3-fc-softmax, всего 17 уровней и 7000 параметров. Он использует свертки 3×3 и области объединения 2×2. К концу занятия вы будете точно знать, что означают все эти числа.
Описание курса
Компьютерное зрение стало повсеместным в нашем обществе с приложениями для поиска, распознавания изображений, приложений, картографии, медицины, дронов и беспилотных автомобилей.Ядром многих из этих приложений являются задачи визуального распознавания, такие как классификация изображений, локализация и обнаружение. Последние разработки в области нейросетевых подходов (также известных как «глубокое обучение») значительно повысили производительность этих современных систем визуального распознавания. Этот курс представляет собой глубокое погружение в детали архитектур глубокого обучения с упором на изучение сквозных моделей для этих задач, в частности классификации изображений. В течение 10-недельного курса студенты научатся реализовывать, обучать и отлаживать свои собственные нейронные сети и получат подробное представление о передовых исследованиях в области компьютерного зрения.Последнее задание будет включать обучение сверточной нейронной сети с многомиллионными параметрами и применение ее к самому большому набору данных классификации изображений (ImageNet). Мы сосредоточимся на обучении постановке задачи распознавания изображений, алгоритмам обучения (например, обратному распространению), практическим инженерным приемам для обучения и точной настройки сетей, а также будем направлять студентов через практические задания и окончательный проект курса. Большая часть предыстории и материалов этого курса будет взята из ImageNet Challenge.
Инструкторы
Координатор курса
Помощники учителя
Кристина Юань
Время и местонахождение класса
Весенний квартал (апрель — июнь 2020 г.).
Лекция: вторник, четверг с 12 до 13.20
Часы работы
Вы можете найти полный список времени и мест в календаре.
Политика выставления оценок
Оценка изменена на S / NC
Подробно подлежит уточнению
Задание № 1: 15%
Задание № 2: 15%
Задание № 3: 15%
Среднесрочный период: 20%
Курсовой проект: 35%
Обсуждения курса
Студенты Стэнфорда: Piazza
Наш аккаунт в Twitter: @ cs231n
Сведения о назначении
См. Страницу заданий для получения более подробной информации о том, как сдавать задания.
Описание курсового проекта
См. Страницу проекта для получения более подробной информации о курсовом проекте.
Предварительные требования
- Знание Python
Все назначения классов будут на Python (и с использованием numpy) (здесь мы предлагаем руководство для тех, кто не так хорошо знаком с Python). Если у вас большой опыт программирования, но на другом языке (например, C / C ++ / Matlab / Javascript), вероятно, все будет в порядке. - Исчисление колледжа, линейная алгебра (e.г. MATH 19 или 41, MATH 51)
Вам должно быть комфортно брать производные и понимать операции и обозначения векторных матриц. - Базовая вероятность и статистика (например, CS 109 или другой курс по статистике)
Вы должны знать основы вероятностей, гауссовского распределения, среднего значения, стандартного отклонения и т. Д. - Эквивалентное знание CS229 (Машинное обучение)
Мы будем формулировать функции затрат, брать производные и выполнять оптимизацию с градиентным спуском.
FAQ
Какая политика выставления оценок на весну 2020 года?
Согласно официальному законодательству сената факультета, весной 2020 года выставление оценок будет удовлетворительным / без зачетных единиц (S / NC). Мы все еще принимаем решение о деталях аттестации и скоро их обновим.
Количество мест в учебе:
Если вам требуется академическое жилье по причине инвалидности, вам следует подать запрос в Управление доступного образования (OAE). OAE рассмотрит запрос, порекомендует условия проживания и подготовит письмо для преподавателей.Студенты должны связаться с OAE как можно скорее и, в любом случае, до крайних сроков назначения, поскольку для согласования условий проживания необходимо своевременное уведомление. Обязанностью студента является связаться с преподавательским составом по поводу письма OAE. Присылайте свои письма по адресу [email protected]
Могу ли я пройти этот курс в кредит / без кредита?
Да. Кредит будет отдан тем, кто иначе заработал бы C- или выше.
Могу ли я провести аудит или посидеть?
В целом мы очень открыты для аудита, если вы являетесь членом Стэнфордского сообщества (зарегистрированный студент, штат и / или преподавательский состав).Из вежливости мы будем признательны, если вы сначала напишите нам по электронной почте или поговорите с инструктором после первого занятия, которое вы посещаете.
Могу ли я работать в группах для финального проекта?
Да, в группах до трех человек.
У меня вопрос по классу. Как лучше всего связаться с сотрудниками курса?
Практически все вопросы нужно задавать на Piazza. Если у вас есть деликатный вопрос, вы можете написать инструкторам напрямую.
Могу ли я совместить Заключительный проект с другим курсом?
Да, можете; однако перед этим вы должны получить разрешение от инструкторов обоих курсов.
.