Natural Language Processing (NLP) | OTUS
Рассрочка
Рассрочка

Natural Language Processing (NLP)

Курс для DS/ML-специалистов, которые, либо уже какое-то время находятся в профессии, либо недавно закончили ML/DS/DL курсы и хотят углубить знания в области NLP.

Длительность обучения:

4 месяца

4 ак. часа в нед.

Формат:

Online

Начало занятий:

27 September

Что даст вам этот курс
Что такое Natural Language Processing?

Natural Language Processing (NLP, обработка естественного языка) – это направление, которое объединяет в себе лингвистику, компьютерные науки и искусственный интеллект. NLP применяет алгоритмы машинного обучения для анализа естественных языков.

Что даст вам этот курс?

Знаний, которые дают ML/DL курсы, часто оказывается недостаточно, чтобы стать специалистом в области NLP. Data Scientist'ам, которые решили заняться методами, связанными с автоматической обработкой текстов, необходимы дополнительные знания из этой области.
Данный курс представляет собой уникальное сочетание глубоких знаний из области NLP и "повседневных" практических навыков. С одной стороны, программа курса по наполненности и изучаемым темам ничуть не уступает аналогичным вузовскими курсам. С другой стороны, в курсе, помимо теоретичечских знаний, особое внимание уделяется практическим навыкам, таким как работа с текстами на основе регулярных выражений, парсинг данных, создание телеграм-ботов. Эти темы практически не освещаются в большинстве NLP-курсов, так как считаются рутинными и техническами. При этом  эти навыки необходимы всем специалистам в области NLP.
Также на курсе изучаются современные подходы и модели, которые на данный момент являются стандартом в области, но еще не успели войти в большинство программ, так как были предложены совсем недавно. Стоит отметить, что на курсе делается акцент на особенностях работы с русскоязычными моделями и данными на русском языке.

Для кого этот курс?

Курс предназначен для DS/ML-специалистов, которые, либо уже какое-то время находятся в профессии, либо недавно закончили ML/DS/DL курсы и хотят углубить знания в области NLP.

После завершения курса вы сможете:

  • работать с текстовыми данными;
  • парсить, собирать данные с сайтов из интернета;
  • создавать телеграм-ботов;
  • применять методы классического NLP для решения ML задач, связанных с текстами;
  • работать с нейросетевыми моделями архитектуры трансформер;
  • применять модели архитектуры трансформер для широкого спектра NLP задач;
  • решать задачу распознавания именованных сущностей;
  • создавать вопросно-ответные системы.

Карта курсов направления Data Science в OTUS

Особенности курса

Курс Python в подарок! Бесплатно получите доступ к подготовительному курсу по Python, который познакомит с основными возможности языка.

Best Practices и тренды. Каждый запуск программа обновляется с учетом быстро меняющихся тенденций в Data Science. На курсе изучаются современные подходы и модели, которые на данный момент являются стандартом в области, но еще не успели войти в большинство программ, так как были предложены совсем недавно.

Команда экспертных преподавателей. Возможность обсудить материалы лекций и домашние задания с экспертами в области Data Science.

Преподаватели

Мария Тихонова
Senior Data Scientist SberDevices, преподаватель ВШЭ
Александр Брут-Бруляко
Антон Витвицкий
Boost Arria NLG, Director of Computer Vision
Никита Мартынов
NLP Engineer в MTS AI
Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital / Руководитель курса DevRel
Александр Сизов
Учёный и эксперт по Machine/Deep learning
Работает специалистом по анализу данных в команде AGI NLP в SberDevices. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.

Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.

Мария закончила механико-математический факультет МГУ и школу анализа данных Яндекса. В настоящий момент Мария обучается в аспирантуре ВШЭ на факультете компьютерных наук. Среди ее научных интересов такие области data science, как natural language processing и тематическое моделирование.

Ds инженер в СБЕР Neurolab

Занимаюсь построением DS систем. Анализирую данные, выстраиваю ИТ сервисы вокруг этого.

Закончил мехмат МГУ в 2004 г.
До 2012 г. преподавал в университете, защитил диссертацию по матметодам в экономике.
С 2010 по 2016 г. занимался веб разработкой на Python и PHP, программировал интернет-магазины, писал парсеры.
В DS и аналитике с 2016 г. Работал аналитиком данных в банке.
Писал внутренний аналитический софт на крупном ювелирном заводе, работал DS инженером в региональной ритейл сети. Делал ML модели персонализации для AVITO Работа.

Сейчас работаю DS инженером в СБЕР Neurolab. Это исследовательское подразделение с фокусом на персонализацию коммуникаций, поэтому спектр задач широк - и классические задачи ML, и NLP, и CV, и написание парсеров, и написание поддерживающей ИТ инфраструктуры.

Основной стек: Python, Pandas, PyTorch, Keras, SQL, ClickHouse, PySpark.

Эксперт по компьютерному зрению и глубокому обучению, дипломированный инженер-программист и кандидат физ-мат наук.

С 2012 по 2017 занимался распознаванием лиц в компании WalletOne, чьи решения поставлялись для бизнеса в странах Южной Африки и Европы. Участвовал в стартапе Mirror-AI, где руководил командой компьютерного зрения. В 2017 стартап прошел Y-combinator и получили инвестиции для создания приложения в котором пользователь может реконструировать свой аватар по селфи. В 2019 участвовал в британском стартапе Kazendi Ltd., в проекте HoloPortation. Цель проекта - реконструкция 3D-аватаров для очков дополненной реальности HoloLens. C 2020 руководит командой компьютерного зрения в американском стартапе Boost Inc., который занимается видеоаналитикой в баскетболе для NCAA.

Закончил НИУ ВШЭ по направлению Прикладная Математика;
Работал в ВТБ, Тинькофф, Лаборатории "Финансовые технологии" МФТИ, сейчас работаю NLP Engineer-ом в MTS AI; занимался приложениями NLP для решения финансовых задач,
Сейчас занимаюсь разработкой и оптимизацией больших языковых моделей и гибридными диалоговыми движками;
Спикер на gtc2022 и ainl2022;

20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Опытный разработчик, учёный и эксперт по Machine/Deep learning с опытом в рекомендательных системах. Имеет более 30 научных публикаций на русском и иностранном языках, защитил кандидатскую диссертацию на тему анализа и прогнозирования временных рядов.

Окончил факультет вычислительной техники в НИУ МЭИ, где в 2008 г. получил степень бакалавра, в 2010 — магистра, в 2014 — кандидата технических наук. Ещё до начала работы над диссертацией увлёкся анализом данных и при реализации своего первого значимого проекта прошёл путь от рядового программиста до начальника отдела разработки.

Около 10 лет преподавал смежные дисциплины в НИУ МЭИ, будучи доцентом кафедры. Руководит Data Science командами по разработке проектов в области NLP, RecSys, Time Series и Computer Vision

Мария
Тихонова
Александр
Брут-Бруляко
Антон
Витвицкий
Никита
Мартынов
Анатолий
Бурнашев
Александр
Сизов

Преподаватели

Мария Тихонова
Senior Data Scientist SberDevices, преподаватель ВШЭ
Работает специалистом по анализу данных в команде AGI NLP в SberDevices. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.

Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.

Мария закончила механико-математический факультет МГУ и школу анализа данных Яндекса. В настоящий момент Мария обучается в аспирантуре ВШЭ на факультете компьютерных наук. Среди ее научных интересов такие области data science, как natural language processing и тематическое моделирование.

Александр Брут-Бруляко
Ds инженер в СБЕР Neurolab

Занимаюсь построением DS систем. Анализирую данные, выстраиваю ИТ сервисы вокруг этого.

Закончил мехмат МГУ в 2004 г.
До 2012 г. преподавал в университете, защитил диссертацию по матметодам в экономике.
С 2010 по 2016 г. занимался веб разработкой на Python и PHP, программировал интернет-магазины, писал парсеры.
В DS и аналитике с 2016 г. Работал аналитиком данных в банке.
Писал внутренний аналитический софт на крупном ювелирном заводе, работал DS инженером в региональной ритейл сети. Делал ML модели персонализации для AVITO Работа.

Сейчас работаю DS инженером в СБЕР Neurolab. Это исследовательское подразделение с фокусом на персонализацию коммуникаций, поэтому спектр задач широк - и классические задачи ML, и NLP, и CV, и написание парсеров, и написание поддерживающей ИТ инфраструктуры.

Основной стек: Python, Pandas, PyTorch, Keras, SQL, ClickHouse, PySpark.

Антон Витвицкий
Boost Arria NLG, Director of Computer Vision
Эксперт по компьютерному зрению и глубокому обучению, дипломированный инженер-программист и кандидат физ-мат наук.

С 2012 по 2017 занимался распознаванием лиц в компании WalletOne, чьи решения поставлялись для бизнеса в странах Южной Африки и Европы. Участвовал в стартапе Mirror-AI, где руководил командой компьютерного зрения. В 2017 стартап прошел Y-combinator и получили инвестиции для создания приложения в котором пользователь может реконструировать свой аватар по селфи. В 2019 участвовал в британском стартапе Kazendi Ltd., в проекте HoloPortation. Цель проекта - реконструкция 3D-аватаров для очков дополненной реальности HoloLens. C 2020 руководит командой компьютерного зрения в американском стартапе Boost Inc., который занимается видеоаналитикой в баскетболе для NCAA.

Никита Мартынов
NLP Engineer в MTS AI
Закончил НИУ ВШЭ по направлению Прикладная Математика;
Работал в ВТБ, Тинькофф, Лаборатории "Финансовые технологии" МФТИ, сейчас работаю NLP Engineer-ом в MTS AI; занимался приложениями NLP для решения финансовых задач,
Сейчас занимаюсь разработкой и оптимизацией больших языковых моделей и гибридными диалоговыми движками;
Спикер на gtc2022 и ainl2022;

Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital / Руководитель курса DevRel
20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Александр Сизов
Учёный и эксперт по Machine/Deep learning
Опытный разработчик, учёный и эксперт по Machine/Deep learning с опытом в рекомендательных системах. Имеет более 30 научных публикаций на русском и иностранном языках, защитил кандидатскую диссертацию на тему анализа и прогнозирования временных рядов.

Окончил факультет вычислительной техники в НИУ МЭИ, где в 2008 г. получил степень бакалавра, в 2010 — магистра, в 2014 — кандидата технических наук. Ещё до начала работы над диссертацией увлёкся анализом данных и при реализации своего первого значимого проекта прошёл путь от рядового программиста до начальника отдела разработки.

Около 10 лет преподавал смежные дисциплины в НИУ МЭИ, будучи доцентом кафедры. Руководит Data Science командами по разработке проектов в области NLP, RecSys, Time Series и Computer Vision

Необходимые знания

  • основы линейной алгебры, матанализа, теории вероятности, статистики;
  • классические методы машинного обучения;
  • Python;
  • желательно знание основ Deep Learning.
Корпоративное обучение для ваших сотрудников
Поможем вашей компании развивать команду! Профиты данного курса для компании: Подробное изучение самых популярных баз данных с возможностью сосредоточиться на тех, которые используются в компании / Оптимизированные стабильные системы / Работа над промышленными задачами во время практики
>
Программа обучения
В процессе обучения вы получите комплексные знания и навыки.
Тема 1. Введение в NLP
Тема 2. Работа со строками + регулярные выражения
Тема 3. Recap python/ data analysis/ визуализации
Тема 4. Парсинг данных
Тема 5. Введение в нейросети
Тема 6. Градиентный спуск и backpropagation
Тема 7. PyTorch
Тема 8. Рекуррентные сети
Тема 9. Предобработка данных и понятие векторных представлений слов
Тема 10. Векторные представления слов и работа с предобученными эмбедингами
Тема 11. Задача NER
Тема 12. Языковые модели (n-grammные языковые модели)
Тема 13. Тематическое моделирование
C 16 June
Тема 14. Нейросетевые языковые модели и стратегии генерации текста
Тема 15. Архитектура Transformer и концепция attention mechanism
Тема 16. Машинный перевод и seq2seq
Тема 17. Transfer learning; BERT model
Тема 18. Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 19. Towards ChatGPT
Тема 20. Практическое занятие: работа с предобученными языковыми моделями на практическом примере
Тема 21. Q&A
C 19 July
Тема 22. Оценка языковых моделей: классические NLP-бенчмарки
Тема 23. Вопросно-ответные системы (задача question-answering)
Тема 24. Распределенное обучение
Тема 25. Создание телеграм-бота
Тема 26. Бонус: занятие по заявкам
Тема 27. Что лежит в основе ChatGPT? (Бонусная запись)
C 4 August
Тема 28. Выбор темы и организация проектной работы
Тема 29. Поиск работы в NLP DS
Тема 30. Предзащита №1
Тема 31. Предзащита №2
Тема 32. Защита проектных работ
Скачать подробную программу
Выпускной проект
Практический проект из области NLP, проходящий все этапы построения модели от сбора данных и их предобработки, до обучения модели и анализа ее результатов

Процесс обучения

Образовательный процесс происходит ONLINE в формате вебинаров (язык преподавания — русский). Стиль диалога позволит не только изучить материал через призму полученных ранее компетенций, но и объединит опыт слушателей с экспертной оценкой преподавателя. В рамках курса слушателям предлагаются к выполнению домашние задания, которые позволяют применить на практике знания, полученные на занятиях. По каждому домашнему заданию преподаватель дает развернутый фидбек. В течение всего учебного процесса преподаватель находится в едином коммуникационном пространстве с группой, т. е. при обучении слушатель может задавать преподавателю уточняющие вопросы по учебным материалам.
Получить консультацию
Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

  • заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач);

  • получите сертификат на русском о прохождении курса;

  • научитесь использовать методы NLP для решения реальных бизнес-задач;

  • создадите своё портфолио проектов, которое поможет при прохождении собеседований;

  • получите приглашение пройти собеседование в компаниях-партнерах OTUS в Москве (в случае успешного обучения на курсе).

Дата выдачи сертификата: 24 February 2024 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Natural Language Processing (NLP)»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Natural Language Processing (NLP)»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Прошедшие открытые вебинары
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Towards ChatGPT
Мария Тихонова
Для доступа к прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Стоимость обучения
Cтоимость указана для оплаты физическими лицами
45 000 ₽
Продолжительность
4 месяца
Начало занятий
27 September