Курс переработан

NLP / Natural Language Processing

Погрузитесь в NLP: освойте различные языковые модели и создайте собственный телеграм-бот

25 ноября

Professional

4 месяца

Онлайн

Пн/Чт 20:00 Мск

Для кого этот курс?

Для дата-сайентистов, аналитиков данных и специалистов по машинному обучению

Что такое Natural Language Processing? Natural Language Processing (NLP, обработка естественного языка)– это направление, которое объединяет в себе лингвистику, компьютерные науки и искусственный интеллект. NLP применяет алгоритмы машинного обучения для анализа естественных языков, ResNet и EfficientNet, до самых современных Vision Transformers, таких как MViT

Необходимые знания:

  • базовое знакомство с Python
  • базовые знания линейной алгебры, математического анализа, математической статистики
  • базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)
Хотите изучить или повторить Python, математический анализ и основны ML?

Посмотрите программу ДПО Machine Learning Специализация

Нужен курс с большим спектром знаний? Изучайте NLP на курсе Machine Learning Professional?

Подходит ли эта программа именно вам?

Пройдите короткий тест, который проверяет ваше знание пререквизитов, а именно математики и Python, которые понадобятся вам на курсе

Что даст вам этот курс?

Знаний, которые дают ML/DL курсы, часто оказывается недостаточно, чтобы стать специалистом в области NLP. Data Scientist'ам, которые решили заняться методами, связанными с автоматической обработкой текстов, необходимы дополнительные знания из этой области.

Данный курс представляет собой уникальное сочетание глубоких знаний из области NLP и "повседневных" практических навыков. С одной стороны, программа курса по наполненности и изучаемым темам ничуть не уступает аналогичным вузовскими курсам. С другой стороны, в курсе, помимо теоретичечских знаний, особое внимание уделяется практическим навыкам. 

После завершения курса вы сможете:

  • работать с текстовыми данными
  • парсить, собирать данные с сайтов из интернета
  • создавать телеграм-ботов
  • применять методы классического NLP для решения ML задач, связанных с текстами
  • работать с нейросетевыми моделями архитектуры трансформер
  • применять модели архитектуры трансформер для широкого спектра NLP задач
  • решать задачу распознавания именованных сущностей
  • создавать вопросно-ответные системы
На курсе изучаются современные подходы и модели, которые на данный момент являются стандартом в области, но еще не успели войти в большинство программ, так как были предложены совсем недавно. Стоит отметить, что на курсе делается акцент на особенностях работы с русскоязычными моделями и данными на русском языке.
Hard skills

LLM,  Langchain, RAG, parsing, PyTorch, нейронные сети, backpropagation, реккуретные сети, NER, word2vec, fasttext, n-граммные языковые модели, BERT model, Transformer (GPT3), seq2seq, NLP-бенчмарки, создание телеграм-бота 

Процесс обучения

У нас нет предзаписанных уроков.
Занятия в OTUS – это вебинары.

Преподаватели-практики помогут погрузиться в теорию, обучат на реальных примерах, расскажут о необходимых в работе инструментах. Вы всегда сможете задать вопрос и получить исчерпывающий ответ. И самое главное – сможете практиковаться.

Учитесь онлайн отовсюду. А если вдруг пропустите занятие, просто посмотрите запись.

Оптимальная нагрузка

Возможность совмещать учебу с работой.

Эксперты

Преподаватели из разных сфер, каждый со своим уникальным опытом.

Перспективы

Сможете претендовать на позицию Data Scientist Junior + / Middle+

Партнеры

Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должностию

  • Разместите резюме в базе OTUS: так наши партнёры смогут пригласить вас на собеседование
  • Посещайте карьерные мероприятия OTUS: вам расскажут, как лучше проходить собеседование
Формат обучения

Интерактивные вебинары


2 занятия по 2 академ.часа в неделю.
Доступ к записям и материалам остается навсегда

Практика


Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии

Активное комьюнити


Общение с преподавателями на вебинарах, переписки в закрытом телеграм-чате, развёрнутые ответы при проверке домашних заданий

Программа

Python для работы с текстами

Вводный модуль, посвященный повторению основных методов работы с данными в Python и работе с текстами. В модуле также рассмотрены методы парсинга данных и методы работы с регулярными выражениями - необходимые навыки в NLP.

Тема 1: Введение в NLP

Тема 2: Recap python/ data analysis/ визуализации

Тема 3: Работа со строками + регулярные выражения

Тема 4: Парсинг данных

Введение в DL

Вводный модуль по Deep Learning. Данный модуль дает общее представление о нейронных сетях, фокусируясь на методах и архитектурах, востребованных в NLP.

Тема 1: Введение в нейросети

Тема 2: Градиентный спуск и backpropagation

Тема 3: PyTorch. Часть 1

Тема 4: PyTorch. Часть 2

Тема 5: Рекуррентные сети. Часть 1

Тема 6: Рекуррентные сети. Часть 2

Классичесикие методы NLP и трансформерные модели

Модуль посвящен фундаментальным понятиям современного NLP. В нем рассматриваются такие вещи, как векторные представления слов, понятие языковой модели, архитектуры трансформер и ее практические применения для большого спектра задач.

Тема 1: Предобработка данных и векторные представления слов

Тема 2: Понятие языковой модели, RNN для работы с текстом

Тема 3: Машинный перевод и seq2seq

Тема 4: Архитектура Transformer

Тема 5: Transfer learning; BERT model

Тема 6: Работа с предобученными языковыми моделями. Задача NER

Тема 7: Генеративные языковые модели и энкодер-декодер архитектуры

Тема 8: Towards ChatGPT

Тема 9: Q&A

Практические методы применения LLM и фундаментальных моделей

Модуль посвящен практике использования современных LLM и инструктивных языковых моделей. Изучается работа с адаптерами и рассматриваются актуальные приемы промптинга LLM, в том числе ChatGPT. Применение промптинга для задачи RAG (retrieval augmented generation) - генерация ответов с использованием базы знаний. Рассматриваются задачи векторного поиска для задачи RAG, в частности работа с библиотекой sentence-transformers. Разбираются такие фреймворки как LangChain, ollama и vllm.

Тема 1: Теория промптинга LLM

Тема 2: Ускорение трансформеров и оптимизация архитектуры

Тема 3: Sentence-transformers

Тема 4: Langchain

Тема 5: RAG - генерация на основе базы знаний

Тема 6: Практическое занятие: фреймворки для эффективной работы с LLM

Дополнительные главы NLP

В модуле рассмотрены дополнительные вопросы из области NLP, выходящие за рамки основной программы: распределенные вычисление, вопросы оценки языковых моделей, тематическое моделирование. На практике будет рассмотрено, как создавать телеграмм-ботов и встраивать в них обученные модели.

Тема 1: Оценка языковых моделей: классические NLP-бенчмарки

Тема 2: Тематическое моделирование

Тема 3: Распределенное обучение

Тема 4: Создание телеграм-бота

Проектный модуль

Проектный модуль, во время которого студенты выполняют финальную работу, на основе методов изученных на курсе.

Тема 1: Выбор темы и организация проектной работы

Тема 2: Предзащита №1

Тема 3: Предзащита №2

Тема 4: Защита проектных работ

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Проектная работа


Мы стремимся, чтобы студенты выбирали темы выпускных проектов – сами, а не работали по шаблонным заготовкам. Поэтому все выпускные проекты на курсе– это ценные исследования для ML. Вот темы некоторых из них:
  • Умный поиск по базе отзывов методами NLP
  • Поиск по базе фильмов на основе естественного языка
  • Разработка телеграмм бота клиентской поддержки пользователей пассажирских сервисов
  • Финтех вопросно-ответная система
  • Использование NLP моделей для классификации отзывов и определения тональности
  • Генерация коротких текстов в жанре фэнтези, по заданным параметра (Habr)

Преподаватели

Руководитель курса

Мария Тихонова

PhD Computer Science, Senior Data Scientist

SberDevices, ВШЭ

Александр Брут-Бруляко

DS инженер (к.э.н.)

Сбер GigaLegal

Антон Витвицкий

(к.ф.-м.н.) Director of Computer Vision

Boost Arria NLG

Алексей Клочков

Data Science Team Lead

Kept

Андрей Коняев

Consultant GenAI Machine Learning Engineering

Deutsche Telekom AG - T-Systems International GmbH

Дмитрий Гайнуллин

Machine Learning Engineer

AIC

Алексей Кисляков

(д.э.н., к.т.н.) преподаватель/ученый-исследователь

Российская академия народного хозяйства и государственной службы при Президенте РФ (Владимирский филиал)

Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания

Прошедшие
мероприятия

Андрей Коняев
Открытый вебинар
RAG - генерация на основе базы знаний
Андрей Коняев
Открытый вебинар
Named Entity Recognition (NER) - Распознавание именованных сущностей
Для доступа ко всем прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Корпоративное обучение для ваших сотрудников

Отус помогает развивать высокотехнологичные Команды. Почему нам удаётся это делать успешно:
  • Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
  • Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
  • OTUS проверяет знания студентов перед стартом обучения и после его завершения
  • Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
  • Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
  • OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год

Отзывы

Дмитрий Панфилов

05.09.2024
Хочу поделиться своими впечатлениями о курсе NLP от компании OTUS. Я уже имел опыт разработки различных решений в этой области, но этот курс поразил меня тем, что здесь смогли объединить уже хорошо известные и зарекомендовавшие себя технологии типа BERT, RoBERTa или им подобным, с самыми современными подходами и методами использования больших языковых моделей типа GPT, GigaChat или self-hosted LLM, которые размещаются на локальных серверах без выхода в интернет. Все это комплексе с токенизаторами, различными фильтрами и решениями на базе RAG и других методов пред- и пост- обработки текстов позволяют быстро создавать Чат-Ботов или Web-приложения для решения восстребованных задач. В этом курсе приятно удивило, что большинство лекторов имеют замечательное фундаментальное образование в области ИТ, многие получили степень PhD и работают в ведущих компаниях индустрии. Это позволило курсу быть не только теоретически насыщенным, но и невероятно практическим и актуальным. Всем, кто интересуется NLP, настоятельно рекомендую этот курс. Он станет отличным трамплином для дальнейшего развития в этой захватывающей и быстро развивающейся области. По окончанию курса многие студенты смогли продемонстрировать реализованные всего за несколько месяцев сложные проекты, имеющую огромную практическую ценность. Всем спасибо за хорошо организованный и полезный курс и за классный обмен опытом!

Евгений Суворкин

07.08.2024
Работаю в иностранной ИТ компании, с тематикой курса по работе не связан. Выбрал данный курс, потому что, кроме ИТ еще меня интересуют языки – иностранные и вообще (имею один из дипломов в области лингвистики), – то все, что связано с обработкой языка, меня также крайне интересует, особенно популярные темы вроде LLM, ChatGPT и т.п, которые у всех на слуху. Год назад я прошел курс по машинному обучению, поэтому курс по NLP стал логичным продолжением погружения в данную тематику. Понравилась актуальность материала курса: изменения в отрасли настолько быстротечны, что это становится основополагающим фактором. Преподаватели явно обладают практическим опытом в данной области – это очень чувствуется. Формат обучения в виде Zoom-сессий, а не заранее записанных лекций особенно порадовал. Это добавляет мотивации и делает “оживляет” учебный процесс. Обучение дало много новой информации (в которой еще предстоит до конца разобраться), а также бесценный опыт практического использования знаний при решении домашних заданий. Буду ли я использовать все эти знания в своей профессиональной деятельности – покажет время, но надеюсь, что все же да

Дмитрий Карасев

08.07.2024
После защиты кандидатской диссертации работал научным сотрудником и преподавал в Шанинке, РАНХиГС, МГИМО. Переводил с английского, был научным редактором переводов, публиковал научно-популярные статьи. Развиваясь как академический ученый и исследователь, работая в междисциплинарных командах, столкнулся с проблемой сбора данных и нехваткой количественных скилов. Это подтолкнуло меня учить матчасть, изучать эконометрику и моделирование на R (Coursera, Stepik). Затем органично перешел на python: Дальше передо мной встал сложный выбор: выбрать специализацию и более углубленные курсы с преподавателями-практиками из IT отрасли. Мой выбор пал на NLP от OTUS – и я не прогадал! Пару слов о том, как выбирал: посещал открытые занятия, смотрел видео ролики из серии how to… разных образовательных платформ. Открытые занятия OTUS не только сразу понравились, но и подсказали решения для некоторых практических задач, с которыми сталкивался. Уже на этом этапе у меня появились любимые преподаватели в OTUS. Я долго колебался между ду курсами ML Advanced и MLOps и в итоге выбрал NLP, как того настоятельно требовали текущие рабочие задачи. С прежней работы я в итоге ушел, но ни капельки не пожалел, что взял NLP, и сейчас расскажу почему. Во-первых, большие языковые модели (LLM), различного рода GPT, которые сейчас развиваются просто бешенными темпами: я пришёл в OTUS используя BERT для сентимента и тому подобного, а вышел используя GPT в проде, с собственным проектом и не только. Во-вторых, Мария Тихонова – она легенда: просто задумайтесь на секунду – возможность поучиться у NLP Team Lead-а, которая со своей командой в SberDevices приложила руку к GigaChat и преподает в магистратуре по машинному обучению ВШЭ! Благодаря её разработками по оценке качества LLM, у Маши самый высокий рейтинг научного цитирования из знакомых мне ученых, и опыт выступления на топовых международных конференциях по NLP. Специально отмечу, она не единственные крутой преподаватель курса, работающий на передовом фронте NLP в топовых компаниях. В OTUS, в целом, преподают и учатся «взрослые дяди и тёти», при этом живые, увлеченные своим делом, и никто не задирает носа – это круто! В-третьих, но не в последних: знания и навыки, которые дают на курсе ну очень свежие и актуальные: чтобы было понятно, то, что только в марте 2024 г. было на конференциях Сбера – в Мае 2024 уже преподают в OTUS. Все, включая SOTA сейчас меняется очень быстро в мире NLP и LLM! По итогам обучения я пересмотрел свою карьерную траекторию и зарплатные ожидания. Возможно, мигрирую в ML из академии. Пока я не нашел работы, но мне регулярно приходят приглашения, хотя отказывают тоже часто. Поиск работы мечты – дело не быстрое. Теперь благодаря навыкам парсинга у меня нет проблем со сбором данных. Умение работать с GPT немного разгрузили меня с чтением и написанием текстов. Но, пожалуй, самое главное – у меня появился собственный проект, который требует не столько денег, сколько времени, навыков и экспериментов (не буду много о нем, чтобы не спугнуть удачу). Я также приобщился к NLP и DS сообществу. Ребята из OTUS, так держать! Я ушел от вас с горящими глазами, а может еще и не ушел.

Кирилл Носов

27.05.2024
В настоящее время я продолжаю работать аналитиком-разработчиком в финансовой компании. До этого я уже проходил небольшой курс по NLP в другой образовательной компании, в этот раз мне хотелось глубже погрузиться в языковые модели, т.к. это одна из самых динамичных и востребованных областей ИИ, актуальность которой будет постоянно расти. Мне очень нравятся преподаватели, особенно Мария Тихонова, а также подбор тем, материалов и практических заданий.

Екатерина Шахова

28.09.2023
Последние несколько лет я работала в области финансовой аналитики, но постепенно стала понимать, что для работы с данными нужны более продвинутые способы работы. В результате я решила перейти в сферу Data Science и дальше уже специализироваться на NLP, так как на мой скромный взгляд это одно из наиболее перспективных направлений в DS. Случайно наткнулась на курс OTUS по NLP. В программе курса понравилось то, что он не для начального уровня специалиста в ML, а уже предполагает определенную базу знаний и навыков и концентрируется на выбранной области. Для меня это было в самый раз, так как у меня уже были проекты в ML и хотелось именно NLP специализации. После начала курса была приятно удивлена уровнем и количеством домашних заданий: их было достаточно много, чтобы попрактиковаться и они не были простыми, чтобы не стало скучно. Лекции проходили интерактивно, группа студентов сформировалась бойкая, хотя поначалу стеснялись задавать вопросы. Если я не успевала на занятия, запись появлялась на следующий день и я могла быстро нагнать группу. А защита выпускных работ — просто огонь! Было интересно презентовать свою работу, а еще интереснее слушать других! Сейчас я приступаю к новому проекту в области NLP, который, казалось, до начала обучения я не смогу выполнить. Помимо новых технических знаний в предметной области обучение на курсе придало мне уверенности в себе и открыло для меня новые возможности как в профессиональном плане, так и в личном плане (я продолжаю развлекать друзей и родственников чат-ботами, пишущими гороскопы и анекдоты).

IGOR GARAEV

23.09.2023
Отличный курс, советую всем. Более 10 лет в аналитике данных и давно хотел заняться задачами NLP, но нехватка времени и непонимание с чего начать останавливали меня. Данный курс заложил хорошую базу и понимание сверху всех ветвей NLP. На курсе Марией предложено большое количество практических примеров - за это большое спасибо! Дополнительно курсу необходимо просматривать статьи на medium и постараться прорешать большое количество практических примеров.

Сертификат о прохождении курса

OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS и УПК (Удостоверение повышения квалификации).

После обучения вы:

  • Заберёте полный комплект обучающих материалов: видеозаписи вебинаров, презентации к занятиям
  • Разработаете ценный для индустрии проект
  • Повысите личную конкурентоспособность как IT-специалист
  • Получите сертификат об окончании курса

Частые вопросы

Почему OTUS?
Мы обучаем IT-сотрудников уже 6 лет, через OTUS прошли 20000 студентов. Специализируемся на программах для людей с опытом, а ещё – быстро переформатируем учебные программы под изменения в сфере информационных технологий.
Что является наиболее ценным по мнению выпускников?
На курсе «Machine Learning. Professional» вы получите знания, которые можно сразу же применить в работе. Наши преподаватели развёрнуто анализируют домашние задания, активно общаются со студентами в телеграм-чатах и на вебинарах, помогают с выпускными проектами.
Обязательно ли выполнять и защищать выпускной проект?
Для получения сертификата OTUS и УПК (удостоверение повышения квалификации государственного образца) необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем. Для получения УПК также понадобится предъявить документ об образовании.
Обязательно ли выполнять все домашние задания?
Да, если хотите хорошо отточить навыки. На курсе будут практические домашние задания, их выполнение занимает примерно 2-3 часа.
Помогаете ли вы с поиском работы?
Наши преподаватели могут принимать решения о трудоустройстве в своих компаниях. Выполните выпускной проект хорошо, и ваши шансы пройти собеседование значительно возрастут. Ещё OTUS Club проводит карьерные мероприятия: там вы узнаете, например, как проходить интервью и как составлять резюме.
Смогу ли я совмещать учёбу с работой?
Да. Программа рассчитана на студентов, у которых мало времени. Раз в модуль мы даём домашние задания, а лекции проводим дважды в неделю.
Что если в середине курса я не смогу продолжать обучение?
Вы можете бесплатно перейти в другую группу. Но только один раз.
Я могу вернуть деньги?
Да, мы можем вернуть деньги за то время, которое вы ещё не успели отучиться. Например, если курс длится пять месяцев, а вы отучились один, мы вернём деньги за оставшиеся четыре месяца.
Может ли мой работодатель оплатить курс?
Да. Когда свяжетесь с нашим менеджером, уточните, что оплачивать курс будет ваш работодатель.
Остались вопросы?
Оставляйте заявку и задавайте вопросы менеджеру, команда курса с ним на связи и постарается дать вам дать исчерпывающую информацию.