Курс переработан
Natural Language Processing (NLP)
25 апреля
Professional
4 месяца
Онлайн
Пн/Чт 20:00 Мск
Для кого этот курс?
Для дата-сайентистов, аналитиков данных и специалистов по машинному обучению. Что такое Natural Language Processing? Natural Language Processing (NLP, обработка естественного языка)– это направление, которое объединяет в себе лингвистику, компьютерные науки и искусственный интеллект. NLP применяет алгоритмы машинного обучения для анализа естественных языков, ResNet и EfficientNet, до самых современных Vision Transformers, таких как MViT
Необходимые знания:
- базовое знакомство с Python
- базовые знания линейной алгебры, математического анализа, математической статистики
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)
Посмотрите программу ДПО Machine Learning Специализация
Нужен курс с большим спектром знаний? Изучайте NLP на курсе Machine Learning Professional?
Подходит ли эта программа именно вам?
Пройдите короткий тест, который проверяет ваше знание пререквизитов, а именно математики и Python, которые понадобятся вам на курсе
Что даст вам этот курс?
Данный курс представляет собой уникальное сочетание глубоких знаний из области NLP и "повседневных" практических навыков. С одной стороны, программа курса по наполненности и изучаемым темам ничуть не уступает аналогичным вузовскими курсам. С другой стороны, в курсе, помимо теоретичечских знаний, особое внимание уделяется практическим навыкам.
После завершения курса вы сможете:
- работать с текстовыми данными
- парсить, собирать данные с сайтов из интернета
- создавать телеграм-ботов
- применять методы классического NLP для решения ML задач, связанных с текстами
- работать с нейросетевыми моделями архитектуры трансформер
- применять модели архитектуры трансформер для широкого спектра NLP задач
- решать задачу распознавания именованных сущностей
- создавать вопросно-ответные системы
LLM, Langchain, RAG, parsing, PyTorch, нейронные сети, backpropagation, реккуретные сети, NER, word2vec, fasttext, n-граммные языковые модели, BERT model, Transformer (GPT3), seq2seq, NLP-бенчмарки, создание телеграм-бота
Процесс обучения
Занятия в OTUS – это вебинары.
Преподаватели-практики помогут погрузиться в теорию, обучат на реальных примерах, расскажут о необходимых в работе инструментах. Вы всегда сможете задать вопрос и получить исчерпывающий ответ. И самое главное – сможете практиковаться.
Учитесь онлайн отовсюду. А если вдруг пропустите занятие, просто посмотрите запись.
Оптимальная нагрузка
Возможность совмещать учебу с работой.Эксперты
Преподаватели из разных сфер, каждый со своим уникальным опытом.
Перспективы
Сможете претендовать на позицию Data Scientist Junior + / Middle+Трудоустройство
Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должностию
- Разместите резюме в базе OTUS: так наши партнёры смогут пригласить вас на собеседование
- Посещайте карьерные мероприятия OTUS: вам расскажут, как лучше проходить собеседование
Формат обучения
Интерактивные вебинары
2 занятия по 2 академ.часа в неделю.
Доступ к записям и материалам остается навсегда
Практика
Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии
Активное комьюнити
Общение с преподавателями на вебинарах, переписки в закрытом телеграм-чате, развёрнутые ответы при проверке домашних заданий
Программа
Python для работы с текстами
Вводный модуль, посвященный повторению основных методов работы с данными в Python и работе с текстами. В модуле также рассмотрены методы парсинга данных и методы работы с регулярными выражениями - необходимые навыки в NLP.
Тема 1: Введение в NLP
Тема 2: Recap python/ data analysis/ визуализации
Тема 3: Работа со строками + регулярные выражения
Тема 4: Парсинг данных
Введение в DL
Вводный модуль по Deep Learning. Данный модуль дает общее представление о нейронных сетях, фокусируясь на методах и архитектурах, востребованных в NLP.
Тема 1: Введение в нейросети
Тема 2: Градиентный спуск и backpropagation
Тема 3: PyTorch. Часть 1
Тема 4: PyTorch. Часть 2
Тема 5: Рекуррентные сети. Часть 1
Тема 6: Рекуррентные сети. Часть 2
Классические методы NLP
В данном модуле изучаются классические методы автоматической обработки текстов, методы, основанные на статистическом анализе. Будут рассмотрены основные методы векторных представлений слов, в том числе word2vec и fasttext, и n-граммные языковые модели.
Тема 1: Предобработка данных и понятие векторных представлений слов
Тема 2: Векторные представления слов и работа с предобученными эмбедингами
Тема 3: Задача NER
Тема 4: Языковые модели (n-grammные языковые модели)
Тема 5: Тематическое моделирование
Нейросетевые языковые модели
Модуль посвящен нейросетевым языковым моделям. Будет детально рассмотрена идея self-attention и архитектура transformer, являющейся стандартном в NLP сегодня. Изучаются наиболее популярные модели на основе архитектуры трансформер (BERT и GPT3) и их применение на практике.
Тема 1: Нейросетевые языковые модели и стратегии генерации текста
Тема 2: Машинный перевод и seq2seq
Тема 3: Архитектура Transformer и концепция attention mechanism
Тема 4: Transfer learning; BERT model
Тема 5: Практическое занятие: работа с предобученными языковыми моделями на практическом примере
Тема 6: Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 7: Towards ChatGPT
Практические методы применения LLM и фундаментальных моделей
Модуль посвящен практике использования современных инструктивных языковых моделей. Рассматриваются актуальные приемы промптинга LLM, в том числе ChatGPT. Применение промптинга для задачи RAG (retrieval augmented generation) - генерация ответов с использование базы знаний. Рассматриваются задачи векторного поиска для задачи RAG, в частности работа с библиотеков sentence-transformers. Рассматривается работа с фреймворком LangChain.
Тема 1: Теория промптинга LLM
Тема 2: Sentence-transformers
Тема 3: Langchain
Тема 4: RAG - генерация на основе базы знаний
Дополнительные главы NLP
В модуле рассмотрены дополнительные вопросы из области NLP, выходящие за рамки основной программы: распределенные вычисление, вопросы оценки языковых моделей, вопросно-ответные системы. На практике будет рассмотрено, как создавать телеграмм-ботов и встраивать в них обученные модели.
Тема 1: Оценка языковых моделей: классические NLP-бенчмарки
Тема 2: Вопросно-ответные системы (задача question-answering)
Тема 3: Распределенное обучение
Тема 4: Создание телеграм-бота
Проектный модуль
Проектный модуль, во время которого студенты выполняют финальную работу, на основе методов изученных на курсе
Тема 1: Выбор темы и организация проектной работы
Тема 2: Предзащита №1
Тема 3: Предзащита №2
Тема 4: Защита проектных работ
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Проектная работа
Мы стремимся, чтобы студенты выбирали темы выпускных проектов – сами, а не работали по шаблонным заготовкам. Поэтому все выпускные проекты на курсе– это ценные исследования для ML. Вот темы некоторых из них:
- Умный поиск по базе отзывов методами NLP
- Поиск по базе фильмов на основе естественного языка
- Разработка телеграмм бота клиентской поддержки пользователей пассажирских сервисов
- Финтех вопросно-ответная система
- Использование NLP моделей для классификации отзывов и определения тональности
- Генерация коротких текстов в жанре фэнтези, по заданным параметра (Habr)
Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Прошедшие
мероприятия
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Корпоративное обучение для ваших сотрудников
- Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
- Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
- OTUS проверяет знания студентов перед стартом обучения и после его завершения
- Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
- Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
- OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год
Отзывы
Сертификат о прохождении курса
OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS и УПК (Удостоверение повышения квалификации).
После обучения вы:
- Заберёте полный комплект обучающих материалов: видеозаписи вебинаров, презентации к занятиям
- Разработаете ценный для индустрии проект
- Повысите личную конкурентоспособность как IT-специалист
- Получите сертификат об окончании курса
Natural Language Processing (NLP)
Стоимость в рассрочку
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно