Специальная цена
Курс переработан
NLP / Natural Language Processing
29 января 2025
Professional
4 месяца
Онлайн
Пн/Ср 20:00 Мск
Для кого этот курс?
Для дата-сайентистов, аналитиков данных и специалистов по машинному обучению. Что такое Natural Language Processing? Natural Language Processing (NLP, обработка естественного языка)– это направление, которое объединяет в себе лингвистику, компьютерные науки и искусственный интеллект. NLP применяет алгоритмы машинного обучения для анализа естественных языков, ResNet и EfficientNet, до самых современных Vision Transformers, таких как MViT
Необходимые знания:
- базовое знакомство с Python
- базовые знания линейной алгебры, математического анализа, математической статистики
- базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)
Посмотрите программу ДПО Machine Learning Специализация
Нужен курс с большим спектром знаний? Изучайте NLP на курсе Machine Learning Professional?
Подходит ли эта программа именно вам?
Пройдите короткий тест, который проверяет ваше знание пререквизитов, а именно математики и Python, которые понадобятся вам на курсе
Что даст вам этот курс?
Данный курс представляет собой уникальное сочетание глубоких знаний из области NLP и "повседневных" практических навыков. С одной стороны, программа курса по наполненности и изучаемым темам ничуть не уступает аналогичным вузовскими курсам. С другой стороны, в курсе, помимо теоретичечских знаний, особое внимание уделяется практическим навыкам.
После завершения курса вы сможете:
- работать с текстовыми данными
- парсить, собирать данные с сайтов из интернета
- создавать телеграм-ботов
- применять методы классического NLP для решения ML задач, связанных с текстами
- работать с нейросетевыми моделями архитектуры трансформер
- применять модели архитектуры трансформер для широкого спектра NLP задач
- решать задачу распознавания именованных сущностей
- создавать вопросно-ответные системы
LLM, Langchain, RAG, parsing, PyTorch, нейронные сети, backpropagation, реккуретные сети, NER, word2vec, fasttext, n-граммные языковые модели, BERT model, Transformer (GPT3), seq2seq, NLP-бенчмарки, создание телеграм-бота
Процесс обучения
Занятия в OTUS – это вебинары.
Преподаватели-практики помогут погрузиться в теорию, обучат на реальных примерах, расскажут о необходимых в работе инструментах. Вы всегда сможете задать вопрос и получить исчерпывающий ответ. И самое главное – сможете практиковаться.
Учитесь онлайн отовсюду. А если вдруг пропустите занятие, просто посмотрите запись.
Оптимальная нагрузка
Возможность совмещать учебу с работой.Эксперты
Преподаватели из разных сфер, каждый со своим уникальным опытом.
Перспективы
Сможете претендовать на позицию Data Scientist Junior + / Middle+Партнеры
Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должностию
- Разместите резюме в базе OTUS: так наши партнёры смогут пригласить вас на собеседование
- Посещайте карьерные мероприятия OTUS: вам расскажут, как лучше проходить собеседование
Формат обучения
Интерактивные вебинары
2 занятия по 2 академ.часа в неделю.
Доступ к записям и материалам остается навсегда
Практика
Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии
Активное комьюнити
Общение с преподавателями на вебинарах, переписки в закрытом телеграм-чате, развёрнутые ответы при проверке домашних заданий
Программа
Python для работы с текстами
Вводный модуль, посвященный повторению основных методов работы с данными в Python и работе с текстами. В модуле также рассмотрены методы парсинга данных и методы работы с регулярными выражениями — необходимые навыки в NLP.
Тема 1: Введение в NLP
Тема 2: Recap python/ data analysis/ визуализации
Тема 3: Работа со строками + регулярные выражения
Тема 4: Парсинг данных
Введение в DL
Вводный модуль по Deep Learning. Данный модуль дает общее представление о нейронных сетях, фокусируясь на методах и архитектурах, востребованных в NLP.
Тема 1: Введение в нейросети
Тема 2: Градиентный спуск и backpropagation
Тема 3: PyTorch. Часть 1
Тема 4: PyTorch. Часть 2
Тема 5: Рекуррентные сети. Часть 1
Тема 6: Рекуррентные сети. Часть 2
Классичесикие методы NLP и трансформерные модели
Модуль посвящен фундаментальным понятиям современного NLP. В нем рассматриваются такие вещи, как векторные представления слов, понятие языковой модели, архитектуры трансформер и ее практические применения для большого спектра задач.
Тема 1: Предобработка данных и векторные представления слов
Тема 2: Понятие языковой модели, RNN для работы с текстом
Тема 3: Машинный перевод и seq2seq
Тема 4: Архитектура Transformer
Тема 5: Transfer learning; BERT model
Тема 6: Работа с предобученными языковыми моделями. Задача NER
Тема 7: Генеративные языковые модели и энкодер-декодер архитектуры
Тема 8: Towards ChatGPT
Тема 9: Q&A
Практические методы применения LLM и фундаментальных моделей
Модуль посвящен практике использования современных LLM и инструктивных языковых моделей. Изучается работа с адаптерами и рассматриваются актуальные приемы промптинга LLM, в том числе ChatGPT. Применение промптинга для задачи RAG (retrieval augmented generation) — генерация ответов с использованием базы знаний. Рассматриваются задачи векторного поиска для задачи RAG, в частности работа с библиотекой sentence-transformers. Разбираются такие фреймворки как LangChain, ollama и vllm.
Тема 1: Теория промптинга LLM
Тема 2: Ускорение трансформеров и оптимизация архитектуры
Тема 3: Sentence-transformers
Тема 4: Langchain
Тема 5: RAG - генерация на основе базы знаний
Тема 6: Практическое занятие: фреймворки для эффективной работы с LLM
Дополнительные главы NLP
В модуле рассмотрены дополнительные вопросы из области NLP, выходящие за рамки основной программы: распределенные вычисления, вопросы оценки языковых моделей, тематическое моделирование. На практике будет рассмотрено, как создавать телеграмм-ботов и встраивать в них обученные модели.
Тема 1: Оценка языковых моделей: классические NLP-бенчмарки
Тема 2: Тематическое моделирование
Тема 3: Распределенное обучение
Тема 4: Создание телеграм-бота
Проектный модуль
Проектный модуль, во время которого студенты выполняют финальную работу на основе методов, изученных на курсе.
Тема 1: Выбор темы и организация проектной работы
Тема 2: Предзащита №1
Тема 3: Предзащита №2
Тема 4: Защита проектных работ
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Проектная работа
Мы стремимся, чтобы студенты выбирали темы выпускных проектов – сами, а не работали по шаблонным заготовкам. Поэтому все выпускные проекты на курсе– это ценные исследования для ML. Вот темы некоторых из них:
- Умный поиск по базе отзывов методами NLP
- Поиск по базе фильмов на основе естественного языка
- Разработка телеграмм бота клиентской поддержки пользователей пассажирских сервисов
- Финтех вопросно-ответная система
- Использование NLP моделей для классификации отзывов и определения тональности
- Генерация коротких текстов в жанре фэнтези, по заданным параметра (Habr)
Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Ближайшие мероприятия
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Результаты урока: Вы поймете, где применяются методы NLP, узнаете основные тренды и перспективы развития методов NLP, узнаете современное состояние области в связи с бумом LLM
Кому подходит этот урок:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science
В результате вебинара вы узнаете про задачу STS и её применение в современном NLP.
Вебинар будет полезен:
- Практикующим Data Scientist и ИТ-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, как реализовать смысловой поиск вместо поиска по полному соответствию
- Людям, освоившими основы машинного обучения, но желающими развиваться в области DS
Результаты урока: Вы узнаете, что представляет из себя задача языкового моделирования, узнаете, какие современные LLM сегодня используют на практике, какие технологии стоят за ChatGPT.
Кому подходит этот урок:
- Практикующим Data Scientist и ИТ-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, что делает ChatGPT и другие LLM такими умными
- Людям, освоившими основы машинного обучения, но желающими развиваться в области DS
Прошедшие
мероприятия
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Корпоративное обучение для ваших сотрудников
- Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
- Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
- OTUS проверяет знания студентов перед стартом обучения и после его завершения
- Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
- Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
- OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год
Отзывы
Сертификат о прохождении курса
OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS и УПК (Удостоверение повышения квалификации).
После обучения вы:
- Заберёте полный комплект обучающих материалов: видеозаписи вебинаров, презентации к занятиям
- Разработаете ценный для индустрии проект
- Повысите личную конкурентоспособность как IT-специалист
- Получите сертификат об окончании курса
NLP / Natural Language Processing
Полная стоимость со скидкой
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно