Занимается обучением больших языковых моделей, а также их оценкой. Участвовала в создании мультиязычной нейросети mGPT на 61 язык, первого русскоязычного бенчмарк для русского языка, а также в проекте GigaChat.
Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.
Образование:
Механико-математический факультет Московского государственного университета (МГУ)
Закончила аспирантуру факультета компьютерных наук Высшей Школы Экономики (НИУ ВШЭ)
Otus Certified Educator
Руководитель программы
С декабря 2023 Consultant GenAI Machine Learning Engineering (Professional Research & Development Engineer I) T-Systems International
Опыт:
3 года опыта в роли Data Scientist (NLP). Занимаюсь всеми этапами работы: исследование; сбор, обработка и генерация тренировочных данных; PoC; обучение или дообучение моделей; анализ качества моделей; оптимизация моделей и перевод в продакшн.
Также, занимаюсь бэкенд разработкой.
Преподаватель информатики в 5-9 классах во Второй Санкт-Петербургской Гимназии (2 месяца, 2018).
Основной стек:
Python, PyTorch, Tensorflow, AWS, Microsoft Azure, Docker, transformers, GPT, FastAPI, ONNX, Git
Реализованные проекты:
Семантический поисковик на основе векторной схожести, инструмент для упрощения текста, голосовой и текстовый ассистент для пенсионеров, классификатор отчётов CRM и прочие.
Образование:
BSc: Берлинский университет имени Гумбольдта
MSc: Потсдамский университет
Otus Certified Educator
Преподаватель
Опытный разработчик, учёный и эксперт по Machine/Deep learning с опытом в рекомендательных системах. Имеет более 30 научных публикаций на русском и иностранном языках, защитил кандидатскую диссертацию на тему анализа и прогнозирования временных рядов.
Около 10 лет преподавал смежные дисциплины в НИУ МЭИ, будучи доцентом кафедры. Руководит Data Science командами по разработке проектов в области NLP, RecSys, Time Series и Computer Vision.
Образование:
кандидат технических наук, НИУ МЭИ
Otus Certified Educator
Преподаватель
Занимался задачами с использованием как классического Machine Learning, так и Deep Learning алгоритмов с использованием нейронных сетей в задачах NLP и CV, а также проведением различных аналитических исследований:
- Задачи NLP (Topic Modeling, NER) и CV (face detection, instance segmentation, semantic segmentation, age/gender classification) для анализа социальных сетей
- Кластерный анализ целевых аудитории (clustering)
- Прогнозирование бизнес-метрик (classical ML)
- Аудиторное профилирование и персонализация рекламы
Самостоятельно занимался изучением Machine Learning. Знает, что нужно для освоения новой профессии и какие при этом возникают вопросы.
Образование:
Уральский государственный университет (УРФУ)
Otus Certified Educator
Преподаватель
Более 3+ года работы в различных проектах, связанных с машинным обучением. В основном в NLP и Speech Processing.
Работал как в маленьких стартапах на 3 человека, так и в исследовательских отделах крупных международных банков. Имею опыт работы с суммаризацией текста, большими языковыми моделями и распознаванием естественной речи.
Занял первое место в ASR for low-resource languages Coqui AI challenge.
Разрабатывал и запускал внутренние продукты для банков и делал свой мини-стартап по рекомендации одежды.
Стэк: Python (NumPy, SciPy, Pandas, scikit-learn, Flask, FastAPI), Pytorch, Lightning, Transformers, WandB, Triton.
Образование:
МФТИ и Ecole Polytechnique.
Преподаватель
Занимается анализом данных и машинном обучением с 2018 года.
Работал в департаментах рисков, комплаенса крупных российских банков, а также айти-консалтинге. В настоящий момент занимаюсь построением моделей для клиентского сервиса в Газпромбанке.
Компании: QIWI, Альфа-банк, МТС-Банк, PricewaterhouseCoopers.
Образование:
Финансовый Университет при Правительстве РФ, риск-менеджмент
Otus Certified Educator
Преподаватель
Последние 2.5 года работала над задачами компьютерного зрения: сегментация типов льда в дочке Газпром Нефти, предсказание возраста человека по камерам видеонаблюдения в Facemetric, распознавание жестов в SberDevices и другие. В 2021 закончила бакалавриат СПбГУ, направление - прикладная математика и информатика. Сейчас, в SberDevices, занимаюсь исследованиями и созданием картиночных датасетов.
Выпускник факультета Прикладной математики СПбГУ (с красным дипломом). Некоторое время проработал научным сотрудником и делал исследования в области прочности и механики льда. Потом переквалифицировался в DS.
Последние 6 лет занимал сеньорские и тимлидские должности в стартапах. Основная специализация - нейронные сети в computer vision
Работает специалистом по анализу данных в хедж-фонде Meson Capital. Занимается построением различных моделей, предсказывающих поведение на рынке акций.
До этого более 9 лет занимался решением бизнес задач на основе машинного обучения в таких компаниях, как Альфа-банк, СберМегаМаркет, ХоумКредит, ЛПСУ МФТИ, строя модели компьютерного зрения, обработки естественного языка и временных рядов.
Является приглашенным лектором в МФТИ, где ведет авторский курс «Практический ML».
Валентин закончил магистратуру МФТИ. В круг его интересов входит внедрение и построение инфраструктуры для решений на основе анализа данных.
Преподаватель
Соавтор курсов Machine Learning уровня Basic, Professional и Advanced
Практикует машинное обучение и анализ данных с 2012 года. В настоящий момент работает Head of R&D в компании WeatherWell. Имеет опыт практического применения машинного обучения в геймдеве, банковской сфере и Health Tech.
Преподавал машинное обучение и анализ данных в Центре Математических Финансов МГУ, был приглашенным лектором на Факультете Компьютерных Наук НИУ ВШЭ и различных летних школах.
Образование: Эконом-мат РЭУ им. Плеханова, ЦМФ МГУ, ДПО ФКН ВШЭ «Практический анализ данных и машинное обучение», MSc Computer Science Aalto University
Стек/интересы: Python, Machine Learning, Time Series, Anomaly Detection, Open Data, ML for social good
Занимаюсь построением рекомендательных систем. В работе в основном использую модели матричной факторизации и эвристики.
Учусь в аспирантуре Сколково, где занимаюсь исследованиями в области Sequential Recommender Systems.
Опубликовала 2 статьи и выступила с докладом на воркшопе.
До начала карьеры в IT 10+ лет занималась преподаванием.
Основной стек: Python, Pandas, PyTorch, SQL, ClickHouse.
Образование:
ФКН ВШЭ, факультет Радиоэлектроники и Лазерной Техники МГТУ им. Н. Э. Баумана
Преподаватель
Больше 10 лет опыта работы в исследованиях и разработке (математическое моделирование, статистическая обработка измерений и экспериментов, разработка алгоритмов локализации, применение глубокого обучения для задач вычислительной химии и компьютерного зрения)
Больше 5лет работы в анализе данных и машинном обучении.
Работал в BioCad, Arcadia, GigAnt.
Преподавал алгоритмы, python, вычислительной химии и машинного обучения.
Образование:
прикладная математика, РГГРУ
Преподаватель
Занимался разработками алгоритмами временных рядов, разрабатывал модели прогнозирования режимов работы энергообъектов. В 2021 году перешел в ритейл, где работал с моделями на больших данных.
Преподавал предметы технической и экономической направленности во ВСГУТУ и МГИ.
Основной стек/интересы: timeseries, spark, hive, zeppelin, sql, airflow, tableau, teradata, pandas, numpy, scipy, sklearn, matplotlib, catboost, git
Образование:
ВСГУТУ
Otus Certified Educator
Преподаватель
В машинное обучение пришел из теоретической физики. Опыт работы в анализе данных (компания App In The Air) и Python-разработки (Archeads Inc.)
Многолетний опыт преподавания: линейной алгебры, статистики и теории вероятностей, разработки и анализа данных на Python.
Образование:
ФОПФ МФТИ, Сколтех
Более 35 лет в ИТ, с 2016 года работает с большими данными как разработчик, Data Engineer и Data Scientist. Team Lead команд инженеров данных на разных проектах.
Развивал проекты в банках, в телекоммуникационных и розничных компаниях.
Разработал архитектуру миграции системы Teradata RTCM на Teradata VCX для телекоммуникационной компании.
Разработал архитектура системы обработки данных на базе Hadoop для совместного проекта международной платежной системы и крупного банка.
Разработал систему безопасности Hadoop на основе Atlas и Ranger.
Тестировал системы безопасности Protegrity в Hadoop для крупного банка.
Практический опыт базируется на знании Hadoop (Cloudera, Hortonworks), MPP-системами (Teradata, Greenplum, Vertica), фреймворка Spark и платформ Google Cloud Platform и Yandex Cloud.
Автор курса Data Engineer, Apache Kafka, Spark Developer в компании Otus.
“Поработав и как Data Scientist, и как Data Engineer, понимаю, что без Data Engineer'а Data Scientist'у делать нечего.”
Образование:
прикладная математика, Московский институт электроники и математики (МИЭМ)
Otus Certified Educator
Преподаватель
Занимается исследованиями с фокусом на персонализацию коммуникаций в СБЕР Neurolab, спектр задач широк - и классические задачи ML, и NLP, и CV, и написание парсеров, и написание поддерживающей ИТ инфраструктуры.
Работает с построением DS систем, анализом данных и выстраиванием ИТ сервисов вокруг этого.
Писал внутренний аналитический софт на крупном ювелирном заводе, работал DS инженером в региональной ритейл сети. Делал ML модели персонализации для AVITO Работа.
Основной стек: Python, Pandas, PyTorch, Keras, SQL, ClickHouse, PySpark.
Образование:
Механико-математический факультет Московского Государственного Университета (МГУ)
Otus Certified Educator
Преподаватель
Более 15 лет занимется прикладой математикой и мат. моделированием НИИгазэкономика ПАО Газпром.
Руководил командой̆ 20+ человек, решающей прикладные задачи, вывод готовых моделей в продакшн и поддержку решений у клиента.
Разрабатывал модель развития и прогнозирования технического состояния газотранспортной системы ПАО Газпром.
Образование:
кандидат наук физико-математических наук, Теоретическая физика, Московсский государственный университет (МГУ)
Otus Certified Educator
Преподаватель
Эксперт по компьютерному зрению и глубокому обучению, дипломированный инженер-программист и кандидат физ-мат наук.
С 2012 по 2017 занимался распознаванием лиц в компании WalletOne, чьи решения поставлялись для бизнеса в странах Южной Африки и Европы. Участвовал в стартапе Mirror-AI, где руководил командой компьютерного зрения. В 2017 стартап прошел Y-combinator и получили инвестиции для создания приложения в котором пользователь может реконструировать свой аватар по селфи. В 2019 участвовал в британском стартапе Kazendi Ltd., в проекте HoloPortation. Цель проекта - реконструкция 3D-аватаров для очков дополненной реальности HoloLens. C 2020 руководит командой компьютерного зрения в американском стартапе Boost Inc., который занимается видеоаналитикой в баскетболе для NCAA.
Преподаватель
Руководитель курса OTUS Математика для Data Science
Окончил МФТИ и Сколтех в 2018 году.
В данный момент работает исследователем в Skoltech Computational Intelligence Laboratory: пишет научные статьи в составе международной коллаборации, занимается коммерческими проектами по темам машинного обучения и вычислительной линейной алгебры.
Имеет большой опыт в преподавании: почти 10 занимался организацией добровольной инициативы - многопрофильной летней школы-лагеря для школьников старших классов в Тульской области. На данный момент преподает в университете: ведет курс в ВШЭ по теории вероятностей и статистике на английском языке.
Профессиональные интересы: оптимизация, линейная алгебра, статистика, uncertainty quantification, обучение с подкреплением, регрессионный анализ, планирование эксперимента.
Нравится учиться, преподавать, доносить сложные вещи понятным языком, взаимодействовать с людьми, размышлять о природе вещей, явлений и концепций.