Последние 6 лет работает с большими данными: строит системы для обработки данных, консультирует по вопросам построения аналитических решений.
До 2018 года руководил отделом инфраструктуры данных в Ostrovok.ru. Затем занимал аналогичную позицию в MaximaTelecom (один из проектов компании - публичная сеть Wi-Fi в метро Москвы). На данный момент является CDO AdTech-компании Квант.
Большой опыт работы с сервисами Hadoop (HDFS, Hive, Impala), оркестраторами (Airflow, Oozie), MPP-базами (Vertica, Kudu, Greenplum) и различными фреймворками для обработки данных (Spark, Flink).
Образование: МФТИ, факультет инноваций и высоких технологий по специальности прикладная математика и физика.
Более 10 лет развивает аналитику в компании. Среди достижений:
- Построение собственной системы сквозной вебаналитики;
- Построение аналитического хранилища на базе MPP Vertica;
- Организация процессинга данных на базе Spark, Kafka, HDFS;
- Выстраивание процессов работы с данными, включая data quality;
- Создание нескольких внутренних инстументов по работе и структурированию метаданных (Data Catalog);
- Построение системы корпоративной отчетности, в том числе realtime;
- Более 5 лет повышает Data Literacy внутри компании, проводя различные тренинги по работе с данными, инструментами, SQL;
Также вырастил несколько руководителей аналитики, которые теперь работают в крупных компаниях.
Основной фокус на понимании проблем бизнеса при работе с данными и их решение.
Выпускница магистерской программы “Informatique pour la Science de Données (Big Data)” университета Париж-Сакле.
Профессиональный опыт: 7 лет программирования на Python и Java. Последние 3 года специализируется на Scala и распределенной обработке больших данных. Участвует в проектах Big Data на 1000+ пользователей в крупных французских компаниях (Enedis, Groupama).
Участница Google Summer of Code 2016. Прошла сертификацию “Databricks Associate Developer for Apache Spark 2.4 with Scala 2.11”.
Закончила магистратуру в МГТУ им. Баумана в 2013 году, по специальности Программное обеспечение ЭВМ и информационные технологии, кафедра ИУ-7. Стаж работы более 10 лет. Успела поработать на разных языках программирования - C#, Java, Python, Scala. Большими данными занимаюсь с 2014.
Учавствовала в запуске множества проектов различной сложности - от небольших проектов с парной разработкой сервисов на Java, до больших сложных систем на базе Cloudera и Hortonworks для обратки петабайтов данных. Участвовала в проектах для операторов связи на территории России и СНГ. Разрабатывала внутренний инструментарий для решения задач в стеке Hadoop. Есть опыт работы практически со всем "зоопарком" Hadoop - hbase, hive, spark, oozie, impala, MapReduce, Kafka, YARN, Solr.
Опыт работы более 5 лет. Имею опыт работы в крупных компаниях, банковской сфере и стартапах. Начинал свой путь как разработчик и из разработки ушел в эксплуатацию и инженерию.
23 сертификата от IBM и 3 сертификата от Google
В работе предпочитаю использовать подход Source to Code и Infrastructure to Code, автоматизирую большую часть процессов и этапов при разработке и эксплуатации программного обеспечения
Закончил Bialystok University of Technology по направлению Computer Science - Bioinformatics
Веду IT-блог в instagram на странице devoopser.
Стэк технологий:
Cloud: IBM Cloud, AWS, Openstack
CI/CD: TeamCity+Octopus, Jenkins, Gitlab CI/CD
Containers: Docker, Openshift
Orchestration: Docker swarm, Kubernetes
OS: CentOS 7, Ubuntu, Alpine
Software provisioning: Ansible, Terraform
Scripts: bash, python
Monitoring: Prometheus+Alertmanager, LogDNA
Automated code review: Sonarqube
Закончил БГУИР по специальности "Программист. Бизнес-аналитик". Опыт промышленной разработки - 4.5 года. Программировал на Ruby, Elixir, JavaScript, Python. Начинал как веб-разработчик, потом перешёл в работу с данными. Занимался инжинирингом данных в сфере страхования и гэмблинга.
Специалист по машинному обучению и разработке (BigData). Работал в таких компаниях как Mail.Ru Group, Wamba, NVidia, Sber, Megafon, Техносерв Консалтинг, где реализовывал практические кейсы применения машинного обучения полного цикла - прогнозирование временных рядов, детектирование аномалий, системы анализа соц. медиа поля (NLP), рекомендательные системы в ритейле и тд, так и HighLoad практическая реализация этих кейсов в продуктивном окружении - Hadoop, Spark, Flink, Kafka и тд
Долгое время занимался преподаванием курсов по машинному обучению и технологиям BigData в таких организациях как тренинговый Центр Люксофт, ВШЭ