Программист-исследователь в команду Пульс, Москва
VK ищет специалиста в сфере машинного обучения и программирования middle+ уровня для развития рекомендаций в проекте Пульс. От кандидата ожидается наличие опыта работы с ML проектами.Команда занимается не только аналитикой и построением моделей, но и частичным внедрением их в боевые сервисы, программированием пайплайнов. Будет полезным наличие подобного опыта и интерес к ML engineering сфере.Большим плюсом будет наличие опыта работы с рекомендательными системами, понимание общих принципов улучшения качества, метрик.
Наша лента персональных рекомендаций расположена на главной странице Mail.ru, на сайтах и в приложениях партнеров, где ее ежедневно читают несколько миллионов человек (месячная аудитория превышает 70 млн) — поэтому все архитектурные решения являются распределенными и отказоустойчивыми, применяем разнообразные методы искусственного интеллекта и машинного обучения.
Стек технологий: Языки программирования: Python, базовые знания SQL обязательно; C++/Go будет плюсом. Технологии: Spark, Hadoop, Airflow, bash, Linux
Задачи
- реализация различных моделей рекомендаций;
- оценка этих моделей, проведение экспериментов;
- разработка пайплайнов для автоматизации построения моделей, внедрение в продакшен;
- чтение профильных статей, изучение sota решений;
- аналитика текущего качества рекомендательной системы, поиск возможностей для улучшения;
- объяснение, поиск причин проблемных случаев.
Требования
- знание классических алгоритмов и структур данных;
- уверенное владение Python;
- понимание принципов работы баз данных и очередей;
- знания и опыт в области анализа данных и машинного обучения;
- самостоятельность и умение комплексно решать задачи.
Мы предлагаем
Формат работы
Уровень
График работы
Рекомендательные сервисы
Рекомендательные сервисы представляют два проекта — Relap.io и «Пульс». Relap.io — это рекомендательно-рекламная система для новостных и контентных сайтов. «Пульс» — это рекомендательный сервис, который при помощи алгоритмов машинного обучения подбирает контент из множества разных медиа персонально для вас.