data science

Инженер-разработчик Data Science (проект "Лента"), Санкт-Петербург

Одноклассники

Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок. 

Мы расширяем нашу молодую и горячую DS-команду и ищем человека, который будет участвовать в  разработке сервисов "Ленты" и "Дискавери". Если ты эксперт в CV/NLP или умеешь качественно шатать таблички в Big Data стеке и понимаешь бизнес, то для тебя тоже найдутся задачи.

Лента - это сервис с десятками миллионов DAU на всех платформах (web, mob.web, android, ios). Это ключевая часть социальной сети, в которой пользователи получают всю информацию, на которую они подписались: контент друзей, фото, посты и видео из сообществ, дружбы и т.д.

Дискавери - сервис с миллионами DAU, в котором пользователю рекомендуется контент, исходя из его предпочтений с помощью различных моделей машинного обучения и не только.

В задачу сервисов входит не только отобрать интересный контент пользователю, но и сделать это быстро.  Для решения этих задач мы используем гибкую систему экспериментов, в которых задействованы различные алгоритмы ML. Для обеспечения быстродействия и отказоустойчивости у нас поднято более 600 инстансов в трех датацентрах. 

Задачи

Рекомендательные системы:

  • автороцентричное ранжирование;
  • реалтайм адаптация к текущим интересам пользователя;
  • как сделать рекомендации разнообразными;
  • участвовать в создании новых контентных фичей с помощью  компьютерного зрения и текстовой генерации;
  • автоматический поиск и оценка перспективных создателей контента.

Ранжирование:

  • как измерять и влиять на "счастье" пользователей;
  • как оптимизировать системы так, чтобы были счастливы и создатели и потребители контента;
  • как корректно проводить тестирование новых функциональностей в системе с сильным сетевым эффектом.

Требования

  • умение прочитать, а затем воспроизвести в коде статью;
  • опыт в разработке рекомендательных систем;
  • опыт промышленной разработки на Java/Scala/Python;
  • опыт работы с современным BigData стеком (Hadoop/Spark/Airflow).

Будет плюсом

  • опыт применения DevOps практик в контексте разработки ML моделей;
  • знание основных нейросетевых архитектур в CV/NLP.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Бонусы от партнеров
Интересные задачи