ML Developer в команду Поиска

Мы ищем middle- или senior-разработчика, который будет работать над одним из направлений поиска.
Вам предстоит регулярно создавать новые модели ранжирования, которые системно улучшают качество поиска, а также задействовать полный стек технологий: Big Data, ML, бэкенд, аналитику.
Напишите нам, даже если про вас только один из этих пунктов, а по остальным вы готовы развиваться:

• высокий уровень навыков программирования;
• отличные знания алгоритмов и структур данных;
• умение грамотно использовать алгоритмы машинного обучения;
• опыт работы с фреймворками Big Data;
• сильная математическая база.

В работе мы применяем:

• Hadoop, Spark, Kafka и другие технологии из мира Big Data, которые готовим на Scala;
• PyTorch и другие инструменты для анализа контента и работы с нейронными сетями;
• Python и широкий стек библиотек для задач машинного обучения и аналитики;
• свой диалект PHP с расширениями для эффективной работы с системами.

Наш принцип — работать небольшими итерациями, начиная с самых простых решений. Такой подход позволяет быстро и эффективно справляться с поставленными задачами.

Примеры задач, с которыми наша команда сталкивается ежедневно

Поисковые системы:

• какие люди будут интересны пользователю — друзья или знаменитости, что сейчас хочет пользователь — подружиться или узнать информацию о звезде;
• как провести кластеризацию и классификацию пользователей и авторов по интересам, как классифицировать исходные документы;
• какое видео сейчас хочет увидеть пользователь — фильм или трейлер, сериал или видеоклип;
• нужно ли прямо сейчас включить трек Полины Гагариной или лучше показать сообщество певицы для подписки;
• что важнее пользователю — возможность быстро купить товар или изучить его характеристики;
• как понять, что именно хочет найти пользователь.

Ранжирование:

• что такое «счастье» пользователей, авторов и контентной платформы, как его точно измерить даже при небольших изменениях;
• какие факторы влияют на то, что нравится и не нравится пользователю;
• как собрать данные для обучения модели;
• как найти мощные модели ранжирования, которые способны работать под большой нагрузкой;
• как корректно проводить тестирование новых функций в системе, учитывая очень разный пользовательский опыт.

Инфраструктура:

• как эффективно собирать, хранить и обрабатывать терабайты данных каждый день, а также масштабировать машинное обучение под такой объём информации;
• как быстро узнавать о проблемах и их причинах;
• как понять, что поисковая система работает корректно;
• как сделать онлайн-ранжирование быстрее и производительнее.

Богдан Гаркушин, руководитель команды поиска:

«У нас высокая культура работы с данными, продуманная инфраструктура и невероятно крутые коллеги. Мы вместе генерируем идеи, проводим эксперименты, выкатываем в прод только то, что дало результаты, и постоянно расширяем свой кругозор».

Мы предлагаем:

• интересные и сложные задачи на стыке разных областей знаний;
• свободу в формировании гипотез и возможность проверить невероятные идеи;
• минимальную бюрократию и максимальную скорость разработки;
• возможность быстро прокачать навыки;
• работу с лучшими специалистами в своих направлениях, чемпионами мира по программированию, кандидатами технических наук и перспективными талантами;
• уровень зарплаты, который зависит только от ваших знаний и трудоспособности;
• ДМС, чтобы лечиться в удобное время и без лишних трат.

Ждём ваших откликов. Удачи!

Tell us about yourself

Резюме:
Full name:
Phone number:
Email:
Дополнительные сведения: