Data scientist/Machine learning engineer в Команду CoreML

Сейчас мы ищем junior-, middle- или senior-разработчика, которому предстоит работать над одним из этих направлений. Нужно будет задействовать полный стек технологий: BigData, ML, Backend, аналитику.

Напишите нам, даже если про вас — только один из этих пунктов, а по остальным вы готовы развиваться:

- высокий уровень навыков в программировании;
- отличные знания алгоритмов и структур данных;
- умение грамотно использовать алгоритмы машинного обучения;
- навыки работы с фреймворками Big Data;
- сильная математическая база.

В работе мы применяем:

- Hadoop, Spark, Kafka и другие технологии из мира Big Data, которые мы готовим на Scala;
- PyTorch и другие инструменты для анализа контента и работы с нейронными сетями;
- Python и широкий стек библиотек для задач машинного обучения и аналитики;
- свой диалект PHP с расширениями для эффективной работы с системами.

Наш принцип — работать небольшими итерациями, начиная с самых простых решений. Такой подход позволяет быстро и эффективно справляться с поставленными задачами.

Примеры задач, с которыми наша Команда сталкивается ежедневно

Рекомендательные системы:

- какие авторы будут интересны пользователю и как найти для создателей контента новую аудиторию;
- как факторизовать разрежённую матрицу с миллиардами значений;
- как провести кластеризацию и классификацию пользователей и авторов по интересам;
- как рекомендовать друзей на основе анализа гигантского социального графа и других данных о пользователе;
- как кластеризовать вершины в графах, если их там сотни миллионов;
- как обеспечить новизну и разнообразие рекомендаций.

Ранжирование:

- что такое «счастье» пользователей, авторов и контентной платформы, как его точно измерить даже при небольших изменениях;
- как построить функцию потерь, которая наиболее точно соответствует «счастью»;
- какие факторы влияют на то, что нравится и не нравится пользователю;
- как собрать данные для обучения модели;
- как найти мощные модели ранжирования, которые способны работать под большой нагрузкой;
- как корректно проводить тестирование новых функциональностей в системе с сильным сетевым эффектом.

Инфраструктура:

- как эффективно собирать, хранить и обрабатывать терабайты данных каждый день, а также масштабировать машинное обучение под такой объём информации;
- как быстро узнавать о проблемах и их причинах;
- как понять, что рекомендательная система работает корректно;
- как сделать онлайн-ранжирование быстрее и производительнее;
- как построить инфраструктуру, чтобы нейронные сети могли обрабатывать весь контент, который загружается ВКонтакте.

Андрей Якушев, руководитель команды CoreML:
«В Команде CoreML высокая культура работы с данными, хорошая продуманная инфраструктура и невероятно крутые коллеги. Мы холиварим, разбирая идеи, выкатываем в прод только лучшие и постоянно расширяем свой кругозор».

У нас интересно, потому что:
Наши решения используются в разных сервисах ВКонтакте, в том числе в рекламе, бэк-офисе и антиспаме. Вы сможете самостоятельно придумывать и реализовывать обновления, которыми будет приятно пользоваться вам, вашим друзьям и ещё миллионам людей.

Мы предлагаем:

- интересные и сложные задачи на стыке разных областей знаний;
- минимальную бюрократию и максимальную скорость разработки;
- возможность быстро прокачать свои навыки;
- работу с лучшими специалистами в своих направлениях, чемпионами мира по программированию, кандидатами технических наук и перспективными талантами;
- офис в историческом центре Санкт-Петербурга;
- уровень зарплаты, который зависит только от ваших знаний и трудоспособности
- ДМС, чтобы лечиться в удобное время и без лишних трат.

Tell us about yourself

Резюме:
Full name:
Phone number:
Email:
Дополнительные сведения: