Machine learning engineer ( intern ), Санкт-Петербург
В проект Антиспам компании Одноклассники ищем специалистов по machine learning. Наша команда разработчиков делает безопасным не только портал Одноклассники, но и другие бизнес юниты Mail.ru, поэтому скучно не будет, так как мы решаем задачи из абсолютно разных доменных областей. В команде мы в основном практикуем end-to-end решения задач, поэтому предполагается, что кандидат не боится "испачкать руки" в продакшен коде.
Наш стек:
Языки: Python, Java, Scala;
Технологии которые часто используем в работе: PyTorch, DVC, MlFlow, Hadoop,Spark, Airflow, Kafka.
Примеры того, чем мы занимаемся:
Детекция спама, ботов и NSFW контента;
Автоматизация восстановления профиля на основе распознавания лиц и жестов;
Поиск дубликатов;
ML инфраструктурой и процессами;
Модерацией в ОК и Юле.
Задачи
- поиск мошенников, используя поведенческие данные и контентные признаки;
- анализ данных карточек товаров (картинки/текст) для автомодерации и дополнительных признаков для других детекторов.
Требования
- уверенные навыки в программирования на Python и хотя бы одном статически типизированном языке;
- хорошие знания базового ML;
- понимание современного состояния NLP, и умение использовать базовые вещи(word2vec, cnn, эмбеддинги, faiss).
Будет плюсом
- Опыт оптимизации DL решений на инференс;
- Уметь прочитать, а затем воспроизвести в коде статью;
- Работа с современным BigData стеком (Hadoop/Spark/Airflow);
- Опыт применения DevOps практик в контексте разработки ML моделей;
- Опыт применения ML в cybersecurity и общее представление об этой сфере.
Мы предлагаем
Одноклассники
Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок.