👀 Дизайнеры, с какой командой вы мэтчитесь по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

Data Scientist NLP

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Описание вакансии

О компании и команде

Мы развиваем собственную Data Science экспертизу и внедряем лучшие практики машинного обучения во все  производственные процессы.

Мы ищем  ML эксперта  на ряд  задач развития и лидирования направления  машинного обучения NLP

Что предстоит:

• имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
• эксперименты по созданию новых архитектур, оценка языковых моделей;
• работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
• адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
• задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;

• речевая аналитика (оценка качества работы операторов, формирование рекомендации);
• анализ обращений и отзывов;
• разработка чат-ботов;
• применение ML/DL на KG и базах знаний;
• тестирование данных, гипотез, моделей;
• доведение разработанной модели до вывода в production;
• плотно общаться с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
• разрабатывать system design решений;
• управлять полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.

Ожидания от кандидата

Мы ожидаем от кандидата:

• высшее техническое/математическое образование;
• опыт работы DS от 3 лет;
• понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
• опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
• опыт работы с языковыми моделями, понимание подходов к обучению LLM;
• хорошее понимание современных архитектур нейронных сетей;
• умение читать и разбирать статьи о новых архитектурах и подходах;
• понимание принципов обучения, тюнинга, оценки deep learning моделей;
• опыт отладки нейронных сетей и модификации архитектур или создания собственных;
• опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
• понимание принципов ведения разработки, ведения документации;
• умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
• способность самостоятельно делать R&D в новых темах;
• умение работать в команде и лидировать работу других;
• уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git

Условия работы

Мы предлагаем удаленный формат работы, выдаем технику и обеспечиваем возможность профессионального и карьерного роста по различным траекториям. 

Бонусы



• Конкурентную заработную плату: оклад + премии.
• Стимулирующие выплаты: к отпуску, по случаю рождения ребенка, вступления в брак, а также в сложных жизненных ситуациях.
• Хороший соцпакет (ДМС с первого месяца работы, льготы и скидки на фитнес, авиабилеты и др).
• Отпуск 33 дня.
• Дистанционную работу на территории РФ
• Отличный коллектив, высокий уровень компетенции коллег, постоянный обмен опытом.
• Возможность обучения за счет компании, участие во внутренних митапах и внешних конференциях.