Data mining разработчик, Санкт-Петербург
Задачи
- В рамках проекта уже используются различные технологии: С++ для анализа мульти-медиа контента, Python для экспериментов, Java для реализации основных алгоритмов, а также Hadoop для обработки больших массивов данных в распределенном режиме.
- Из алгоритмов - это и разнообразные алгоритмы кластеризации, стохастические обходы графов, Фурье, SVD и т.д.
- Основной целью является интеллектуальный анализ данных портала (статистика активности, метаинформация, мульти-медиа контент и т.д.) и использование найденных корреляций для улучшения user experience (персонализация контента, рекомендации, поиск информации).
- Подробности см в статье "Big data: размер имеет значение?" на http://habrahabr.ru/company/odnoklassniki/blog/216401/
Требования
- Повышенный интерес к системам интеллектуальной обработки информации, методам их разработки и областям применения, знания и опыт приветствуются.
- Отличная математическая подготовка (непрерывный и дискретный анализ, теория вероятности и статистическая обработка данных, принципы работы алгоритмов и структур данных).
- Знакомство с принципами разработки промышленных высоконагруженных систем с широкой аудиторией (планирование, тестирование, внедрение), опыт Java программирование приветствуется.
- Креативный подход к работе и жизни, способность к обсуждению своих и чужих идей.
Мы предлагаем
Официальная зарплата
Гибкий график работы
Офис в центре города
ДМС
Бонусы от партнеров
Интересные задачи
Одноклассники
Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок.