Data Engineer, Москва

Data Engineer, Москва

Команда DWH агрегирует в себе накопленную экспертизу и лучшие практики холдинга в области построения хранилищ данных и аналитических приложений. Мы превращаем информационный хаос в четко организованную систему, которая позволяет собирать, обрабатывать и анализировать любые объемы данных. В нашей команде убеждены, что системы хранилищ данных должны максимально помогать людям — автоматизировать рутинные задачи, собирать и анализировать сырые данные, подготавливать почву для удобного и аргументированного принятия  решений.

Мы ищем BigData инженера, готового принять активное участие в разработке одного из крупнейших хранилищ группы компании: десятки петабайт данных, количество узлов кластера более 400, ежедневный прирост информации составляет десятки тб. В хранилище собрана информация большинства ключевых бизнес-юнитов компании, которая описывает поведение пользователей рунета: события посещений сайтов, клики\показы рекламы, использование мобильных приложений, профили соц.сетей пользователя, действия пользователей в соц.сетях и их публичные сообщения и т.д. Все это позволяет составить достаточно полную картину поведения пользователя во всех сервисах mail.ru и строить на полученных данных сложные математические модели.

Наш стек технологий включает, но не ограничивается:

  • Database Systems: MySQL, Tarantool, ClickHouse.
  • Hadoop: Hive, Spark, MapReduce, Kafka.
  • DataFlow / ETL: Luigi, Airflow.
  • Business Inteligence: Tableau,  Redash, SuperSet.
  • Continuous Integration: Jenkins, GitLab CI.
  • IssueTracking / KnwoledgeBase : Jira, Confluence.
  • Monitoring: Sentry, Graphite, Grafana, Prometheus, Telegraf.

Задачи

  • Участие в роли BigData Engineer в проекте построения системы обработки и хранения разнородной информации из различных бизнес-юнитов компании на базе Hadoop (BigData DWH);
  • Исследование большого объема необработанных данных, накопленных в компании;
  • Построение и оптимизация нетривиальных ETL процессов обработки больших данных, участие в построении процессов потребления данных на всех этапах, их трансформации от появления информации в конкретном Бизнес Юните до монетизации полученных знаний;
  • Взаимодействие с командой Data Scientist и совместная реализация стабильного расчета математический моделей;
  • Поддержка и модификация созданного решения, ответственность за доступность сервиса для внутренних потребителей и корректность предоставляемых для принятия решений данных.

Требования

  • Не менее года релевантного опыта работы;
  • Опыт работы с большими объемами данных, понимание стека технологий hadoop, глубокое знание Spark или Hive (плюсом будет знание Java, Scala в контексте обработки больших данных);
  • Опыт организации ETL процессов обработки данных (плюсом будет знание code-driven ETL Luigi, Airflow);
  • Знание классических алгоритмов и структур данных (плюсом будет опыт разработки на python);
  • Знания в области теории обработки и хранения информации;
  • Ссылки на публичные репозитории, статьи с примерами работы приветствуются.

Мы предлагаем

Гибкий график работы
Бонусы и скидки от партнеров
Офис в центре города
ДМС
Профессиональная команда

Формат работы

комбинированный
дистанционный

Уровень

middle
senior

График работы

полный

Рекламные технологии

AdTech — направление объединяет рекламные продукты и инструменты для бизнеса VK, которые упрощают начало работы и ежедневное взаимодействие с рекламными кампаниями для любых категорий пользователей от начинающих предпринимателей до профессионалов маркетинга. 

Мы предлагаем

Гибкий график работы
Бонусы и скидки от партнеров
Офис в центре города
ДМС
Профессиональная команда

Похожие вакансии

Ведущий Python-разработчик в Scrooge

VK Cloud
дистанционный

Продуктовый аналитик

ВКонтакте для бизнеса
Москва, гибкий

Консультант по HR процессам (управление талантами)

VK tech
Москва, комбинированный

Аналитик данных (ОРД)

Рекламные технологии
Москва, гибкий

QA Automation/SDET (Python)

Tarantool
Санкт-Петербург, гибкий

Python разработчик RuStore

VK
Москва, гибкий

Junior Data Engineer

Одноклассники
Москва, гибкий

Старший Python-разработчик

VK tech
Москва, гибкий

Разработчик Python/Go

Почта
Москва, гибкий

Системный аналитик (DevPlatform)

VK Cloud
Москва, гибкий

Python-разработчик (Цифровой ассистент)

VK Assistant
Москва, гибкий

Инженер по автоматизации тестирования

VK Teams
Санкт-Петербург, гибкий

Системный администратор Linux / SRE (Мессенджеры)

Технический департамент
Москва, гибкий

Системный аналитик

VK tech
Москва, гибкий

Руководитель отдела информационной безопасности (cloud)

Технический департамент
Москва, гибкий

Python-разработчик Добро Mail.ru

Социальные проекты
Москва, комбинированный

Python-разработчик в команду Workspace

VK WorkSpace
Москва, гибкий

Data Scientist

PREDICT
Москва, комбинированный

Team Lead в отдел разработки NOC

Технический департамент
Москва, гибкий

Программист Python

VK Play
Москва, комбинированный

Аналитик (Платформа Данных)

VK Cloud
Москва, гибкий

Fullstack-разработчик

Data office
Москва, гибкий

Системный администратор Apple/MacOS

Технический департамент
Москва, гибкий

Big Data Platform Engineer

Одноклассники
Санкт-Петербург, гибкий

Python-разработчик

VK People Hub
Москва, комбинированный

Старший Python разработчик в команду BigData

VK Cloud
Москва, гибкий

Ведущий аналитик по монетизации

Почтовые сервисы
Москва, комбинированный

Python/Go-разработчик

PREDICT
Москва, гибкий

Machine Learning Engineer

VK
Москва, гибкий

Senior Data Scientist (поведенческие технологии)

Рекламные технологии
Москва, гибкий

FullStack-разработчик

Внутренняя информационная разработка
Москва, гибкий

DevOps-инженер

VK tech
Москва, комбинированный

Продуктовый аналитик

Рекламные технологии
Москва, гибкий

Senior QA Manual

myTarget: рекламная платформа VK
Москва, гибкий

Руководитель аналитики

Почта
Москва, гибкий

Инженер по автоматическому тестированию (backend) в Почту

Почта
Москва, гибкий

Ведущий Python-разработчик

myTarget: рекламная платформа VK
Москва, гибкий

Team lead на C++

myTarget: рекламная платформа VK
Москва, гибкий

Руководитель команды Big Data Infrastructure

ВКонтакте
Санкт-Петербург, гибкий

Разработчик в Tarantool

Tarantool
Москва, гибкий

QA Automation

VK Cloud
Москва, гибкий

Разработчик C++ (Новости)

Дзен
Москва, гибкий

Аналитик

Медиапроекты
Москва, гибкий

Продуктовый аналитик (ВК Видео)

ВКонтакте
Москва, гибкий

Инженер по тестированию (Cloud Storage)

VK tech
Москва, гибкий

Python-разработчик

Рекомендательные сервисы
Москва, гибкий

Системный администратор (DWH)

Технический департамент
дистанционный

Программист-исследователь (NLP)

Голосовые технологии (Маруся)
Москва, гибкий

Python-разработчик в команду Scrooge (VK CS)

VK Cloud
Москва, гибкий

Младший эксперт / Отдел DevSecOps

Информационная безопасность
дистанционный

Старший аналитик

Коммерческий департамент
Москва, комбинированный

Senior python-разработчик

VK Compliance
Москва, гибкий

Data Engineer

Одноклассники
Москва, гибкий

Программист-исследователь

Голосовые технологии (Маруся)
Москва, гибкий

Python разработчик в команду General Billing

VK Cloud
Москва, гибкий

Python разработчик в команду IaaS сервисы

VK Cloud
Москва, гибкий

Python разработчик в команду SDN IaaS

VK Cloud
Москва, гибкий

.NET - разработчик в команду IDM

Технический департамент
Москва, гибкий

Ведущий Python-разработчик в Scrooge в VK Cloud

VK Cloud
Москва, гибкий

Data Engineer

VK Cloud
Москва, гибкий

Администратор/Эксперт АБС Новая Афина

VK Pay
Москва, комбинированный

DevOps

Почта
Москва, комбинированный

Администратор в команду IDM

Технический департамент
Москва, гибкий

Тимлид группы аналитики Основной ленты

Дзен
Москва, гибкий

Продуктовый аналитик направления маркетинга

Дзен
Москва, гибкий

Team Lead в Проектный офис

VK tech
Москва, гибкий

QA Auto в ОРД

myTarget: рекламная платформа VK
Москва, гибкий

QA Automation/SDET

VK Cloud
Москва, гибкий

Системный администратор Linux / SRE

Технический департамент
Москва, гибкий

Руководитель команды DevPlatform

VK Cloud
Москва, гибкий

Аналитик (middle) в Музыку

ВКонтакте
Москва, гибкий

Разработчик

Tarantool
Москва, гибкий

Инфраструктурный Python разработчик в команду IaaS Network VK CS

VK Cloud
Москва, гибкий

Архитектор решений

VK
Москва, комбинированный

Product analyst R&D

ВКонтакте для бизнеса
Москва, гибкий

Руководитель отдела разработки инфраструктуры

Голосовые технологии (Маруся)
Москва, офисный

Инженер по информационной безопасности (Инфраструктура)

Информационная безопасность
Москва, гибкий

Data engineer

Data office
Москва, гибкий

Системный администратор Linux

Одноклассники
Санкт-Петербург, гибкий

Data scientist/Разработчик-исследователь (NLP)

Data office
Москва, гибкий

Руководитель команды Storage

VK Cloud
Москва, гибкий

Руководитель команды Compute

VK Cloud
Москва, гибкий

Python разработчик

VK Карты
Москва, гибкий

Аналитик / VK Карты

VK Карты
Москва, гибкий

Сервис инженер / SRE (Private Cloud)

VK Cloud
Москва, гибкий

Senior Go-разработчик

VK Teams
Москва, гибкий

Python-разработки в VK Customer Experience Hub

VK
Москва, гибкий

Руководитель команды VDI

VK Cloud
Москва, гибкий

Fullstack-разработчик (команда автоматизации внутренних процессов)

Технический департамент
Москва, гибкий

Python разработчик VK Музыка

ВКонтакте
Санкт-Петербург, гибкий

DevOps

VK tech
Москва, офисный

Solution architect

VK Compliance
Москва, гибкий

Продуктовый аналитик / VK Messenger

ВКонтакте
Москва, гибкий

Аналитик данных (внедрение единой CRM системы)

Коммерческий департамент
Москва, гибкий

Продуктовый аналитик

VK
Москва, гибкий

Data-инженер (команда Big Data Infrastructure)

ВКонтакте
Санкт-Петербург, гибкий

Data Engineer в группу машинного обучения

Рекламные технологии
Москва, гибкий

Аналитик

Голосовые технологии (Маруся)
Москва, гибкий

QA Automation

VK Compliance
Москва, гибкий

Python разработчик в команду BigData

VK Cloud
Москва, гибкий

Golang-разработчик в команду Calendar

Почта
Москва, гибкий

Golang-разработчик в команду SF Team

Почта
Москва, гибкий

Руководитель команды аналитики

ВКонтакте для бизнеса
Москва, гибкий

Data Scientist (Антиспам)

Одноклассники
Санкт-Петербург, гибкий

Старший разработчик машинного обучения (VK Видео)

ВКонтакте
Москва, гибкий