Data-инженер (команда Big Data Infrastructure), Санкт-Петербург

Data-инженер (команда Big Data Infrastructure), Санкт-Петербург

Мы занимаемся развитием и поддержкой платформы Big Data на vk.com. Она построена как на проверенных решениях с открытым исходным кодом (Hadoop, Kafka, Spark, Zeppelin), так и на собственных разработках, заточенных под работу 24/7 в условиях высоких нагрузок.

Самая большая социальная сеть России - самая большая Big Datа!

Kafka: ~1PB
HDFS: ~50PB
Clickhouse: ~3PB (nvme)

Для нас важно отлично разбираться в любом из этих инструментов. Любим Spark. Пишем на любых языках, но особенно на Java/Scala и Python.

Стек: Hadoop, HDFS, Kafka, Spark, Zeppelin, Airflow, Zookeeper, Clickhouse, Python, Java, Scala. 

Задачи

  • развивать платформу хранения и обработки больших данных;
  • внедрять новые инструменты для анализа данных и машинного обучения; 
  • решать задачи производительности и отказоустойчивости инфраструктуры Big Data;
  • строить новые и оптимизировать существующие ETL-процессы.

Требования

  • хорошее знание Java/Scala, Python;
  • знание принципов работы баз данных, распределенных систем хранения и обработки данных;
  • опыт работы и понимание внутреннего устройства: Hadoop, HDFS, Kafka, Spark, Zeppelin, Airflow, Zookeeper, Clickhouse.

Мы предлагаем

Гибкий график работы
Бонусы и скидки от партнеров
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Формат работы

комбинированный
дистанционный

Уровень

senior

График работы

полный

ВКонтакте

ВКонтакте — один из самых высоконагруженных проектов рунета. В сутки у нас бывает до 30 релизов и 125 миллиардов запросов к API. Всё это вытягивает небольшая команда разработчиков, где каждый — суперпрофессионал, который нашёл интересные для себя задачи. 

Мы предлагаем

Гибкий график работы
Бонусы и скидки от партнеров
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Похожие вакансии

Программист-исследователь в команду Пульс

Рекомендательные сервисы
Москва, гибкий

Аналитик по монетизации

Рекламные технологии
Москва, офисный

Data Engineer

Data office
Москва, гибкий

Data Scientist (проект "Дискуссии")

Одноклассники
Санкт-Петербург, офисный

SRE в группу эксплуатации больших данных (Hadoop)

ВКонтакте
дистанционный

Аналитик / Data Scientist R&G

myTarget: рекламная платформа VK
Москва, офисный

Руководитель команды Big Data Infrastructure

ВКонтакте
Санкт-Петербург, гибкий

Руководитель отдела машинного обучения

myTarget: рекламная платформа VK
Москва, офисный

Java/Scala разработчик

Поиск
Москва, гибкий

Big Data Platform Engineer

Одноклассники
Санкт-Петербург, гибкий

ML Engineer в команду Поиска (ВКонтакте)

ВКонтакте
Москва, гибкий

Системный администратор (DWH)

Технический департамент
дистанционный

DWH инженер

MY.GAMES Business Solutions
Москва, гибкий

Пресейл-архитектор (BigData и MPP-системы)

VK Cloud
Москва, гибкий

DevOps инженер

Технический департамент
Москва, гибкий

Data engineer в команду Почта

Почтовые сервисы
Москва, гибкий

Data Analyst (команда автоматизации ML-процессов)

ВКонтакте
Москва, комбинированный

Data Scientist (Антиспам)

Одноклассники
Санкт-Петербург, гибкий

Hadoop Infrastructure Engineer

Голосовые технологии (Маруся)
Москва, офисный

Руководитель команды машинного обучения (ВК видео)

Медиапроекты
Москва, гибкий

Python-разработчик

Поиск
дистанционный