Data engineer (Data Science platform), Москва

Задачи

  • развитие платформы хранения и обработки больших данных;
  • внедрение новых инструментов для анализа данных / машинного обучения;
  • разработка сервисов облегчающих работу data-science-специалистов;
  • решение различных задач связанных с производительностью и отказоустойчивостью big-data-инфраструктуры;
  • создание новых и поддержка рабочих пайплайнов - MapReduce, Spark, Samza;
  • взаимодействие с командами DataScience и SRE;
  • написание новой и дополнение уже имеющейся документации.

Требования

  • готовность к самостоятельному обучению и постоянному развитию;
  • понимание принципов работы локальных сетей и основных сетевых сервисов;
  • знания принципов работы баз данных и распределенных систем хранения и обработки данных;
  • знание Bash/Python для автоматизации процессов и Java/Scala для поддержки ETL и внедрения новых сервисов;
  • опыт администрирования GNU/Linux, сборки пакетов и понимание принципов заложенных в Kerberos/SSL;
  • опыт работы с системами мониторинга и инструментами для сбора метрик;
  • опыт работы с со свежими версиями продуктов фонда Apache: Hadoop, Kafka, Spark, Zeppelin, Airflow, Zookeeper.

Технологический стэк: hadoop-3.1.x / kafka-2.4.x / spark-2.3.x / airflow-1.10.x / zeppelin-0.8.x / zookeeper-3.6.x.

Мы предлагаем

Официальная зарплата
Гибкий график работы
Офис в центре города
ДМС
Бонусы от партнеров
Интересные задачи

Одноклассники

Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок. 

Похожие вакансии

Поиск, Москва

linux QA manual

Инженер по тестированию

Mail.ru Cloud Solutions, Москва

python linux kubernetes

Python-разработчик в команду IaaS

Одноклассники, Санкт-Петербург

DevOps linux

Системный администратор Linux

Рекламные технологии, Москва

DevOps hadoop linux SRE

DevOps-инженер

Mail.ru Cloud Solutions, Москва

python linux MySQL kubernetes

Руководитель команды IaaS

WhaleKit, Москва

DevOps linux unix kubernetes NoSQL

DevOps / Unix-системный администратор

Mail.ru Цифровые Технологии, Москва

linux MySQL PostgreSQL bash

Teamlead DevOps команды

Одноклассники, Санкт-Петербург

java hadoop

Hadoop developer (Big Data- аналитик)

Рекламные технологии, Москва

python linux

Инженер по автоматизации тестирования (Python)

Mail.ru Group, Москва

python java hadoop DWH management

Руководитель команды разработки DWH платформы

Instant Messengers, Москва

c++ linux

С++ разработчик

Одноклассники, Москва

linux bash

DevOps инженер / системный администратор Linux

Юла, Москва

c++ linux

C++ разработчик

Tarantool, Москва

c++ linux

С разработчик

Эксплуатация Unix, Москва

python linux MySQL PostgreSQL kubernetes

Инженер доступности сервисов / SRE

Mail.ru Group, Москва

python c++ linux

C++ Developer (Карты)

Mail.ru Group, Москва

python DevOps linux PostgreSQL bash jenkins kubernetes

DevOps / SRE (Геосервисы)

myTarget: рекламная платформа Mail.ru Group, Москва

python linux SQL

Инженер по автоматизации тестирования

Рекламные технологии, Москва

python bigdata hadoop

Senior Big Data Engineer в AdTech-направление

Mail.ru Cloud Solutions, Москва

python go linux openstack algorithms

Python/Go-разработчик в команду PaaS

Tarantool, Москва

c++ lua linux

Разработчик решений

Технический департамент, Москва

python linux

Team lead в в группу Автоматизации

MY.GAMES, Москва

python DevOps hadoop unix MySQL PostgreSQL bash NoSQL

DevOps-инженер

MY.GAMES, Санкт-Петербург

java linux backend

Java-разработчик

Delivery Club, Москва

hadoop ETL

Data Engineer

Pixonic, Москва

DevOps linux SRE

DevOps инженер

Mail.ru Cloud Solutions, Москва

python linux MySQL kubernetes openstack

Системный администратор/SRE

VK Pay, Москва

python linux PostgreSQL

Python разработчик

E-Com платформа, Москва

DevOps linux bash kubernetes

DevOps-инженер

Одноклассники, Санкт-Петербург

python java hadoop scala

Data Scientist (Спам-детекшн)

ИнПлат Технологии, Москва

linux PostgreSQL kubernetes

DevOps-инженер

Одноклассники, Москва

java hadoop SQL ETL

Data Engineer

Mail.ru Cloud Solutions, Москва

python c++ go linux

Руководитель группы разработки PaaS