Выберите подходящий предустановленный шаблон
Для широкого спектра задач по обработке больших данных при помощи технологии MapReduce. Шаблон ориентирован на пакетную (batch) обработку данных.
Для параллельной обработки больших данных в памяти. Шаблон ориентирован на быструю обработку данных в режиме, близком к реальному времени.
HDFS, YARN, MapReduce2, Tez, Hive, HBase, Pig, ZooKeeper, Storm, Kafka, Spark2, Zeppelin Notebook, Sqoop, Oozie, Falcon, Flume, Accumulo, Ambari Infra, Ambari Metrics, Atlas, Knox, Log Search, Ranger, Ranger KMS, SmartSense, Spark, Druid, Kerberos, Mahout, Slider, Superset, Jupyter, Jupyter Hub, Airflow.
Вы можете создать кластер уникальной конфигурации для вашей задачи, подключив нужные модули.
Модули | Шаблон | ||
---|---|---|---|
Hadoop | Spark | Airflow | |
Airflow | X | ||
Ambari | X | X | |
HDFS | X | X | |
Hive | X | X | |
Jupyter | X | ||
Livy | X | ||
MapReduce2 | X | X | |
Oozie | X | X | |
Pig | X | X | |
Slider | X | ||
Spark2 | X | ||
Sqoop | X | X | |
Tez | X | X | |
YARN | X | X | |
Zeppelin | X | ||
ZooKeeper | X | X |
Apache Hadoop и Apache Spark — платформы с открытым кодом для надежной и быстрой обработки огромных объемов слабоструктурированных данных из разнородных источников.
Вы можете использовать Hadoop для анализа «озер данных» (data lake), индексации веб-сайтов, финансового анализа, научных исследований. Spark оптимален для создания шины микросервисов и анализа в реальном времени, например — сегментации посетителей сайтов, fraud detection, мониторинга транспорта.
ClickHouse — СУБД с открытым кодом, позволяющая мгновенно выполнять аналитические запросы в режиме реального времени на структурированных больших данных. Способна обрабатывать более миллиарда строк и десятков ГБ данных на один сервер в секунду.
У нас есть технологии и сервисы, которые помогают компаниям решать самые важные задачи