Как стать автором
Обновить
18.32
Рейтинг

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Сначала показывать
Порог рейтинга

Сравнение FineBI и Power BI

Big Data *Визуализация данных *Хранение данных *Хранилища данных *

За последнее время, на рынке BI-услуг все чаще можно услышать упоминание нового игрока в лице китайской компании FanRuan.

Основанная в 2006 году, она является китайским лидером в продвижении систем бизнес-анализа в массы, с 15% долей локального рынка и более чем 15 тысяч клиентами.

Производитель китайского BI-решения, представляет продукт Fine BI как удобный инструмент для Self Service BI-анализа, способный стать заменой такому мировому гиганту как PowerBI, в сравнении с которым он будет сегодня рассмотрен более подробно.

Читать далее
Рейтинг 0
Просмотры 429
Комментарии 1

Новости

Сравнение FineBI и FineReport

Big Data *Визуализация данных *Хранение данных *Хранилища данных *

Китайский производитель BI-решений FanRuan постепенно открывает для мирового рынка свои передовые разработки в сфере бизнес-анализа. Однако FineBI далеко не единственный продукт, предлагаемый компанией. Сегодня разберем подробнее, что из себя представляют FineBI и другой продукт анализа данных FineReport, рассмотрим их главные сходства и различия.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 893
Комментарии 1

Электроэнергия и дата центры

Блог компании ua-hosting.company Хранилища данных *Энергия и элементы питания
Перевод
Как получить точные данные об использовании энергетических ресурсов — и почему они нам так важны.

Эта зима будет тяжелой, все будут контролировать расход электроэнергии внимательней, так как тарифы резко выросли. Центры обработки данных будут задумываться о том, смогут ли они по-прежнему получать прибыль при росте цен на электричество, уже даже есть как минимум две компании, занимающиеся дата центрами, которые закрылись в Великобритании и Ирландии, а причиной тому стал энергетический кризис.

Но как же быть с более важным вопросом? Как влияет весь сектор дата центров на мировое энергопотребление?

Большинство сотрудников компаний пожимая плечами ответят, что их объекты потребляют «около 2% электроэнергии в мире». Если уточнить, почему такая цифра, они заявят, что данные взяты с газетной статьи, аналитической компании или из слайд-деска их собственного отдела маркетинга. При этом они могут сказать, что якобы энергопотребление центров обработки данных находится на прежнем уровне благодаря виртуализации и облачным технологиям.

Однако есть и еще категория людей, считающих, что на самом деле, цифра более высокая и что в некоторых странах центры обработки данных потребляют 7% и более электроэнергии, а к 2030 году будут использовать около 51% от мирового объема.

Но все эти аргументы не очень хороши для дискуссии, считает предприниматель и ученый Дэвид Миттон, который отслеживает эти данные по их истокам, чтобы понять, откуда берется такое расхождение в цифрах.

Это крайне ответственная работа, потому как неверные данные могут привести к ошибочным выводам.
Читать дальше →
Всего голосов 13: ↑12 и ↓1 +11
Просмотры 1.3K
Комментарии 0

Пожары в дата-центрах. Как выстроить надёжное резервирование?

Блог компании RUVDS.com Хостинг Серверное администрирование *Резервное копирование *Хранилища данных *

Когда 16 сентября 2022 года загорелся небоскрёб China Telecom со столбом пламени в десятки метров и взрывами, то первым делом возник вопрос — что так сильно горит в 42-этажном офисном здании? Вскоре выяснилось, что здание не совсем офисное. Оказалось, на нескольких этажах размещался ЦОД. А все мы знаем, что по правилам резервирования Tier 2 дата-центр обязан хранить запасные энергоносители на случай отключения основного питания.

Что такое «запасные энергоносители»? Это могут быть заряженные аккумуляторы, ну, или дизельное топливо…
Читать дальше →
Всего голосов 43: ↑42 и ↓1 +41
Просмотры 6.7K
Комментарии 7

«Нулевой» локальный диск. Как запустить облако только с сетевыми дисками и приручить Ceph

Блог компании Selectel IT-инфраструктура *Хранилища данных *Облачные сервисы *IT-компании

Компания AWS, которая создавала собственное облако, выпустила в релиз сетевые диски, или Elastic Block Storage, еще в 2008 году. Но российские провайдеры долгое время эксплуатировали только локальные диски, которые были просто частью односложных VDS.

Облако Selectel при этом стартовало сразу с сетевыми дисками — локальных не было от слова совсем. Чем хороши сетевые диски, почему именно Ceph и когда в виртуалки вернулись локальные диски, рассказал директор по развитию ядра облачной платформы Иван Романько.
Читать дальше →
Всего голосов 19: ↑19 и ↓0 +19
Просмотры 2.8K
Комментарии 7

Развертываем облачное хранилище NextCloud AIO на Windows в Docker для дома

Системное администрирование *Nginx *Apache *Хранилища данных *Облачные сервисы *
Tutorial

Пробуем поставить Opensource облачное хранилище NextCloud для повседневного пользования на домашний компьютер с ОС Windows. Подробный гайд.

В этой статье:
Анализ целесообразности развертывания облака дома. Поэтапная настройка. Проблемы и технические решения. Плюсы и минусы NextCloud. Запуск NextCloud в Docker. Подробный разбор параметров контейнера NextCloud AIO. VPN-тоннель домой с использованием сервиса Hamachi. Обход проблемы отсутствия белого ip. Настройка reverse-proxy на базе Nginx, Apache или Caddy. Запуск HTTPS-сервера на домашнем компьютере. Получение SSL-сертификата с помощью сервиса letsencrypt. Краткий разбор форматов SSL-сертификатов. Настройка файервола в Windows.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 3.4K
Комментарии 7

Everything Bagel, часть II: версионные таблицы озера данных в lakeFS и Trino

Блог компании VK Big Data *Хранилища данных *DevOps *Kubernetes *
Перевод


Команда VK Cloud уже переводила статью о том, как развернуть локальный стек данных с помощью инструмента Everything Bagel. Теперь переводим вторую часть, в которой на практике разбираем, как выполнять запросы к разветвленным данным lakeFS через механизм распределенных запросов Trino.
Читать дальше →
Всего голосов 20: ↑20 и ↓0 +20
Просмотры 475
Комментарии 0

Особенности построения хранилища данных на базе ClickHouse в Yandex Cloud

Блог компании Neoflex Анализ и проектирование систем *Big Data *Хранилища данных *Облачные сервисы *

В данной статье делимся опытом внедрения решения на базе СУБД ClickHouse и сервисов Yandex Cloud. Мы не коснёмся тонких настроек ClickHouse или его масштабирования, но затронем достаточно интересные на наш взгляд темы:

• как загружать данные из On-premise в облачный ClickHouse с использованием сервисов Yandex Cloud – Functions, Object Storage, Message Queue;

• как обрабатывать/преобразовывать данные в облачном ClickHouse – очищать и строить витрины; какие «подводные камни» нам встретились на этом пути.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 2.1K
Комментарии 7

На востоке растут облака: новосибирский дата-центр «Ростелеком-ЦОД» сегодня

Блог компании DataLine IT-инфраструктура *Хранение данных *Хранилища данных *Инженерные системы *

Нашему ЦОДу в Новосибирске исполнилось полтора года. За это время в дата-центре выросла зона доступности облака DataLine для заказчиков из Сибири и Дальнего Востока, а также появились новые услуги. Сейчас в новосибирском облаке размещаются почтовые сервисы, облачные диски клиентов, объектные хранилища, сервисы DBaaS, Kubernetes, сервисы ИБ, DR-площадки и резервные копии. 

В фоторепортаже из Новосибирска посмотрим, как работает дата-центр сегодня.

Погулять по ЦОДу
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 1.7K
Комментарии 14

Готовим приватные репозитории с помощью Artipie

Open source *Java *IT-инфраструктура *Хранилища данных *DevOps *
Из песочницы
Tutorial

Многочисленные санкционные ограничения могут стать преградой для использования существующих систем управления бинарными репозиториями, например, при приобретении необходимых лицензий. Таким образом, альтернатива существующим инструментам может сыграть положительную роль при организации работы с артефактами организации.

Artipie - это бесплатный менеджер бинарных репозиториев с открытым исходным кодом, поддерживающий все основные форматы пакетов и артефактов, который позволяет размещать их локально или в облачном хранилище.

Заготовить репозитории на "зиму"
Всего голосов 3: ↑2 и ↓1 +1
Просмотры 1.7K
Комментарии 3

Особенности бинарных систем в Notion на примере Zettelkasten

Интерфейсы *Хранение данных *Хранилища данных *
Из песочницы

Статья описывает особенности настройки фильтрации шаблонов записей в базу данных Notion в бинарной системе Zetteskastena

Читать далее
Всего голосов 9: ↑6 и ↓3 +3
Просмотры 1.8K
Комментарии 2

Как объединить два корпоративных хранилища так, чтобы не перессориться со всеми

Блог компании Газпромбанк Хранение данных *Хранилища данных *

Корпоративное хранилище в ГПБ существует с девяностых. Тогда оно создавалось исключительно под задачи регуляторной и текущей отчетности. Соответственно и архитектура была такой, чтобы соответствовать требованиям этих задач

Изначально мы использовали SAP ASE. В нем была реализована довольно сложная бизнес-логика, и все работало довольно неплохо, но старая система не потянула бы расширение, не хватало производительности. Также были пробелы и в документировании — из-за огромного легаси, о котором даже спросить было некого.

По мере развития IT-ландшафта и появления новых систем, росли требования заказчиков, ставились новые задачи. В 2009 году стало понятно, что надо менять подход к работе с КХД, аналитическую платформу и инструменты по работе с хранилищем. Выбрали новые: SAP IQ, а в качестве «интеллекта» — DataStage (тогда он еще не принадлежал IBM). 

Перед командой стояла задача создать объединенное хранилище данных, не порушив при этом работу всех систем. Эта история о том, как команда Газпромбанка сумела незаметно перетащить потребителей со старого хранилища на новое.

Читать далее
Рейтинг 0
Просмотры 1.2K
Комментарии 0

15 самых распространенных проблем с качеством данных (и способы их решения)

Блог компании VK Big Data *Машинное обучение *Хранилища данных *DevOps *
Перевод


Команда VK Cloud перевела статью о 15 самых популярных проблемах с Data Quality и способах их смягчения или даже полного избегания.

1. Неполные данные


Эта проблема самая распространенная. При ее возникновении в ключевых столбцах не хватает информации, либо содержатся неправильно выполненные задания ETL или данные, которые негативно влияют на дальнейшую аналитику. 

Решение. Внедрить контроль фреймворка для сверки данных. Он проверяет число записей, поступающих на разные уровни аналитики, и отправляет оповещение, если на каком-то уровне записей стало меньше.
Читать дальше →
Всего голосов 27: ↑26 и ↓1 +25
Просмотры 5K
Комментарии 4

SAP CAR: миграция чекового хранилища

Блог компании X5 Tech ERP-системы *Хранилища данных *

Привет, Хабр! Сегодня мы решили рассказать вам про очень значимую для Х5 систему и то, как мы искали ей замену. 

Система SAP POS DM обеспечивала нашу торговую операционную деятельность более 10 лет. В последнее время она перестала развиваться и теперь полностью снимается с поддержки. Рассказываем, как наши центры экспертизы по продуктам SAP реализовали проект по миграции функционала чекового хранилища на современное решение. 

Читать далее
Всего голосов 1: ↑0 и ↓1 -1
Просмотры 1.3K
Комментарии 6

От сбора до использования: как повысить Data Quality на всех этапах работы с данными

Блог компании VK Big Data *Машинное обучение *Хранилища данных *DevOps *
Перевод


Представьте, что у вас только что появилось классное озеро данных с прикольными пайплайнами, которые собирают данные со всей компании. А теперь представьте свой шок, когда команды бизнес-специалистов поймут, что в озере данных — не данные, а мусор. 

Команда VK Cloud перевела статью о том, как следить за данными на каждом этапе и повысить их качество для грамотного использования.
Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 1.7K
Комментарии 0

Все, что вам нужно знать об Airflow DAGs, ч.3.1 — Создание шаблонов

Python *PostgreSQL *Apache *Хранилища данных *Data Engineering *
Перевод

Все об использовании шаблонов в Airflow с примерами кода. Продолжение серии публикаций astronomer.io

Читать далее
Всего голосов 1: ↑0 и ↓1 -1
Просмотры 1.4K
Комментарии 0

Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG

Python *PostgreSQL *Apache *Хранилища данных *Data Engineering *

Поскольку Airflow — это на 100% код, знание основ Python - это все, что нужно, чтобы начать писать DAG. Однако написание эффективных, безопасных и масштабируемых DAG требует учета некоторых моментов, специфичных для Airflow. В этом разделе мы рассмотрим некоторые передовые методы разработки DAG, которые максимально используют возможности Airflow.

В целом, большинство лучших практик, которые мы здесь рассматриваем, относятся к одной из двух категорий:

Читать далее
Всего голосов 3: ↑0 и ↓3 -3
Просмотры 2.4K
Комментарии 4

Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики

Python *PostgreSQL *Apache *Хранилища данных *Data Engineering *
Перевод
Tutorial

Операторы являются основными строительными блоками DAG Airflow. Это классы, которые содержат логику выполнения единичной работы.

Вы можете использовать операторы в Airflow, создав их экземпляры в задачах. Задача определяет работу, выполняемую оператором в контексте DAG.

Чтобы просмотреть и выполнить поиск по всем доступным операторам в Airflow, посетите Astronomer Registry. Ниже приведены примеры операторов, которые часто используются в проектах Airflow.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 2.3K
Комментарии 0

Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания

Python *PostgreSQL *Apache *Хранилища данных *Data Engineering *
Перевод
Tutorial

Полное руководство по созданию DAG в Apache Airflow DAG, позволяющих создать конвейер данных из разных источников, запускаемый в определенные периоды времени с заданной логикой. Первая часть. Источник: DAGs: The Definitive Guide от astronomer.io

Добро пожаловать в полное руководство по Apache Airflow DAG, представленное командой Astronomer. Эта электронная книга охватывает все, что вам нужно знать для работы с DAG, от строительных блоков, из которых они состоят, до рекомендаций по их написанию, динамической генерации, тестированию, отладке и многому другому. Это руководство, написанное практикующими для практикующих.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 4.4K
Комментарии 0

LINSTOR — это как Kubernetes, но для блочных устройств (обзор и видео доклада)

Блог компании Флант Open source *Хранилища данных *DevOps *Kubernetes *

В июне я выступил на объединенной конференции DevOpsConf & TechLead Conf 2022. Доклад был посвящен LINSTOR — Open Source-хранилищу от компании LINBIT (разработчики DRBD). Основной идеей выступления было показать [на примере Kubernetes], как работает и устроен LINSTOR, какие проблемы решает, как его правильно настроить и использовать. Эта статья — основная выжимка из доклада (его полное видео см. в конце).

Читать далее
Всего голосов 41: ↑39 и ↓2 +37
Просмотры 6.2K
Комментарии 5

Вклад авторов