Как стать автором
Обновить
39.01

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Сначала показывать
Порог рейтинга
Уровень сложности

Лучшие практики при работе с мастер-данными

Время на прочтение 9 мин
Количество просмотров 702
Блог компании Магнит Анализ и проектирование систем *Big Data *Хранение данных *Хранилища данных *

Привет, меня зовут Павел Кардаш, я IT архитектор в «Магните». В этой статье хочу поделиться лучшими практиками в управлении мастер‑данными.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 2

Новости

Как мы упростили жизнь высоконагруженным сервисам с Platform V SessionsData. Часть 1

Время на прочтение 12 мин
Количество просмотров 540
Блог компании Сбер Анализ и проектирование систем *Хранилища данных *Облачные сервисы *Микросервисы *

Привет, Хабр! Меня зовут Андрей Чернов, я Java-архитектор микросервисов в СберТехе — компании, которая создала цифровую облачную платформу Platform V для разработки бизнес-приложений. Наша команда развивает продукт Platform V SessionsData — высокопроизводительное распределённое in-memory-хранилище для общего контекста сессионных и key-value-запросов, которое СберБанк Онлайн использует в качестве микросервиса на своей серверной стороне. Продукт актуален не только для решения задач СберБанка Онлайн: он доступен рынку и может использоваться для аналогичных целей в любых отраслях.

В статье расскажу, почему мы решили создать собственный микросервис, чем он нам помогает, а также как мы справлялись с нагрузкой СберБанка Онлайн. У статьи будет продолжение. Во второй части поговорим о том, как мы достигаем высокой доступности сервиса, а в третьей — какие доработки нужны нам, чтобы развивать Platform V SessionsData.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Цель есть, пришло время подумать о том, какой софт поставить на NAS

Время на прочтение 6 мин
Количество просмотров 4.1K
Блог компании Third Man Open source *IT-инфраструктура *Хранилища данных *

В данной статье мы попробуем исследовать альтернативные варианты использования NAS.

Также мы попытаемся составить расширенный план тестирования на первых NAS, собранных на китайских процессорах RK3588 и на основе х86 архитектуры.

Мы уже приняли решение, что базовым софтом для нашего NAS будет OMV на Armbian. На этом стеке мы будем проводить тесты и замерять бенчмарки. Его мы будем оптимизировать под наше железо. Для него же в первую очередь будут составляться мануалы.

Но ресурсов нашего устройства хватит не только на организацию сетевого хранилища, но и на медиасервер, запускалку докеров, контроллер умного дома, VPN и прочее.

Читать далее
Всего голосов 16: ↑14 и ↓2 +12
Комментарии 53

Sitonica SR403W: “Москвич” в мире серверов

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 3.6K
Блог компании КРОК Тестирование IT-систем *Хранение данных *Хранилища данных *Компьютерное железо
Обзор

Привет, Хабр! Сегодня мы делимся своими тестами сервера от компании “Ситоника”. Этот 4U-сервер, который может выступать как хранилище данных, так и одним из узлов виртуализации, поставляет российская компания. Практика показала, что его хватает для решения большинства типовых задач. Чем Sitonica SR403W отличается от наводнивших в последнее время отечественный рынок китайских серверов, и почему нам все равно пришлось выяснять нюансы его работы в WeChat, читайте под катом.

Читать далее
Всего голосов 28: ↑26 и ↓2 +24
Комментарии 12

Истории

День бэкапа: полезные советы и статьи из блога RUVDS

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 2.3K
Блог компании RUVDS.com Информационная безопасность *Резервное копирование *Хранение данных *Хранилища данных *


31 марта по инициативе пользователей Reddit во всём мире отмечают День резервного копирования. Лучший способ отметить этот праздник — создать резервные копии данных, проверить и протестировать свои бэкапы.
Читать дальше →
Всего голосов 37: ↑35 и ↓2 +33
Комментарии 22

Tibx или не tib(x): вот в чем вопрос…

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 864
Блог компании Киберпротект Восстановление данных *Резервное копирование *Хранение данных *Хранилища данных *
Обзор

Сегодня я хочу поговорить о том, каких преимуществ в вопросах резервного копирования и аварийного восстановления можно добиться за счет смены архитектуры архива и правил хранения информации. Разумеется делать я это буду на примере нового формата архивов, который используют продукты КИБЕРПРОТЕКТ. Из интересного сразу выделю, что мы добились увеличения плотности до 5 раз! (это реальный показатель), а также повысили скорость, удобство и надежность. Не обошлось конечно и без проблем обратной совместимости и некоторых нюансов. Под катом — отличия нового формата, примеры оптимизаций, которые мы сделали, подробнее о плюсах инкрементного бэкапа, а также рекомендации по работе с резервными копиями в современных условиях. Всех заинтересованных приглашаю обсудить архитектурные подходы к работе с резервными копиями.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 4

Выбираем VPS хостинг: сравниваем отзывы и не только

Время на прочтение 6 мин
Количество просмотров 4.9K
Хостинг Серверное администрирование *Хранилища данных *Облачные сервисы *

С ростом онлайн-магазина возникла необходимость выбрать недорогой, но при этом надёжный VPS-сервер. Начитался на Хабре инструкций по выбору и решил сравнить несколько вариантов по услугам, ценам, отзывам/репутации. 

В каждом пункте начисляем баллы хостинг-провайдерам в зависимости от места в рейтинге, который они заняли. Чтобы было максимально честно и прозрачно. И понятно, кого и за что выбирать. 

Поехали
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 27

Разработка NAS — цели и этапы

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 7.2K
Блог компании Third Man IT-инфраструктура *Хранилища данных *Производство и разработка электроники *DIY или Сделай сам
Туториал

В статье изложена идея разработки NAS на ARM процессорах с самого начала, от проектирования плат, портирования софта и до дизайна корпуса.

Рассказывается об этапах проектирования открытой платформы NAS на основе модульной конструкции. Представлен началный вариант собственного модуля на ARM процессоре и структурная схема универсальной несущей платы для подключения различных модулей, в том числе контроллеров дисков, сетевых адаптеров и другой периферии.

Приводятся результаты сборки нескольких NAS на платах с ARM процессором RK3588 для проверки концепта разработки.

Только для любителей NAS
Всего голосов 20: ↑20 и ↓0 +20
Комментарии 63

SharedPreferences отличное хранилище для вашего flutter-приложения. Но есть нюансы…

Уровень сложности Простой
Время на прочтение 11 мин
Количество просмотров 1.3K
Программирование *Dart *Хранение данных *Хранилища данных *Flutter *
Кейс

Вы задаёте себе вопрос, какое хранилище данных выбрать для flutter-приложения? Отлично, тогда продемонстрирую, каким образом можно воспользоваться key-value решением, используя два метода set() и get() для всех типов данных*, и не разбрасываться ключами по всему коду.

Данный способ уже используется в приложении Weather Today.

Что там под звёздочкой
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 5

Новая точка на карте ЦОДов Москвы

Время на прочтение 4 мин
Количество просмотров 2.2K
Блог компании DataLine IT-инфраструктура *Хранение данных *Хранилища данных *Инженерные системы *
Репортаж

Мы открыли новый дата-центр «Ростелеком-ЦОД» в Медведково. Строительство началось в июле 2022 года на базе складского комплекса класса А+, первый этап был реализован за 9 месяцев.

Сегодня в эксплуатацию принято 4 машинных зала из шестнадцати. Каждый из них может вместить до 312 стандартных серверных шкафов, т. е. всего 1248 стойко-мест. Общая электрическая мощность четырех машинных залов и поддерживающей инженерной инфраструктуры составляет 9 МВт.

Погулять по ЦОДу
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 6

Как мы создаём корпоративную почтовую систему нового поколения Mailion. Оптимизация стоимости хранения данных

Уровень сложности Средний
Время на прочтение 22 мин
Количество просмотров 1.8K
Блог компании МойОфис Серверная оптимизация *Хранение данных *Сжатие данных *Хранилища данных *

Каждый из нас сталкивался с необходимостью настройки сложного ПО, интенсивно потребляющего ресурсы компьютера. Как правило, у такого софта довольно объёмная конфигурация, и из-за этого бывает трудно подобрать комбинацию параметров, при которой этот софт демонстрировал бы высокую производительность при минимальной утилизации железа.

Одна из наиболее ресурсоемких категорий софта сегодня — это системы хранения данных. К ним можно отнести как классические СУБД, так и хранилища различного назначения. В корпоративной почтовой системе Mailion мы используем объектное хранилище собственной разработки — Dispersed Object Store (DOS). Mailion поддерживает одновременную работу до миллиона пользователей, и подобный уровень нагрузки выдвигает существенные требования к производительности и экономической эффективности системы.

Под катом рассказываем, как мы искали оптимальную конфигурацию нашего объектного хранилища, и какие уроки извлекли из этого поиска.

Читать далее
Всего голосов 28: ↑27 и ↓1 +26
Комментарии 2

Генерация DAG в Apache Airflow

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 1.6K
Python *Big Data *Хранилища данных *Data Engineering *
Туториал

Пошаговая инструкция о том, как из одного DAG сделать фабрику DAG.

Включает в себя: установка Airflow через Docker и поэтапное объяснение того, как сделать фабрику DAG.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Комментарии 1

Потоки событий бесполезны без действий

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 2.4K
Блог компании RUVDS.com Администрирование баз данных *Хранение данных *Хранилища данных *
Перевод

Каждая точка данных в системе, регулярно генерирующей данные, соответствует событию (Event). Потоки событий (Event Stream) — это непрерывный поток событий или точек данных. Иногда потоки данных называют в сообществе разработчиков потоками данных (Data Stream), потому что они состоят из непрерывных точек данных. Event Stream Processing — это действия, выполняемые с генерируемыми событиями.

В этой статье подробно рассматриваются потоки данных и Event Stream Processing, рассказывается, как работает Event Stream Processing, объясняются различия между Event Stream Processing и Batch Processing, преимущества и способы применения ESP, а завершается она наглядным примером Event Stream Processing.
Читать дальше →
Всего голосов 32: ↑31 и ↓1 +30
Комментарии 0

Как усмирить данные о звонках в таблицах одним скриптом

Время на прочтение 8 мин
Количество просмотров 814
Блог компании МТС API *Хранение данных *Хранилища данных *Облачные сервисы *

Привет, Хабр! Меня зовут Анастасия Иванова, я технический писатель МТС Exolve. В этой статье я расскажу о том, как поместить информацию о звонках в привычный формат таблиц на примере нашей платформы (краткий обзор сервиса вы найдете тут) и Google Таблиц. В частности, вы узнаете о том, как импортировать статистику входящих и исходящих вызовов, а также исходящих голосовых SMS.

Для этого мы напишем скрипт на языке программирования от Google (Apps Script), который будет делать HTTP-запрос в Statistics API и сохранять полученные данные в Google Таблицу. Мы покажем пример импорта некоторых данных статистики, далее вы сами сможете изменить скрипт, чтобы подстроить его под свои нужды.

Читать далее
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 0

Процесс ELT: основные компоненты, преимущества и инструменты создания

Время на прочтение 11 мин
Количество просмотров 3K
Data Mining *Big Data *Хранение данных *Хранилища данных *
Перевод

Если ваша задача заключается в аналитике данных или в машинном обучении, то успех её выполнения зависит от создаваемых вами конвейеров данных и способов их создания. Но даже для опытных дата-инженеров проектирование нового конвейера данных каждый раз становится уникальным событием.

Интеграция данных из множества разделённых источников и их обработка для обеспечения контекста содержит в себе и возможности, и трудности. Один из способов преодоления трудностей и получения новых возможностей в области интеграции данных — создание конвейера ELT (Extract, Load, Transform).

В этой статье мы подробно рассмотрим процесс ELT, в том числе его работу, преимущества и распространённые способы применения. Также мы поговорим о различиях между ELT и ETL (Extract, Transform, Load) и дадим советы по созданию и оптимизации конвейера ELT.
Читать дальше →
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 1

Представляем вашему вниманию Artie Transfer

Время на прочтение 6 мин
Количество просмотров 483
Блог компании OTUS PostgreSQL *Хранилища данных *
Обзор
Перевод

Будучи активным пользователем хранилища данных (DWH) на разных ролях, я всегда находил определенные ограничения (и разочарования!) в связи с задержкой данных между нашим DWH и данными, которые находятся в онлайновых транзакционных (OLTP) базах данных. В зависимости от того, где я работал, задержка составляла от нескольких часов до суток (дней), причем более крупные компании, как правило, работали медленнее. 

Читать далее
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 1

Делать Data Vault руками? НЕТ! Подходы к автоматической генерации при построении Data Vault

Время на прочтение 8 мин
Количество просмотров 1.2K
Блог компании Инфосистемы Джет Анализ и проектирование систем *Big Data *Хранилища данных *Data Engineering *

Привет, меня зовут Виктор Езерский, я работаю в центре управления данными «Инфосистемы Джет». Мы занимаемся построением хранилищ, Data Lake, платформ данных, ETL/EL-T и BI-систем. Последние 5–7 лет при построении хранилищ данных у наших заказчиков одна из часто встречаемых архитектур — Data Vault. Мы участвовали в доработке готовых хранилищ на базе Data Vault и делали Data Vault «с нуля».

Из опыта борьбы я вынес одно правило: Data Vault без фреймворка и автоматической генерации — большая беда. В этом посте расскажу, почему, а также поделюсь нашими подходами к созданию генератора. Сразу предупреждаю, что не дам готовых рецептов, но расскажу о наших основных подходах и что они нам дали.

Узнать всё!
Всего голосов 13: ↑12 и ↓1 +11
Комментарии 0

Хранилище данных пугает бизнес: проблемы DWH для бизнеса

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 4K
Хранилища данных *Data Engineering *
Из песочницы

За созданием хранилища данных и особенно его поддержкой кроются жуткие монстры, пугающие в первую очередь бизнес, а уже потом IT-отдел.

В этой статье рассмотрим наиболее частые проблемы, касающиеся хранилищ данных, с которыми сталкивается менеджмент компании, а также способы их решения.

Читать далее
Всего голосов 9: ↑7 и ↓2 +5
Комментарии 14

Локализация и рывок вперед: как мы разработали новый подход к облачному хранению данных для Hoff

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 2.1K
IT-инфраструктура *Big Data *Хранилища данных *Облачные сервисы *Data Engineering *
Из песочницы

Всем привет! Я Слава Жуков, CDO в eCommerce-агентстве Aero. Сегодня я расскажу, как мы сделали облачное хранилище понятным и структурированным источником информации для Hoff: про единые принципы хранения данных, разработка масштабируемой архитектуры, правильная система алертинга для регулярного контроля качества данных и не только.

Читать полностью
Рейтинг 0
Комментарии 13

Как работают объектные хранилища: OpenStack Swift

Уровень сложности Средний
Время на прочтение 18 мин
Количество просмотров 2.8K
Блог компании Selectel Open source *Хранилища данных *Распределённые системы *
Ретроспектива

Неожиданный мартовский мороз ласкает щеки городских жителей, спешно марширующих вдоль проспектов по направлению к своим рабочим местам. В их головах широким спектром разливается сладкая истома — предвкушение отдыха.

Раз меньше времени работе, то больше — знаниям. Меня зовут Рома, и я работаю в объектном хранилище — самой высоконагруженной услуге Selectel. Здесь мы непрерывно трудимся над улучшением и развитием архитектуры, удовлетворяя спрос на пропускную способность, функциональность и надежность.

В первой части я поделился сложностями, которые возникают при попытке построить распределенное и отказоустойчивое хранилище для объектов. Та система, которую мы позволили себе нафантазировать, очень похожа на OpenStack Swift. С него начиналась история нашего продукта, так что мы можем не только разобрать принцип его работы «на пальцах», но и погрузиться в скрытые особенности OpenSource, которые проявляются лишь в больших масштабах.
Читать дальше →
Всего голосов 42: ↑42 и ↓0 +42
Комментарии 6

Вклад авторов