Как стать автором
Обновить
103.16
Рейтинг

Хранение данных *

Что имеем, то храним

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

Хранители данных: как устроена работа с DWH в Lamoda

Блог компании Lamoda Oracle *IT-инфраструктура *Хранение данных *Хранилища данных *

Всем привет! Меня зовут Юлия Скогорева, я системный аналитик в команде Center of excellence в Lamoda, которая входит в дирекцию данных и аналитики.

Если бизнесу нужны какие-то данные для принятия важных решений, то на помощь приходит наша команда. Мы тщательно изучаем множество микросервисов, чтобы определить, какие же данные нужны для решения бизнес-целей, формируем архитектуру хранилища, пишем скрипты запросов и витрин данных, строим юниверсы, делаем отчеты и дашборды. Большая часть работы не обходится без участия команды DWH-разработки.

В статье я расскажу, как устроено хранилище данных в Lamoda, что находится на каждом его слое, с помощью каких инструментов мы визуализируем данные, сколько у нас отчетов и зачем используем APEX.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 328
Комментарии 3

Новости

Основатель Signal: «Первые впечатления от web3»

Информационная безопасность *Хранение данных *Облачные сервисы Распределённые системы *Криптовалюты
Перевод

Несмотря на то, что я считаю себя криптографом, меня не особенно привлекает слово "крипто". Не думаю, что я уже староват, но я гораздо чаще кликаю на мемы в духе "Интернет всё помнит" о том, как "крипто" раньше означало "криптография", чем на последние новости об NFT.

Но учитывая всё то внимание, которое в последнее время уделяется тому, что сейчас называют web3, я решил более тщательно изучить то, что происходит в этой сфере, чтобы точно ничего не упустить...

Читать далее
Всего голосов 60: ↑58 и ↓2 +56
Просмотры 18K
Комментарии 36

Мой новый домашний сервер, часть 1: выбор железа

Системное администрирование *Хранение данных *Компьютерное железо DIY или Сделай сам
Не то, чтобы это было кому-то интересно, но на такую тему тексты пишутся легко и непринуждённо, потому решил написать. Разбив на несколько частей — про выбор железа, выбор софта, сборку (хотя тут не уверен, это обычно самое скучное) и настройку софта (там уже повеселее).

Домашний сервер у меня дома уже много лет существует. По-моему, первый был на базе к6-2 собран ещё в начале нулевых. С того времени сменилось много разных вариантов, быстрых и медленных, больших и маленьких, виндовых и линуксовых. Последние десять лет сервером у меня работает HP Microserver, сперва был Gen7, а где-то с 2015 — Gen8, который был куплен с целероном и двумя гигабайтами ОЗУ, а затем «прокачан» до Xeon'a и 16GB (максимум).

На фото — момент переезда из gen7 в gen8.


Читать дальше →
Всего голосов 61: ↑58 и ↓3 +55
Просмотры 27K
Комментарии 266

03. С прозрачными воротами и яркою звездой

Глобальные системы позиционирования *OpenStreetMap *Хранение данных *Старое железо DIY или Сделай сам
Tutorial

Предыдущие статьи о реверсе данных автомобильных навигаторов Siemens/VDO Dayton CARMiN:

Реверс черного тессеракта

01 Сшей красное с красным, желтое с желтым, белое с белым. Наверняка будет хорошо

02. Я уже даже не вижу код. Я вижу блондинку, брюнетку и рыжую

Получив в прошлой статье полную раскладку по значениям чисел и цифр типа блока 0xA, информации по странам, естественным следующим шагом будет попытка провести разбор типа блока 0x0С, информации по городам.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 1.3K
Комментарии 0

Идеальный каталог, пример использования

PHP *PostgreSQL *SQL *Хранение данных *

Я разрабатываю библиотеку для работы с Entity Attribute Value (репозиторий), сокращенно EAV (структура базы данных для хранения произвольных данных). В конце прошлой статьи я спросил у вас о чём мне ещё надо написать, вы попросили показать пример использования и сделать замеры быстродействия. Про замеры быстродействия статья была, эта будет о примере использования.

Назначение библиотеки

Прежде чем рассказать об использовании, надо обозначить цели этого использования. Первая цель это автоматизировать запись произвольных данных. Вторая цель - читать ранее записанные данные и делать произвольные выборки по этим данным.

Для этих двух целей применяется EAV, но он существенно замедляется при увеличении объёма данных, и главная цель библиотеки это сделать скорость работы с данными независимой от объёма данных.

Это достигается за счёт использования материализованных представлений и таблиц, и главная задача которую решает библиотека, это синхронизации данных между таблицами EAV и конкретными таблицами, выделенными под каждую категорию (Entity - сущность). Конечно сущность может быть выделена в материализованное представление, библиотека оставляет выбор за пользователем.

В статье будут приведены примеры того как задать произвольный набор атрибутов для произвольной сущности и как сделать выборку данных с произвольными условиями.

И конечно будут примеры того как для уже созданной сущности добавить новый атрибут, новую позицию и как обновить значения "позиции каталога".

Читать далее
Всего голосов 12: ↑8 и ↓4 +4
Просмотры 2.8K
Комментарии 17

Идеальный каталог, замеры производительности

PHP *PostgreSQL *SQL *Хранение данных *

Всем привет.

Я разрабатываю библиотеку для работы с Entity Attribute Value (репозиторий), сокращенно EAV (модель базы данных для хранения произвольных данных). В конце прошлой статьи я спросил у вас о чём мне ещё надо написать, вы попросили показать пример использования и сделать замеры быстродействия.

Что для нас важно при работе с данными ? Скорость записи (добавления или обновления) и скорость чтения (конкретно - фильтрации по моделям одной сущности). При чём скорость поиска в приоритете, потому что записываем мы один раз в цать дней, а читаем каждую минуту/секунду и даже не один раз, а может быть и не одну сотню раз.

Фишка библиотеки в том что бы работать не с представлением построенном на базовых таблицах EAV, а работать с небольшой частью этих данных записанных в отдельное материализованное представление или в отдельную таблицу.

В Новогодние каникулы я сделал замеры производительности и хочу с вами поделиться результатами

Что будем измерять ?

Чтение:

Время вычитывания всех позиций категории

Время формирования параметров фильтрации

Время фильтрации

Запись:

Время добавления новой характеристики (атрибута)

Время добавления новой товарной позиции (модели)

Время обновления товарной позиции

Читать далее
Всего голосов 9: ↑6 и ↓3 +3
Просмотры 1.7K
Комментарии 9

Видеоcъемка и фотосъёмка на Raspberry pi в облако

Python *Хранение данных *Разработка на Raspberry Pi *
Recovery mode
Tutorial

Здравствуйте дорогие читатели моего блога.

Сегодня статья посвещана организации процесса фото - и видиосъёмки с микрокомпьютера Raspberry pi с последующим сохранением данных в облако в атоматическом режиме.

У меня стояла задача создать систему фото- и видеонаблюдения за птицами у кормушки. 

Так как кормушка у меня находилась во дворе дома, то я решил собрать устройство на базе raspberry pi с подключённым проводным интернетом.

Это было сделано на случай, если влага или другие погодные условия выведут электронику из строя, то весь видео и фотоматериал останется в облаке.

В качестве оборудования я использовал:

Raspberry pi 3 B +

7 дюймовый сенсорный дисплей для микрокомпьютера

Pi camera

клавиатура, мышь

LAN провод 20 метров

удлинитель и блок питания (преобразователь 5В и 2А)

Читать далее
Всего голосов 14: ↑9 и ↓5 +4
Просмотры 4.8K
Комментарии 16

Открываем MMD формат в Excel

Хранение данных *
Из песочницы

Пару дней назад мне написал знакомый студент-физик с просьбой помочь открыть данные, снятые с лабораторного оборудования в Excel и скинул мне несколько файлов странного формата .mmd. Интернет на запрос "как открыть mmd", выдавал только танцующих аниме-девочек (MikuMikuDance) и сайт разработчика mangodata, с которого нельзя было скачать нужное ПО. Конечно, с подобной проблемой столкнется далеко не каждый, но прецедент в моем лице появился, а это значит, что интернету нужна статья "Открываем MMD формат в Excel".

Читать далее
Всего голосов 12: ↑8 и ↓4 +4
Просмотры 5.4K
Комментарии 9

Инструменты Data Governance

Хранение данных *Data Engineering *
Из песочницы

В двадцать первом веке миром правит информация и для того, чтобы оставаться конкурентоспособным на рынке предприятию необходимо не только владеть информацией, а также уметь грамотно ей распоряжаться. На данный момент существуют разные системы управления данными для эффективного управления компанией.

Разберем понятие Data Governance, что это и для чего оно предприятию.

Data Governance – это совокупность процессов определения наиболее важных данных для использования сотрудниками, присвоение им прав доступа и управления для отлаженной работы бизнес-процесса, а также защита данных от внешних воздействий.

Стоит отметить, что многие путают понятия Data Governance и Data Management.

Data Management это процесс сбора, хранения и обновления данных.

Можно сказать, что Data Governance формирует стратегию управления данными, а Data Management напрямую осуществляет управление данными согласно определенной стратегии.

Читать далее
Рейтинг 0
Просмотры 1.3K
Комментарии 6

Обзор домашнего NAS Synology DS220+

Хранение данных *Хранилища данных *Гаджеты Периферия
Из песочницы

Обзор использования Synology DS220+ в качестве системы резервного копирования для дома, домашнего медиасервера и как элемент умного дома. В статье описанны особенности DS220+ и опыт его использования на протяжении 4 месяцев. Для сравнения кратко представлены альтернативные варианты способные заменить подобное устройство.Описание функционала и сценариев использования в статье довольно подробно и, как я надеюсь, поможет выбрать подходящий вариант резервного копирования.

Читать далее
Всего голосов 17: ↑14 и ↓3 +11
Просмотры 15K
Комментарии 110
Привет, Хабр! Меня зовут Елизавета Тишина, я работаю сервисным инженером в департаменте профессионального сервиса Huawei. Я лечу системы хранения данных (СХД) уже пять лет: начинала с обычной техподдержки, а теперь выбрала путь сервисного инженера. Сейчас я занимаюсь тестированием оборудования перед поставкой заказчикам, пусконаладочными работами, обновляю СХД после ввода в эксплуатацию и выполняю сервисные задачи (миграция, комплексная проактивная поддержка систем заказчиков и т. д.). В этой статье я хочу рассказать о том, с какими типовыми проблемами я постоянно сталкиваюсь, и показать, какими инструментами пользуюсь, когда работаю со своими СХД. А ещё вы узнаете, какие из этих инструментов полностью открыты для наших клиентов — как будущих, так и настоящих. Мне нравится эта работа, так что постараюсь рассказать о ней интересно.
Заходите под кат, будем знакомиться.
Всего голосов 24: ↑23 и ↓1 +22
Просмотры 6.4K
Комментарии 4

02. Я уже даже не вижу код. Я вижу блондинку, брюнетку и рыжую

Глобальные системы позиционирования *OpenStreetMap *Хранение данных *Старое железо DIY или Сделай сам
Tutorial

Предыдущие статьи о реверсе данных автомобильных навигаторов Siemens VDO Dayton CARMiN

Реверс черного тессеракта

01 Сшей красное с красным, желтое с желтым, белое с белым. Наверняка будет хорошо

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Просмотры 7.4K
Комментарии 9

Телекоммуникационные шкафы под серверы искусственного интеллекта

Блог компании ITSOFT Серверное администрирование *Хранение данных *Хранилища данных *Искусственный интеллект

Искусственный интеллект набирает обороты и появляется спрос на серверные шкафы именно под такие серверы. Специфика размещения данных серверов состоит в том, что они почти все повышенной глубины, имеют внушительный вес, у них высокое электропотребление и им нужен дополнительный теплоотвод. Всё это требует большого пространства. Рассмотрим, что нужно учитывать при размещении серверов искусственного интеллекта и другого габаритного оборудования в серверной.

Читать далее
Всего голосов 16: ↑12 и ↓4 +8
Просмотры 2.4K
Комментарии 9

Все врут-2: чем закончился детектив про медленные NVMe и невозможность делать RAID

Блог компании RUVDS.com Серверное администрирование *Хранение данных *Управление проектами *Компьютерное железо
Напомню: когда мы решили ввести тарифы на VDS на машинах с NVMe-дисками, то очень удивились тому, что они несильно лучше SSD. Второй неожиданностью была практическая невозможность собрать из таких дисков рейд-массив, то есть при вылете диска нужно будет не ребилдить массив прозрачно для пользователя, а выкатывать бекап.

Прозвучала мысль, что мы кривые ламеры и не умеем всё правильно готовить. Альтернативой была гипотеза «все врут».

Прошло полгода. Мы научились всё это готовить, но заодно поняли, что гипотеза «все врут» куда более вероятная.


Тут видно, что RAM подключена к CPU1, а NVME-диски — к CPU2. Это будет критически важно дальше по сюжету.

В общем, сейчас расскажу, чего именно нам стоило ввести нормальные NVMe-тарифы и почему при всём этом очень важно разбираться в архитектуре сервера.
Читать дальше →
Всего голосов 82: ↑80 и ↓2 +78
Просмотры 31K
Комментарии 93

01. Сшей красное с красным, желтое с желтым, белое с белым. Наверняка будет хорошо

Глобальные системы позиционирования *OpenStreetMap *Хранение данных *Старое железо DIY или Сделай сам
Tutorial

Статья является продолжением Реверс черного тессеракта, без прочтения которой, единственный вопрос, на который именно тут будет дан законченный ответ - "почему на КДПВ этого цикла статей везде картинки авторства Евгения Тихоновича Мигунова?".
Сразу и отвечу. Потому, что по странному совпадению, всеми книгами, которые он иллюстрировал, в детстве я зачитывался. Как художник, на мой взгляд, он великолепен, и выбранные цитаты его творчества, на мой взгляд, очень хорошо ложатся на темы конкретных статей.

Продолжение же реверса данных для автомобильного навигатора систем Siemens VDO CARMiN - под катом.

Читать далее
Всего голосов 13: ↑12 и ↓1 +11
Просмотры 2.4K
Комментарии 0

Микро-фронтенды для микро-сервисов

Блог компании М.Видео-Эльдорадо Разработка веб-сайтов *Хранение данных *Хранилища данных *Читальный зал

М.Видео-Эльдорадо поддерживает более сотни разных систем. Набор необходимых сервисов отличается для сотрудников разных должностей и даже разных функциональных обязанностей. Управлять таким парком, организовывать уровни доступа к разным продуктам – сложная задача. 

Мы решили разработать специальное приложение, при помощи которого коллеги могли бы выполнять свои обязанности централизованно, из одного окна. Помимо удобства от пользователей была еще одна вводная - каждая продуктовая команда хотела иметь свой собственный, независимый от других, релизный цикл.

Читать далее
Всего голосов 23: ↑23 и ↓0 +23
Просмотры 2.8K
Комментарии 3

Реверс черного тессеракта. Начало

Глобальные системы позиционирования *OpenStreetMap *Хранение данных *Старое железо DIY или Сделай сам
Tutorial

Система с известной спецификацией реакций на входные воздействия и неизвестным содержимым характеризуется, как черный ящик. Когда внутренняя структура, устройство и архитектура системы известны - ящик белый. Есть и промежуточное понятие серый ящик - частичное знание внутреннего устройства и ожидаемое поведение.

Как охарактеризовать систему, выходные реакции которой очевидны, но нет информации о входных данных, вызывавших эти реакции? Я сейчас про компьютеры, а не о психологии или медицине. Строго говоря, входные данные не просто есть, они присутствуют в полном спектре возможных вариантов, но целиком, глыбой, блобом, а реакция происходит на отдельную неизвестную часть (части) входных данных.

По аналогии с ящиками, в статье я назвал такую систему именем четырехмерного ящика, черным тессерактом. Ну во-первых, это красиво(с). Черным - за неизвестные входные спецификации, четвертое измерение - из-за того, что конечные данные устройства автомобильной навигации выдают в виде изображений, попытка компьютеризированного анализа результатов вывода бессмысленна и беспощадна.

Читать далее
Всего голосов 16: ↑16 и ↓0 +16
Просмотры 2.9K
Комментарии 4

«Право на забвение» или как просто удалять персональные данные по запросу пользователя

Блог компании FUNCORP Информационная безопасность *Разработка мобильных приложений *Хранение данных *Законодательство в IT

Удалять персональные данные пользователя по его запросу, чтобы продукт соответствовал законам CCPA или GDPR, можно по-разному. Хоть вручную каждую заявку на почте разбирать. Главное — сделать процесс максимально простым и понятным для пользователя. А это уже хороший повод задуматься о некоторой автоматизации.

В статье на примере мобильного приложения iFunny расскажу про систему обработки запросов на удаление данных. Теперь заявки приходят сразу конкретизированными, а саппорт тратит в 2 раза меньше времени на их рассмотрение.

Под катом — о том, как происходит приём заявки, обработка, выставление статусов, хранение в системе учёта и так далее.

Читать далее
Всего голосов 43: ↑42 и ↓1 +41
Просмотры 9.1K
Комментарии 2

9 коротких видео как работает трехфазный ИБП 93PM G2

Блог компании Eaton Информационная безопасность *Хранение данных *Хранилища данных *Инженерные системы

Ускоренная цифровизация и переход к удалённым формам работы и учёбы в эпоху COVID-19 привели к постоянному росту спроса на ресурсы в дата-центрах. А вместе со спросом растут и требования к надёжности их инфраструктуры и бесперебойности процессов. Модель ИБП Eaton 93PM G2 предназначена именно для ЦОД, и она готова как к росту нагрузок, так и к постоянному масштабированию их инфраструктуры из-за увеличения спроса на облачные службы и виртуализацию.

Смотреть далее
Всего голосов 12: ↑4 и ↓8 -4
Просмотры 1.9K
Комментарии 9

Как документировать сервер и контролировать его управление, даже если у вас небольшой стартап

Блог компании DataLine Системное администрирование *IT-инфраструктура *Хранение данных *Хранилища данных *

Привет, Хабр! Меня зовут Даниил Воложинок, я инженер в группе виртуализации. Представьте себе ситуацию. У вас есть сервер с комплексом приложений и настроек, который несколько лет обслуживает админ — ”золотые руки”. Однажды “золотой” админ увольняется или уходит на длительный больничный. На его смену приходит новый и выясняет, что разобраться в наследстве невозможно: большинство сведений его предшественник держал в голове. 

Пару раз столкнувшись с таким, я убедился, что даже для маленького сервера лучше сразу завести подробную документацию и не оставлять будущих администраторов в информационной яме. Текущим сотрудникам это тоже помогает: за счет прозрачности растет эффективность взаимодействия, снижаются риски безопасности.  

В статье поделюсь наработанным списком для документирования сервера, который мы собрали внутри компании и теперь высылаем в качестве рекомендации и крупным клиентам DataLine, и небольшим клиентам Cloudlite. Ресурсы Cloudlite нередко используются для стартапов и pet-проектов. А когда стартап вдруг резко взлетает, становится некогда думать о документировании. Так что привычка сразу все фиксировать помогает нашим клиентам не запутаться. 

Читать далее
Всего голосов 20: ↑19 и ↓1 +18
Просмотры 5.5K
Комментарии 11

Вклад авторов