Как стать автором

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Статьи Посты Новости Авторы Компании

olegbunin 25 дек в 12:01

БД — это скальпель или мультитул? Куда привела эволюция СУБД в 2023 году

10 мин

7.1K

Блог компании Конференции Олега Бунина (Онтико) Блог компании Yandex Cloud & Yandex Infrastructure Администрирование баз данных *Хранение данных *Хранилища данных *

За последние пару десятилетий с ростом объёма данных на рынке СУБД сложился интересный ландшафт. Появились новые СУБД, при этом старые продолжали развиваться — и сориентироваться среди них становилось всё сложнее.

В этой статье предлагаем рассмотреть эволюцию разных СУБД и сравнить их между собой. Поможет нам в этом Олег Бондарь, директор по продукту в Yandex Cloud, который отвечает за развитие YDB — это транзакционная реляционная база данных с открытым исходным кодом. Статья написана по материалам его доклада на Saint Highload++.

Читать далее

+14

suregood 22 дек в 15:00

Как создать сервис по оценке транспортной доступности новостроек при горящих дедлайнах

Простой

6 мин

782

Блог компании МосТрансПроект SQL *Управление разработкой *Хранилища данных *Транспорт

Кейс

Привет, Habr! Меня зовут Руслан Габдрахманов, я руководитель команды разработки информационных систем в «МосТрансПроекте». Сегодня расскажу, как мы создавали городской сервис «Узнай про ЖК», упрощающий выбор квартиры или жилья.

Читать далее

+7

Sber 22 дек в 12:11

Разгоняем Ignite в облачной инфраструктуре. Часть 2

Средний

7 мин

528

Блог компании Сбер Хранение данных *Хранилища данных *Облачные сервисы *

Кейс

Привет! С вами Дмитрий Пшевский и Семён Попов, технические лидеры юнита Data в Сбере. Это вторая часть нашего материала о производительности сервисов при работе с Ignite.

В первой части мы рассказали, как перешли от монолита к микросервисной архитектуре, попробовали поработать с толстым клиентом и переключились на тонкого. Расскажем, какие сложности у нас возникли в процессе эксплуатации нашего решения в облачной инфраструктуре, почему пришлось минимизировать транзакционную логику на клиенте и к чему мы пришли в итоге. Статья написана на основе нашего доклада на JPoint 2023.

Поехали!

Читать далее

+3

CloudMTS 21 дек в 13:22

Big Data в облаке: строим доступное хранилище

Простой

4 мин

2.1K

Блог компании CloudMTS Блог компании МТС Хранение данных *Хранилища данных *Облачные сервисы *

Обзор

За последние годы «большие данные» стали восприниматься более гибко и могут включать в себя объемы, которые ранее не рассматривались как «большие». При этом снизились затраты на хранение и обработку информации. Теперь инструменты работы с данными подобных масштабов доступны даже небольшим компаниям.

Важно помнить, что работа в этом направлении включает в себя разнообразные вызовы, связанные с ограничениями оборудования, типами источников данных, сложностью анализа. Данные нужно правильно собирать, хранить и обрабатывать, а для этого нужно выстроить правильную инфраструктуру.

Сегодня расскажем про решение, которое уменьшит неопределенность при работе с крупными данными и поможет максимально быстро построить с нуля удобную и недорогую систему для аналитических задач в вашей компании.

Читать далее

+11

randall 20 дек в 11:30

Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

Простой

9 мин

4.9K

Блог компании CloudMTS Блог компании МТС Администрирование баз данных *Хранение данных *Хранилища данных *

Обзор

По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от недорогих обычных серверов до огромных хранилищ на сотни петабайт.

При экспоненциальном росте информации возможности работы с данными расширяются. Отчет LinkedIn о новых вакансиях показывает, что мировой рынок работы в области науки о данных вырастет до 230,80 млрд долларов к 2026 году.

Наука о данных является востребованной, интересной, и, казалось бы, очень сложной областью знаний. Однако хорошая новость заключается в том, что она доступна для новичков. В статье мы разберемся, с какими базовыми основами нужно познакомиться при работе с данными.

Читать далее

+9

sdy 18 дек в 12:08

PixelNAS — результат переделки мини компьютера в мобильный NAS

Средний

12 мин

9.8K

Блог компании Third Man IT-инфраструктура *Хранилища данных *Производство и разработка электроники *DIY или Сделай сам

Туториал

Прошло два месяца после первой статьи о переделке мини компьютера в мобильный NAS. На тот момент, было рассказано о рабочем прототипе NAS на базе готового мини компьютера и ещё предстояло поднять железо и доработать софт.

В этот раз речь пойдет о результатах сборки мобильного NAS. Что удалось сделать, что успели протестировать, можно ли с этим работать и другие вопросы о текущем состоянии разработки и проекта в целом.

Что получилось

+23

randall 14 дек в 12:17

Как извлекать пользу из данных: подборка материалов

Простой

6 мин

4.3K

Блог компании CloudMTS Блог компании МТС Визуализация данных *Хранилища данных *Data Engineering *

Обзор

Анализ данных — один из ключевых драйверов роста для бизнеса. Аналитика позволяет выявить скрытые закономерности и тренды, прогнозировать будущие события и принимать обоснованные решения на основе фактов. Бизнес, основанный на данных, не просто реагирует на переменчивость, но и активно формирует свое будущее.

Сегодня мы подготовили для вас новую подборку книг с высоким читательским рейтингом, которые дают понимание, как собирать данные и извлекать из них ценность, как принимать обоснованные решения, определять сильные и слабые стороны различных инструментов.

Читать далее

+14

SantrY 12 дек в 13:20

DDoS, китайские ботнеты и клиенты с особыми потребностями. Будни ЦОДов 3data

Простой

9 мин

2.9K

Блог компании Бастион Информационная безопасность *IT-инфраструктура *Облачные вычисления *Хранилища данных *

Дата-центр — заманчивая цель для кибератак и непростой объект для защиты. Мы решили выяснить, как обеспечивается бесперебойная работа ЦОДов руководителя отдела информационной безопасности 3data Павла Черных, и публикуем его рассказ.

Из него вы узнаете, как выглядят три кита безопасности ЦОД, к каким специфическим инцидентам постоянно готовятся на этих объектах и почему дата-центры привлекают бездомных. А напоследок вы получите несколько практических советов по выбору надежной площадки для размещения своей инфраструктуры.

Читать далее

+19

Avanti 8 дек в 09:28

Выбор BI системы для селф-сервис

Простой

8 мин

4.3K

Big Data *Визуализация данных *Хранение данных *Хранилища данных *

Мнение

Всем привет! Я — Никита Колганов из группы компаний «АСНА». Группа компаний «АСНА» — это современная экосистема сервисов и решений для фармацевтического рынка, позволяющая нам развиваться самим и способствовать развитию партнеров.

Зачем мы вообще внедряли BI‑систему?

В компании ежедневно делается множество отчетов, значительная часть которых — средствами Excel. Помимо того, что ручной сбор отчетов занимает массу времени, так и сам Excel, как контейнер доставки отчетности, обладает рядом недостатков. Это, как минимум:

Проблема централизации — в каждом Excel может быть как свой набор исходных данных, так и свои методики расчета;

Проблема доставки — расшарить файл на большое количество участников бывает проблематично. Особенно, если он большой и не пролезает в почту;

Проблема безопасности — непросто ограничить доступ к Excel‑файлу для определенного круга лиц

Отсутствие автоматизации алертов — на уровне Excel сложно настраивать оповещения в почту или корпоративные мессенджеры в случае изменения того или иного показателя.

Изначально в качестве BI‑системы мы хотели использовать Tableau и даже успели сделать несколько дашбордов, но случился февраль 2022 года, и Tableau стал недоступен. Вместе с тем, в компании назрела необходимость BI в концепции self‑service.

Читать далее

-2

ksartam 7 дек в 21:21

Обзор параллельных режимов работы хэш-функций

Простой

8 мин

1.8K

Сетевые технологии *IT-стандарты *Резервное копирование *Хранилища данных *

Из песочницы

С каждым днем, по мере роста объема обрабатываемых данных, становится все более важным использование эффективных методов обработки. Особенно значимым является внедрение параллельных вычислительных архитектур для достижения высокой производительности. Однако многие стандартные способы хэширования неэффективны при параллельной обработке данных. В ответ на эту проблему разрабатываются новые методы хэширования, специально адаптированные для параллельных вычислений. В данном эссе рассмотрены различные способы параллельного хэширования, выявлены их преимущества и недостатки.

Читать далее

+8

alexandrsnytko 5 дек в 10:07

FineBI-g brother is still watching: как мы усовершенствовали мониторинг

Сложный

7 мин

1K

Блог компании Tele2 Big Data *Визуализация данных *Хранение данных *Хранилища данных *

Туториал

Привет, Хабр! На связи BI-команда Tele2. Ранее мы уже рассказывали о нашем опыте перехода на Fine BI и подходе к анализу действий пользователей на платформе.

В нашем случае мониторинг пользователей и объектов на платформе – вопрос жизненной необходимости. Fine BI пользуется популярностью у бизнес-пользователей, также мы активно развиваем подход self-service: лицензия Сreator предоставлена 300 сотрудникам, всего опубликовано около 400 дашбордов, а неопубликованных пользовательских ad-hoc дашбордов насчитывается несколько тысяч, доступ к платформе есть более чем у 2,5 тыс человек, а MAU стремится к 2000 пользователей.

Под катом про то, как мы усовершенствовали объединение таблиц из FineDB и LogDB в один датасет, решили проблему потери логов из-за замены уже опубликованных дашбордов и углубили возможности мониторинга действий пользователей и взаимосвязей пользовательских действий с объектами.

Читать далее

+6

mt9 4 дек в 12:47

Три года с импортозамещенной виртуализацией: опыт использования РОСПЛАТФОРМЫ

Простой

5 мин

4.3K

Блог компании РСХБ.цифра (Россельхозбанк) IT-инфраструктура *Виртуализация *Хранение данных *Хранилища данных *

Кейс

Привет, Хабр! Меня зовут Михаил Терехин, я начальник ИТ‑отдела в ООО «РСХБ‑Финансовые консультации» — дочерней компании Россельхозбанка. Сегодня поделюсь с вами ощущениями от использования отечественной системы виртуализации РОСПЛАТФОРМА и тем, как мы переводили на нее нашу компанию.

Читать далее

+13

Sber 29 ноя в 12:42

Разгоняем Ignite в облачной инфраструктуре. Часть 1

Средний

9 мин

2.2K

Блог компании Сбер Хранение данных *Хранилища данных *Облачные сервисы *

Кейс

Привет, Хабр! На связи Дмитрий Пшевский @pshevskiy и Семен Попов @samansay, технические лидеры юнита Data в Сбере.

Уже более 6 лет мы заботимся о клиентских данных Сбера — храним, дедублицируем, стандартизируем, маркируем. А сегодня хотим поговорить о производительности сервисов при работе с Ignite или другой подобной системой из облачной инфраструктуры. Мы не будем рассматривать аспекты развертывания и оптимизации работы самого кластера и обсудим производительность сервисов именно на прикладном уровне. Расскажем про сложности перехода на микросервисную архитектуру, работу с толстым и тонким клиентом и отказ от транзакций. Эта статья — обзор нашего доклада на JPoint 2023.

Читать далее

+9

Andrew_Braun 27 ноя в 17:12

Опыт реализации хранилища с использованием Tiger Bridge и Yandex Object Storage

Простой

3 мин

869

Хранилища данных *Облачные сервисы *

Кейс

Добрый день, друзья! Рано или поздно, при эксплуатации файловых серверов Windows любая организация сталкивается с задачей их расширения и масштабирования. Одним из классических способов решения данной задачи, который используется уже очень давно, является технология Distributed File System (DFS). Шло время и в тот момент, когда компания Microsoft полностью развернула всю свою разработку в сторону публичного облака, началось продвижение на рынок новой технологии — Azure Files. Суть данной технологии заключалась в том, что для расширения хранилища наземных серверов предлагается использовать облачное хранилище Azure Blob Storage. В данной статье постараемся рассмотреть этот сценарий на примере использования решений Tiger Bridge и Yandex Object Storage, а также пройтись по некоторым шагам настройки.

Читать дальше →

+3

ak19 27 ноя в 13:03

FineBI: Обработка данных для начинающих пользователей

Простой

6 мин

3.8K

Блог компании GlowByte Big Data *Визуализация данных *Хранение данных *Хранилища данных *

FAQ

Хабр, привет!

На связи команда Business Intelligence GlowByte. Да-да, те самые неугомонные, которые создали самое крупное русскоязычное сообщество FineBI, проводят обучения, собирают дайджесты и ежегодно организуют масштабные конференции.

Меня зовут Александр, я руководитель центра поддержки и обучения BI-решений в GlowByte, и сегодня хочу поделиться с вами небольшим гайдом по обработке данных в FineBI. Этот материал будет полезен начинающим BI-разработчикам.

Данная статья состоит из четырех уроков, которые помогут вам ближе познакомиться с функциями редактирования данных в FineBI. Если после прочтения вы захотите разобраться со всеми особенностями платформы, закрепить базовые знания и прокачать навыки создания сложных визуализаций, приглашаю на наши курсы.

Читать далее

+6

qlever 24 ноя в 19:01

Вредные советы: как самостоятельно внедрить DWH и потратить впустую деньги и время

7 мин

5K

Хранение данных *Хранилища данных *

DWH — это единый репозиторий структурированных данных для построения бизнес-аналитики, отчётов и обеспечения исторического анализа данных.
Многие компании осознают необходимость создания корпоративного хранилища, но не все понимают, что внедрение DWH при неграмотном, спешном подходе может стать дорогим удовольствием, только усугубляющим проблемы в работе с данными.

Читать далее

0

CyberAGF 24 ноя в 09:02

Кибер Файлы и Р7-Офис: совместная работа с документами теперь еще проще

Простой

8 мин

1.4K

Блог компании Киберпротект Хранилища данных *Софт

Обзор

Читатели, следящие за публикациями в этом блоге, знакомы, в основном, с нашим флагманским продуктом Кибер Бэкап. Но на этом линейка решений Киберпротекта не заканчивается. Настало время поговорить и о других наших продуктах. Сегодня мы познакомимся с корпоративным решением для синхронизации и обмена файлами Кибер Файлы.

Читать далее

+3

GromovBI 23 ноя в 10:51

Выбор СУБД: шпаргалка, чтобы не запутаться

6 мин

26K

Big Data *Хранение данных *Хранилища данных *

Вопрос выбора СУБД для российской компании или госоргана – вопрос не праздный, тем более сейчас – когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что-то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит? Без ложной скромности скажу: мы в «Кругах Громова» уже немного поднаторели в систематизации, поэтому надеемся, что наша шпаргалка для тех, кто хочет выбрать СУБД, окажется полезной.

Начнем с классики. СУБД делятся на несколько типов. Не будем описывать их подробно, остановимся только на их основном предназначении.

Читать далее

+5

AlievM 20 ноя в 11:35

В ногу со временем: введение в многомерный анализ и OLAP-технологии

Средний

13 мин

3K

Big Data *Хранилища данных *

Из песочницы

В любой компании важно принимать корректные и целесообразные управленческие решения, а для этого необходимо обладать нужной информацией. Поэтому требуется собрать данные из всех информационных систем, привести их к общему виду и после этого проводить анализ. Давай разберемся?

Читать далее

-2

Kecven 19 ноя в 20:14

Своё облако на CasaOS

Простой

4 мин

14K

Настройка Linux *Хранилища данных *Операционные системы

Обзор

В последнее время я всё чаще задумывался о создании собственного домашнего облака. Я решил исследовать различные варианты операционных систем, специально предназначенных для домашних серверов. В моем поиске я рассмотрел несколько популярных решений, таких как TrueNAS и OpenMediaVault (OMV), каждое из которых предлагало свои уникальные функции и возможности. Однако, несмотря на их многочисленные преимущества, я искал что-то еще более простое и гибкое в настройке. И вот тогда я наткнулся на CasaOS – легковесную и интуитивно понятную операционную систему, которая идеально подошла для моих целей. В этой статье я поделюсь своим опытом работы с CasaOS, расскажу о ее особенностях, возможностях и преимуществах, которые сделали её идеальным решением для моего домашнего облака.

Читать далее

-3

1