Как стать автором
Обновить
30.65

Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Сначала показывать
Порог рейтинга
Уровень сложности

БД — это скальпель или мультитул? Куда привела эволюция СУБД в 2023 году

Время на прочтение 10 мин
Количество просмотров 7.1K

За последние пару десятилетий с ростом объёма данных на рынке СУБД сложился интересный ландшафт. Появились новые СУБД, при этом старые продолжали развиваться — и сориентироваться среди них становилось всё сложнее. 

В этой статье предлагаем рассмотреть эволюцию разных СУБД и сравнить их между собой. Поможет нам в этом Олег Бондарь, директор по продукту в Yandex Cloud, который отвечает за развитие YDB — это транзакционная реляционная база данных с открытым исходным кодом. Статья написана по материалам его доклада на Saint Highload++.

Читать далее
Всего голосов 22: ↑18 и ↓4 +14
Комментарии 15

Новости

Как создать сервис по оценке транспортной доступности новостроек при горящих дедлайнах

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 782

Привет, Habr! Меня зовут Руслан Габдрахманов, я руководитель команды разработки информационных систем в «МосТрансПроекте». Сегодня расскажу, как мы создавали городской сервис «Узнай про ЖК», упрощающий выбор квартиры или жилья. 

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 5

Разгоняем Ignite в облачной инфраструктуре. Часть 2

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 528

Привет! С вами Дмитрий Пшевский и Семён Попов, технические лидеры юнита Data в Сбере. Это вторая часть нашего материала о производительности сервисов при работе с Ignite.

В первой части мы рассказали, как перешли от монолита к микросервисной архитектуре, попробовали поработать с толстым клиентом и переключились на тонкого. Расскажем, какие сложности у нас возникли в процессе эксплуатации нашего решения в облачной инфраструктуре, почему пришлось минимизировать транзакционную логику на клиенте и к чему мы пришли в итоге. Статья написана на основе нашего доклада на JPoint 2023.

Поехали!

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Big Data в облаке: строим доступное хранилище

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 2.1K

За последние годы «большие данные» стали восприниматься более гибко и могут включать в себя объемы, которые ранее не рассматривались как «большие». При этом снизились затраты на хранение и обработку информации. Теперь инструменты работы с данными подобных масштабов доступны даже небольшим компаниям.

Важно помнить, что работа в этом направлении включает в себя разнообразные вызовы, связанные с ограничениями оборудования, типами источников данных, сложностью анализа. Данные нужно правильно собирать, хранить и обрабатывать, а для этого нужно выстроить правильную инфраструктуру.

Сегодня расскажем про решение, которое уменьшит неопределенность при работе с крупными данными и поможет максимально быстро построить с нуля удобную и недорогую систему для аналитических задач в вашей компании.

Читать далее
Всего голосов 17: ↑14 и ↓3 +11
Комментарии 0

Истории

Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 4.9K

По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от недорогих обычных серверов до огромных хранилищ на сотни петабайт. 

При экспоненциальном росте информации возможности работы с данными расширяются. Отчет LinkedIn о новых вакансиях показывает, что мировой рынок работы в области науки о данных вырастет до 230,80 млрд долларов к 2026 году. 

Наука о данных является востребованной, интересной, и, казалось бы, очень сложной областью знаний. Однако хорошая новость заключается в том, что она доступна для новичков. В статье мы разберемся, с какими базовыми основами нужно познакомиться при работе с данными.

Читать далее
Всего голосов 17: ↑13 и ↓4 +9
Комментарии 1

PixelNAS — результат переделки мини компьютера в мобильный NAS

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 9.8K

Прошло два месяца после первой статьи о переделке мини компьютера в мобильный NAS. На тот момент, было рассказано о рабочем прототипе NAS на базе готового мини компьютера и ещё предстояло поднять железо и доработать софт.

В этот раз речь пойдет о результатах сборки мобильного NAS. Что удалось сделать, что успели протестировать, можно ли с этим работать и другие вопросы о текущем состоянии разработки и проекта в целом.

Что получилось
Всего голосов 25: ↑24 и ↓1 +23
Комментарии 13

Как извлекать пользу из данных: подборка материалов

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 4.3K

Анализ данных — один из ключевых драйверов роста для бизнеса. Аналитика позволяет выявить скрытые закономерности и тренды, прогнозировать будущие события и принимать обоснованные решения на основе фактов. Бизнес, основанный на данных, не просто реагирует на переменчивость, но и активно формирует свое будущее. 

Сегодня мы подготовили для вас новую подборку книг с высоким читательским рейтингом, которые дают понимание, как собирать данные и извлекать из них ценность, как принимать обоснованные решения, определять сильные и слабые стороны различных инструментов.

Читать далее
Всего голосов 14: ↑14 и ↓0 +14
Комментарии 0

DDoS, китайские ботнеты и клиенты с особыми потребностями. Будни ЦОДов 3data

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 2.9K

Дата-центр — заманчивая цель для кибератак и непростой объект для защиты. Мы решили выяснить, как обеспечивается бесперебойная работа ЦОДов руководителя отдела информационной безопасности 3data Павла Черных, и публикуем его рассказ.

Из него вы узнаете, как выглядят три кита безопасности ЦОД, к каким специфическим инцидентам постоянно готовятся на этих объектах и почему дата-центры привлекают бездомных. А напоследок вы получите несколько практических советов по выбору надежной площадки для размещения своей инфраструктуры.

Читать далее
Всего голосов 25: ↑22 и ↓3 +19
Комментарии 0

Выбор BI системы для селф-сервис

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 4.3K

Всем привет! Я — Никита Колганов из группы компаний «АСНА». Группа компаний «АСНА» — это современная экосистема сервисов и решений для фармацевтического рынка, позволяющая нам развиваться самим и способствовать развитию партнеров.

Зачем мы вообще внедряли BI‑систему?

В компании ежедневно делается множество отчетов, значительная часть которых — средствами Excel. Помимо того, что ручной сбор отчетов занимает массу времени, так и сам Excel, как контейнер доставки отчетности, обладает рядом недостатков. Это, как минимум:

Проблема централизации — в каждом Excel может быть как свой набор исходных данных, так и свои методики расчета;

Проблема доставки — расшарить файл на большое количество участников бывает проблематично. Особенно, если он большой и не пролезает в почту;

Проблема безопасности — непросто ограничить доступ к Excel‑файлу для определенного круга лиц

Отсутствие автоматизации алертов — на уровне Excel сложно настраивать оповещения в почту или корпоративные мессенджеры в случае изменения того или иного показателя.

Изначально в качестве BI‑системы мы хотели использовать Tableau и даже успели сделать несколько дашбордов, но случился февраль 2022 года, и Tableau стал недоступен. Вместе с тем, в компании назрела необходимость BI в концепции self‑service.

Читать далее
Всего голосов 8: ↑3 и ↓5 -2
Комментарии 3

Обзор параллельных режимов работы хэш-функций

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 1.8K

С каждым днем, по мере роста объема обрабатываемых данных, становится все более важным использование эффективных методов обработки. Особенно значимым является внедрение параллельных вычислительных архитектур для достижения высокой производительности. Однако многие стандартные способы хэширования неэффективны при параллельной обработке данных. В ответ на эту проблему разрабатываются новые методы хэширования, специально адаптированные для параллельных вычислений. В данном эссе рассмотрены различные способы параллельного хэширования, выявлены их преимущества и недостатки. 

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 4

FineBI-g brother is still watching: как мы усовершенствовали мониторинг

Уровень сложности Сложный
Время на прочтение 7 мин
Количество просмотров 1K

Привет, Хабр! На связи BI-команда Tele2. Ранее мы уже рассказывали о нашем опыте перехода на Fine BI и подходе к анализу действий пользователей на платформе.

В нашем случае мониторинг пользователей и объектов на платформе – вопрос жизненной необходимости. Fine BI пользуется популярностью у бизнес-пользователей, также мы активно развиваем подход self-service: лицензия Сreator предоставлена 300 сотрудникам, всего опубликовано около 400 дашбордов, а неопубликованных пользовательских ad-hoc дашбордов насчитывается несколько тысяч, доступ к платформе есть более чем у 2,5 тыс человек, а MAU стремится к 2000 пользователей.

Под катом про то, как мы усовершенствовали объединение таблиц из FineDB и LogDB в один датасет, решили проблему потери логов из-за замены уже опубликованных дашбордов и углубили возможности мониторинга действий пользователей и взаимосвязей пользовательских действий с объектами.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 2

Три года с импортозамещенной виртуализацией: опыт использования РОСПЛАТФОРМЫ

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 4.3K

Привет, Хабр! Меня зовут Михаил Терехин, я начальник ИТ‑отдела в ООО «РСХБ‑Финансовые консультации» — дочерней компании Россельхозбанка. Сегодня поделюсь с вами ощущениями от использования отечественной системы виртуализации РОСПЛАТФОРМА и тем, как мы переводили на нее нашу компанию.

Читать далее
Всего голосов 19: ↑16 и ↓3 +13
Комментарии 35

Разгоняем Ignite в облачной инфраструктуре. Часть 1

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 2.2K

Привет, Хабр! На связи Дмитрий Пшевский @pshevskiy и Семен Попов @samansay, технические лидеры юнита Data в Сбере.

Уже более 6 лет мы заботимся о клиентских данных Сбера — храним, дедублицируем, стандартизируем, маркируем. А сегодня хотим поговорить о производительности сервисов при работе с Ignite или другой подобной системой из облачной инфраструктуры. Мы не будем рассматривать аспекты развертывания и оптимизации работы самого кластера и обсудим производительность сервисов именно на прикладном уровне. Расскажем про сложности перехода на микросервисную архитектуру, работу с толстым и тонким клиентом и отказ от транзакций. Эта статья — обзор нашего доклада на JPoint 2023.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 6

Ближайшие события

Опыт реализации хранилища с использованием Tiger Bridge и Yandex Object Storage

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 869
Добрый день, друзья! Рано или поздно, при эксплуатации файловых серверов Windows любая организация сталкивается с задачей их расширения и масштабирования. Одним из классических способов решения данной задачи, который используется уже очень давно, является технология Distributed File System (DFS). Шло время и в тот момент, когда компания Microsoft полностью развернула всю свою разработку в сторону публичного облака, началось продвижение на рынок новой технологии — Azure Files. Суть данной технологии заключалась в том, что для расширения хранилища наземных серверов предлагается использовать облачное хранилище Azure Blob Storage. В данной статье постараемся рассмотреть этот сценарий на примере использования решений Tiger Bridge и Yandex Object Storage, а также пройтись по некоторым шагам настройки.


Читать дальше →
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 2

FineBI: Обработка данных для начинающих пользователей

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 3.8K

Хабр, привет!

На связи команда Business Intelligence GlowByte. Да-да, те самые неугомонные, которые создали самое крупное русскоязычное сообщество FineBI, проводят обучения, собирают дайджесты и ежегодно организуют масштабные конференции

Меня зовут Александр, я руководитель центра поддержки и обучения BI-решений в GlowByte, и сегодня хочу поделиться с вами небольшим гайдом по обработке данных в FineBI. Этот материал будет полезен начинающим BI-разработчикам.

Данная статья состоит из четырех уроков, которые помогут вам ближе познакомиться с функциями редактирования данных в FineBI. Если после прочтения вы захотите разобраться со всеми особенностями платформы, закрепить базовые знания и прокачать навыки создания сложных визуализаций, приглашаю на наши курсы.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 0

Вредные советы: как самостоятельно внедрить DWH и потратить впустую деньги и время

Время на прочтение 7 мин
Количество просмотров 5K

DWH — это единый репозиторий структурированных данных для построения бизнес-аналитики, отчётов и обеспечения исторического анализа данных.
Многие компании осознают необходимость создания корпоративного хранилища, но не все понимают, что внедрение DWH при неграмотном, спешном подходе может стать дорогим удовольствием, только усугубляющим проблемы в работе с данными.

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Комментарии 11

Кибер Файлы и Р7-Офис: совместная работа с документами теперь еще проще

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 1.4K

Читатели, следящие за публикациями в этом блоге, знакомы, в основном, с нашим флагманским продуктом Кибер Бэкап. Но на этом линейка решений Киберпротекта не заканчивается. Настало время поговорить и о других наших продуктах. Сегодня мы познакомимся с корпоративным решением для синхронизации и обмена файлами Кибер Файлы. 

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 9

Выбор СУБД: шпаргалка, чтобы не запутаться

Время на прочтение 6 мин
Количество просмотров 26K

Вопрос выбора СУБД для российской компании или госоргана – вопрос не праздный, тем более сейчас – когда с момента ухода с рынка западных вендоров прошло уже полтора года и пора что-то решать. Но как не запутаться в номенклатуре СУБД и выбрать ту, которая лучше всего подходит? Без ложной скромности скажу: мы в «Кругах Громова» уже немного поднаторели в систематизации, поэтому надеемся, что наша шпаргалка для тех, кто хочет выбрать СУБД, окажется полезной.

Начнем с классики. СУБД делятся на несколько типов. Не будем описывать их подробно, остановимся только на их основном предназначении.

Читать далее
Всего голосов 23: ↑14 и ↓9 +5
Комментарии 10

В ногу со временем: введение в многомерный анализ и OLAP-технологии

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 3K

В любой компании важно принимать корректные и целесообразные управленческие решения, а для этого необходимо обладать нужной информацией. Поэтому требуется собрать данные из всех информационных систем, привести их к общему виду и после этого проводить анализ. Давай разберемся?

Читать далее
Всего голосов 2: ↑0 и ↓2 -2
Комментарии 5

Своё облако на CasaOS

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 14K

В последнее время я всё чаще задумывался о создании собственного домашнего облака. Я решил исследовать различные варианты операционных систем, специально предназначенных для домашних серверов. В моем поиске я рассмотрел несколько популярных решений, таких как TrueNAS и OpenMediaVault (OMV), каждое из которых предлагало свои уникальные функции и возможности. Однако, несмотря на их многочисленные преимущества, я искал что-то еще более простое и гибкое в настройке. И вот тогда я наткнулся на CasaOS – легковесную и интуитивно понятную операционную систему, которая идеально подошла для моих целей. В этой статье я поделюсь своим опытом работы с CasaOS, расскажу о ее особенностях, возможностях и преимуществах, которые сделали её идеальным решением для моего домашнего облака.

Читать далее
Всего голосов 17: ↑7 и ↓10 -3
Комментарии 32

Вклад авторов