Хранилища данных *

Публикации, рассказывающие о хранилищах данных

Статьи Посты Новости Авторы Компании

Hanamime 19 часов назад

Подводные дата-центры и хранение информации в QR-кодах: новшества индустрии ЦОД

Простой

5 мин

896

Блог компании Сбер Хранение данных *Хранилища данных *

Обзор

По данным TAdviser, в России зафиксирован небывалый «бум» строительства ЦОДов. Схожая картина наблюдается и в остальных странах: по итогам 2022 года общий объем данных в мире составил 97 зеттабайт, в 2023 году — 110-120 зеттабайт, а к 2025 году — прогноз вплоть до 180-ти. Всю эту информацию нужно где-то обрабатывать и хранить — потребность в дата-центрах растет ежемесячно. По данным «Коммерсанта», спрос на услуги дата-центров в значительной степени превышает предложение. Именно поэтому на сферу направлено сейчас пристальное внимание, а где внимание, там и высокие технологии.

CyberPaul 6 фев в 10:33

От перфокарт в облако. Где вы хранили файлы десятилетие назад?

Простой

7 мин

1.3K

Блог компании Serverspace IT-инфраструктура *Хранение данных *Хранилища данных *История IT

Ретроспектива

В годы моей бурной юности в ходу были пятидюймовые дискеты. Их и вправду можно было назвать “floppy”, то есть, гибкими — футляр из плотного коленкора довольно легко сгибался, пробивался степлером и даже с некоторым усилием сворачивался в трубку. Перфокарты я тоже застал — родители иногда приносили их домой из вычислительного центра, в котором работали, и маленький я рисовал на этих забавных карточках с напечатанными типографским способом рядами цифр (и совой, сова с надписью «КАНГАС» почему-то накрепко засела в памяти) короткими фломастерами от плоттеров-графопостроителей, которые в ассортименте добывались там же, в ВЦ. Сейчас, используя многогигабайтовое облако, смешно вспоминать эту бумажную карточку емкостью 80 байт. Зато можно сказать, что эволюцию носителей информации от перфокарт к облаку я увидел собственными глазами.

Читать дальше →

+13

flancer 4 фев в 15:00

Web 3.0 и частные данные

8 мин

1.2K

Децентрализованные сети *Веб-разработка *Хранение данных *Хранилища данных *Распределённые системы *

Мнение

Эта публикация является развитием идей, сформулированных в предыдущей статье - "Идентификация пользователей в Web 3.0". После предыдущей публикации я понял, что в массах нет однозначного определения, что же именно называть Web 3.0 - виртуальную реальность, интернет вещей или децентрализацию на базе блокчейна. С моей точки зрения, Web 3.0 - это архитектура веб-приложений, обусловленная спросом пользователей на конфиденциальность их собственных данных.

Развитие идей Web 2.0 привело к тому, что пользователи сами стали товаром. Вернее, товаром стала информация об их связях и предпочтениях, которую собирают и монетизируют корпорации типа Google и Facebook. В ответ на это у многих пользователей появилось желание не делиться своими персональными данными с корпорациями, а хранить свои данные в недоступном для корпораций месте. Размышлениям о том, к каким последствиям может привести персонализация хранимых данных, и посвящена данная публикация. Сразу предупреждаю - это просто моё растекание мыслью по древу, а не "сборник рецептов" или разъяснения "как всё устроено". Не очаровывайтесь, чтобы не разочароваться :)

big-mdm 3 фев в 16:49

Что нового в IMSProg?

Простой

2 мин

C *Хранилища данных *Производство и разработка электроники *

Обзор

Пару месяцев назад я писал историю создания программатора микросхем CH341a для Linux систем. Благодаря вашим отзывам и комментариям программа изменилась, надеюсь в лучшую сторону.

+28

beeline_cloud 1 фев в 16:01

Снова на те же грабли. Разбираемся с ошибками хранения ПДн и способами защиты медицинских данных

5 мин

Блог компании beeline cloud IT-инфраструктура *Хранение данных *Хранилища данных *

Дайджест

Привет, Хабр! Ловите новую подборку от beeline cloud — собрали практические истории по работе с персональными данными. Здесь и основные ошибки хранения ПДн, и советы, которые помогут навести порядок, и примеры защиты личных данных пациентов в виде кейса компании, которая проводит дистанционные медицинские осмотры.

Grigory_Otrepyev 25 янв в 17:59

The СПО Strikes Back

2 мин

1.9K

Open source *Хранение данных *Хранилища данных *

Как-то удачно началась неделя. В поле зрения попали отчет про то, как СПО, преодолевая все трудности - наконец показывает огого какие цифры (по работе дисковой подсистемы в CEPH )

Beeline_tech 25 янв в 14:39

Что находится внутри физического Архива Интернета

4 мин

13K

Блог компании билайн Хранение данных *Хранилища данных *История IT

Обзор

Перевод

Когда я был в Сан-Франциско на AI Engineer Summit, то воспользовался возможностью посетить Архив Интернета — физический архив в калифорнийском городе Ричмонде примерно в двадцати минутах езды от Сан-Франциско.

Я купил билет на «экскурсию по закулисью физического архива» 11 октября и прибыл прямо перед началом; я был рад, что не приехал раньше, потому что физический архив находится (вполне логично) на складе в промышленной части Ричмонда. Похоже, больше ничего интересного в окрестностях нет.

Я попросил водителя Uber подбросить меня до парковки со знаком Internet Archive. Но оглядевшись, я не смог найти публичного входа на склад. Рядом стояло ещё несколько озадаченных фанатов истории Интернета, мы неуклюже поздоровались и начали обсуждать, там ли находимся. Вскоре нас заметила пара людей в конце улицы и помахала нам.

Читать дальше →

+76

ru_vds 23 янв в 12:00

Для чего подходит ультрадешёвый сервер за 130 рублей

Простой

6 мин

45K

Блог компании RUVDS.com Хостинг Серверное администрирование *Хранилища данных *Софт

Обзор

В рекламе RUVDS постоянно упоминаются дешёвые VPS-серверы «за 130 рублей в месяц». Но многие думают, что это маркетинговый трюк: такие серверы может и есть, но только для рекламы, чтобы предложение звучало красиво, а в реальности они совершенно непригодны. Ну что может сервер с 512 МБ оперативной памяти? Конечно же, ничего. На него даже операционка не встанет…

В реальности всё совсем иначе. На этот сервер ставятся разные дистрибутивы Linux, задачи он выполняет реальные, и вы даже получаете выделенный IP-адрес.

Читать дальше →

+74

131

sbondarev 18 янв в 07:52

Процесс Self Service BI или алхимия работы с данными

Простой

6 мин

1.1K

Блог компании Первая грузовая компания (ПГК) Анализ и проектирование систем *IT-инфраструктура *Хранилища данных *Управление проектами *

Кейс

Всем привет, я Сергей Бондарев, Директор по управлению данными и директор по аналитическим решениям ПГК, и сегодня хочу поделиться нашим опытом по поводу построения у нас Self Service BI. При подготовке материала я специально не читал никаких книжек и статей по этой теме, чтобы поделиться исключительно своим опытом, добытым различными экспериментами, в основном удачными.

В 2022 году мы спроектировали и построили платформу данных, включающую хранилище с механизмами доставки данных, систему управления справочной информацией, BI систему. В совокупности системы должны обеспечить наши команды ИТ, цифровой фабрики набором инструментов, необходимых для разработки функционала цифровых продуктов, продуктовой и проектной аналитики. При этом, на этапе сбора требований к проектированию BI платформы сложилось понимание высокого потенциала аналитики, разрабатываемой пользователями самостоятельно.

Перевозка грузов по железной дороге – это сложный процесс, включающий в себя тщательное планирование и координацию всех этапов. В нашей компании используется порядка 150 основных показателей перевозочной, коммерческой, финансовой деятельности, обеспечения технического состояния вагонного парка. Оперирование является довольно сложным бизнесом, и для эффективного управления необходимо постоянно учитывать изменяющиеся условия на базе своевременной аналитики.

Поэтому в нашем случае Self Service решения — это не очередная модная тенденция, а шаг эволюции в развитии ИТ, обусловленный развитием ИТ - компетенций в различных подразделениях компании. Использование языков программирования нашими экономистами, аудиторами, финансистами в своей работе является нормальной практикой. Это не констатация факта о продвинутости наших сотрудников, а про то, что уже длительное время размывается граница между ИТ и не-ИТ компетенциями. Бизнес-аналитики ИТ знают предметную область зачастую наравне с бизнес-экспертами профильных функций, в то время как бизнес-эксперты могут владеть Python или SQL на уровне ИТ-разработчика. В современной организации разделение ИТ и бизнес-подразделения происходит на не границе компетенций, а скорее на уровне границ процессов.

qlever 16 янв в 15:45

Снежинка, Data Vault, Anchor Modeling. Какая методология проектирования DWH подойдет для вашего бизнеса?

6 мин

3.8K

Big Data *Хранение данных *Хранилища данных *

Зачем тратить время на выбор методологии построения DWH? Крайне важно правильно выбрать методологию моделирования данных для хранилища еще на этапе проектирования, это поможет обеспечить необходимый уровень гибкости и масштабируемости, а также позволит синхронизоваться с поставленными бизнес-задачами.

Сравниваем Снежинку, Data Vault и Anchor Modeling и предлагаем алгоритм выбора методологии построения DWH.

Dmitrii43 11 янв в 10:00

Неинвазивный мониторинг ЦОД: повышаем надежность и снижаем затраты

Простой

5 мин

2.8K

Блог компании Wiren Board IT-инфраструктура *Серверное администрирование *Хранилища данных *Инженерные системы *

В центрах обработки данных используется оборудование от разных вендоров, с различными встроенными системами мониторинга. Когда таких систем становится много, уследить за подобным «зоопарком» непросто.

Но как сделать систему мониторинга, которая будет работать в любом автозале, независимо от оборудования?

Как установить такую систему неинвазивно, то есть не вмешиваясь в работу автозала? Как сделать так, чтобы не просто увидеть все события в автозале, но и повысить эффективность энергопотребления? И как при этом не пробить брешь в системе защиты от злоумышленников?

В статье мы как раз рассмотрим такое решение на примере автозала телекоммуникационной компании в Санкт-Петербурге. Интересно? Ныряйте под кат

+12

redrrah 10 янв в 12:49

MinIO Multi-Node Multi-Drive

5 мин

2.6K

Системное администрирование *Хранилища данных *DevOps *

Мнение

Объектное хранилище — название отражает принцип работы, хранение данных в виде объектов с уникальным индексом.

Хочу расcказать о своем опыте работы с одним из них.Меня заинтересовал один конкретный продукт — MinIO, из‑за достаточно простой установки, настройки и не плохого функционала. Есть несколько вариантов инсталляции MinIO:

dbalabolin 9 янв в 03:31

Как сберечь файлы, произведенные сотрудниками на локальном компьютере? Мы синхронизируем их со своим сервером Synology

3 мин

3.8K

Хранилища данных *Облачные сервисы *

Кейс

У сотрудников компании у каждого свой ноут. Они работают и производят при этом массу файлов. Каждый такой файл можно оценивать как некую стоимость в человекочасах. И вдруг человек теряет комп. Или роняет. Или сгорает его диск.

И вся его работа пропала. А фирма должна заново платить ему зарплату, что бы он снова произвел на свет ту же самую работу.

-5

Albert_Wesker 28 дек 2023 в 17:01

Построение архитектур для обработки данных в режиме реального времени при помощи Apache Kafka, Flink и Druid

Сложный

11 мин

7.2K

Блог компании Timeweb Cloud Системное администрирование *IT-инфраструктура *Apache *Хранилища данных *

Обзор

Перевод

Командам, которые занимаются обработкой данных (поступающих пакетными партиями в рабочих потоках) сложно соответствовать современным требованиям по обработке данных в режиме реального времени. Почему? Потому что пакетный поток данных – от доставки данных до их дальнейшей обработки и анализа – это такая вещь, при работе с которой нужно уметь ждать.

Требуется ждать тех данных, которые пойдут на отправку в ETL-инструмент, дожидаться, пока будет обработана куча данных, ждать, пока информация будет загружена в хранилище данных и даже ждать, пока закончат выполняться сделанные запросы.

Но в опенсорсном пространстве есть решение, разработанное в опенсорсе. В сочетании друг с другом Apache Kafka, Flink и Druid, позволяют создать архитектуру для обработки данных, которая работает в режиме реального времени и позволяет исключить все эти этапы ожидания. В этом посте мы исследуем, как комбинация этих инструментов позволяет создавать широкий спектр приложений для обработки данных в режиме реального времени.

Читать дальше →

+18

PackRuble 28 дек 2023 в 12:46

Я сделал Cardoteka и вот как её использовать [кто любит черпать]

Простой

11 мин

1.9K

Программирование *Dart *Хранение данных *Хранилища данных *Flutter *

Обзор

Привет! Самое время в предновогоднее настоящее поделиться с вами опенсУрс проектом :) Встречайте -> Cardoteka <- строгая типизированная обёртка над Shared Preferences (SP) в мире Flutter. Этот материал будет коротким, с рекламными нотками (а точнее, приглашающий к дискуссии в issues и в комментарии) и readme-подтекстом. Так или иначе, это заслуженная метка "Обзор".

https://github.com/PackRuble/cardoteka

https://pub.dev/packages/cardoteka

olegbunin 25 дек 2023 в 12:01

БД — это скальпель или мультитул? Куда привела эволюция СУБД в 2023 году

10 мин

11K

Блог компании Конференции Олега Бунина (Онтико) Блог компании Yandex Cloud & Yandex Infrastructure Администрирование баз данных *Хранение данных *Хранилища данных *

За последние пару десятилетий с ростом объёма данных на рынке СУБД сложился интересный ландшафт. Появились новые СУБД, при этом старые продолжали развиваться — и сориентироваться среди них становилось всё сложнее.

В этой статье предлагаем рассмотреть эволюцию разных СУБД и сравнить их между собой. Поможет нам в этом Олег Бондарь, директор по продукту в Yandex Cloud, который отвечает за развитие YDB — это транзакционная реляционная база данных с открытым исходным кодом. Статья написана по материалам его доклада на Saint Highload++.

+20

suregood 22 дек 2023 в 15:00

Как создать сервис по оценке транспортной доступности новостроек при горящих дедлайнах

Простой

6 мин

1.3K

Блог компании МосТрансПроект SQL *Управление разработкой *Хранилища данных *Транспорт

Кейс

Привет, Habr! Меня зовут Руслан Габдрахманов, я руководитель команды разработки информационных систем в «МосТрансПроекте». Сегодня расскажу, как мы создавали городской сервис «Узнай про ЖК», упрощающий выбор квартиры или жилья.

Sber 22 дек 2023 в 12:11

Разгоняем Ignite в облачной инфраструктуре. Часть 2

Средний

7 мин

824

Блог компании Сбер Хранение данных *Хранилища данных *Облачные сервисы *

Кейс

Привет! С вами Дмитрий Пшевский и Семён Попов, технические лидеры юнита Data в Сбере. Это вторая часть нашего материала о производительности сервисов при работе с Ignite.

В первой части мы рассказали, как перешли от монолита к микросервисной архитектуре, попробовали поработать с толстым клиентом и переключились на тонкого. Расскажем, какие сложности у нас возникли в процессе эксплуатации нашего решения в облачной инфраструктуре, почему пришлось минимизировать транзакционную логику на клиенте и к чему мы пришли в итоге. Статья написана на основе нашего доклада на JPoint 2023.

Поехали!

+16

CloudMTS 21 дек 2023 в 13:22

Big Data в облаке: строим доступное хранилище

Простой

4 мин

2.6K

Блог компании CloudMTS Блог компании МТС Хранение данных *Хранилища данных *Облачные сервисы *

Обзор

За последние годы «большие данные» стали восприниматься более гибко и могут включать в себя объемы, которые ранее не рассматривались как «большие». При этом снизились затраты на хранение и обработку информации. Теперь инструменты работы с данными подобных масштабов доступны даже небольшим компаниям.

Важно помнить, что работа в этом направлении включает в себя разнообразные вызовы, связанные с ограничениями оборудования, типами источников данных, сложностью анализа. Данные нужно правильно собирать, хранить и обрабатывать, а для этого нужно выстроить правильную инфраструктуру.

Сегодня расскажем про решение, которое уменьшит неопределенность при работе с крупными данными и поможет максимально быстро построить с нуля удобную и недорогую систему для аналитических задач в вашей компании.

+11

randall 20 дек 2023 в 11:30

Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

Простой

9 мин

5.7K

Блог компании CloudMTS Блог компании МТС Администрирование баз данных *Хранение данных *Хранилища данных *

Обзор

По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от недорогих обычных серверов до огромных хранилищ на сотни петабайт.

При экспоненциальном росте информации возможности работы с данными расширяются. Отчет LinkedIn о новых вакансиях показывает, что мировой рынок работы в области науки о данных вырастет до 230,80 млрд долларов к 2026 году.

Наука о данных является востребованной, интересной, и, казалось бы, очень сложной областью знаний. Однако хорошая новость заключается в том, что она доступна для новичков. В статье мы разберемся, с какими базовыми основами нужно познакомиться при работе с данными.

2 3 ...

49 50

Хранилища данных *

Подводные дата-центры и хранение информации в QR-кодах: новшества индустрии ЦОД

Новости

От перфокарт в облако. Где вы хранили файлы десятилетие назад?

Web 3.0 и частные данные

Что нового в IMSProg?

Истории

Снова на те же грабли. Разбираемся с ошибками хранения ПДн и способами защиты медицинских данных

The СПО Strikes Back

Что находится внутри физического Архива Интернета

Для чего подходит ультрадешёвый сервер за 130 рублей

Процесс Self Service BI или алхимия работы с данными

Снежинка, Data Vault, Anchor Modeling. Какая методология проектирования DWH подойдет для вашего бизнеса?

Неинвазивный мониторинг ЦОД: повышаем надежность и снижаем затраты

MinIO Multi-Node Multi-Drive

Как сберечь файлы, произведенные сотрудниками на локальном компьютере? Мы синхронизируем их со своим сервером Synology

Ближайшие события

Построение архитектур для обработки данных в режиме реального времени при помощи Apache Kafka, Flink и Druid

Я сделал Cardoteka и вот как её использовать [кто любит черпать]

БД — это скальпель или мультитул? Куда привела эволюция СУБД в 2023 году

Как создать сервис по оценке транспортной доступности новостроек при горящих дедлайнах

Разгоняем Ignite в облачной инфраструктуре. Часть 2

Big Data в облаке: строим доступное хранилище

Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

Вклад авторов