Как стать автором
Обновить
116.79

Хранение данных *

Что имеем, то храним

Сначала показывать
Порог рейтинга
Уровень сложности

Российские коммутаторы, ИБП и новые процессоры от AMD и Intel: что подготовил рынок железа в октябре

Время на прочтение 7 мин
Количество просмотров 4.1K

Новый месяц — новый дайджест серверного (и не только) оборудования. Какие новинки приготовил нам октябрь — рассказываем в статье. Спойлер: месяц порадовал новыми процессорами, платформами, дисками, а еще — российскими коммутаторами и ИБП. Уже присматриваете новое железо для своих серверов? Тогда добро пожаловать под кат!
Читать дальше →
Всего голосов 22: ↑22 и ↓0 +22
Комментарии 2

Новости

Системы хранения и обработки данных: что предлагает отечественный производитель

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 2.3K

Системы хранения и обработки данных являются фундаментальными компонентами современной инфраструктуры информационных технологий в бизнесе. По мере интенсивного технологического развития и масштабирования предприятия сталкиваются с неизбежным увеличением потока данных – если раньше с ними можно было справиться силами обычных серверов, то сейчас некоторым компаниям приходится обращаться к помощи программных комплексов и систем с большей ёмкостью.

Системы хранения и обработки данных или СХД отлично справляются не только с огромными объёмами данных, но и позволяют предприятию управлять ими – практически в любой нише, будь то интернет магазин или промышленное производство.

Долгое время на рынке большой популярностью пользовались продукты зарубежных разработчиков. Но после 2022 года российские предприниматели лишились многих востребованных СХД – HPE, DELLEMC, Fujitsu, HGST. Со временем и в этом секторе удалось наладить параллельный импорт – но это практически никак не решило проблему, поскольку поставляемая продукция до сих пор лишена критичных для бизнеса сервиса и технической поддержки.

Поэтому в этой статье мы поговорим об альтернативах отечественных производителей – достойных системах хранения и обработки данных, сертифицированных, безопасных и предоставляющих все необходимые гарантии своим клиентам. 

Читать далее
Всего голосов 4: ↑0 и ↓4 -4
Комментарии 8

Как мы создали и развиваем лабораторию R&D

Уровень сложности Простой
Время на прочтение 12 мин
Количество просмотров 1.2K

Привет, меня зовут Александр, я руковожу Управлением исследований и разработки новых решений в «Ростелеком-ЦОД», если коротко — лабораторией R&D.

Сейчас лаборатория хорошо прокачана и продуктивна, но так было не всегда. В этой статье я расскажу, как мы ее создавали, к чему пришли и как тестируем оборудование, ПАК и ПО.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 1

Как хранить данные в облаке? Краткий экскурс по технологиям

Время на прочтение 8 мин
Количество просмотров 4.9K

Компаниям нужно где-то хранить большое количество данных, но создавать собственные дата-центры — задача не из легких. На помощь приходит облачное хранилище у провайдеров. Он помогает сэкономить на собственной инфраструктуре и надежно хранить данные разных форматов. Достаточно выбрать подходящий тип хранения: блочный, файловый или объектный. О том, в чем между ними разница, рассказываем в статье. А также делимся инструкцией, как начать работу с объектным хранилищем.
Читать дальше →
Всего голосов 22: ↑21 и ↓1 +20
Комментарии 16

Истории

Битва за флешку: кто изобрел USB-накопитель?

Время на прочтение 10 мин
Количество просмотров 8.2K

Кто изобрел USB-накопитель? Однозначно приписать эту заслугу кому-то конкретному нельзя — на авторство претендуют сразу несколько людей и компаний.

Во многом появлению этого изобретения поспособствовала технологическая среда того времени. Флэшка сочетала в себе флеш-память и интерфейс USB в удобном корпусе, который заменил дискеты. 

В этой статье кратко расскажем об основных вехах создания флешки и приведем историю сингапурца Хенна Тана, который один из первых вывел флешку на коммерческий рынок и способствовал ее распространению. Тан вел множество судебных споров о нарушении патентов, но в конечном счете ему удалось добиться лишь ограниченного успеха в борьбе с распространением дизайна флешки.

Читать далее
Всего голосов 23: ↑23 и ↓0 +23
Комментарии 30

Чек-лист: как правильно выбрать поставщика СХД

Время на прочтение 5 мин
Количество просмотров 1.7K

Выбор надежного поставщика систем хранения данных (СХД) является важным шагом для организации, которая стремится обеспечить успешную работу своих инфраструктурных решений. В мире информационных технологий, где объемы данных растут экспоненциально, а потребности клиентов постоянно меняются, надежный поставщик оборудования играет важную роль в обеспечении стабильного функционирования системы.

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 0

Переизобретаем файловую систему: (Open)ZFS

Уровень сложности Простой
Время на прочтение 17 мин
Количество просмотров 12K


Хранение данных — это всегда боль, у которой может быть больше 50 оттенков: железо, кэш, гарантии, производительность, скорость восстановления при проблемах, удобство и прочее. Как решить большинство из них, при этом получив что-то легко обслуживаемое, да ещё бесплатно? Сегодня поговорим про файловые системы на примере не совсем дефолтной OpenZFS.
Читать дальше →
Всего голосов 59: ↑58 и ↓1 +57
Комментарии 68

Обзор популярных файловых систем в системах виртуализации. Часть 2: BTRFS

Время на прочтение 7 мин
Количество просмотров 5.4K

В прошлом материале мы рассказали о типах файловых систем и подробно остановились на системе ZFS. В второй части подробно разберем BTRFS — файловую систему для Unix-подобных ОС.

Читать далее
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 3

Цифровой паспорт оборудования промышленного производства

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 1.1K

Привет, привет!

Представлюсь: меня зовут Тамара, и я являюсь ведущим инженером по нормативно-справочной информации в компании Bimeister.

Начну с того, что это лишь малая часть той большой истории, которую я хочу вам рассказать.

Будет много вопросов типа «Что это?», «Для чего нужен?» и тд. Ищите ответы на эти вопросы ниже, я вам все объясню)

Чем же занимаемся мы, ребята из отдела разработки НСИ? Давайте попробую вам кратко рассказать:

Промышленные предприятия сталкиваются с проблемой создания единой системы нормативно-справочной информации. Возникают трудности с созданием и внедрением общих правил именования оборудования, систем, материалов, товаров, контрагентов, и пр. Предприятиям необходим единый инструмент и общая методология ведения НСИ.

Нормативно-справочная информация – условно постоянный компонент корпоративной информации, являющийся основой для унификации и нормализации данных, сопровождающих протекающие бизнес-процессы, а также регламентацию деятельности организации.

Качественная база данных оборудования (БДО) является основой для построения системы автоматизации/цифровизации процессов Управления техническим обслуживанием и ремонтами (ТОиР). В процессе эксплуатации системы Управления ТОиР предприятиям постоянно требуется актуализация существующих аналитических справочников, составляющих БДО. Чтобы иметь возможность планировать ремонт или техническое обслуживание (ТО) любой конкретной обслуживаемой единицы оборудования, а также вести учет истории ремонтов и отказов (дефекты, параметры состояния, наработка, отказы), необходимо, чтобы эта единица была описана в информационной системе (паспортизирована).

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 3

Настройка NVMe over TCP — для тех, кому надо подключить больше 1 диска единственной конфигурации из всех примеров в Сети

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 12K

Технология NVMe через различные фабрики (далее NVMeOF) оформлена в качестве стандарта летом 2016 года, она была встроена в пятую ветку ядра Linux.

Поэтому, когда было решено мигрировать объемные базы данных с легаси-решений на общедоступные платформы, возник вопрос — можно ли применить эту технологию для увеличения дискового пространства для создания зеркал локальных дисков?

Чтобы все зеркала не вышли из строя сразу, принимать такие диски надо бы небольшими группами с нескольких машин из разных стоек. Идея показалась достойной рассмотрения, поэтому создали небольшой стенд.

Меня зовут Алексей Дрожжов, я старший инженер в билайне, и в этом посте расскажу, как мы решали эту задачу.

Задача: подключить много дисков с нескольких серверов

Читать далее
Всего голосов 20: ↑20 и ↓0 +20
Комментарии 8

«Берегите платье снову, а персональные данные смолоду»: рассуждения и советы по цифровой гигиене

Уровень сложности Простой
Время на прочтение 12 мин
Количество просмотров 7.9K

Всем привет! Меня зовут Андрей, я специалист по информационной безопасности в Selectel. За время своей работы я понял, что часто люди используют правила цифровой гигиены в профессиональной деятельности, но совсем забывают про них в обычной жизни. По данным компании RTM Group, за 2021 год в России зарегистрировано более 249 тыс киберпреступлений, связанных с мошенническими схемами, — и это только известные правоохранительным органам инциденты.

Не хотите подкрепить эту статистику? Тогда давайте вспомним, почему важно соблюдать правила цифровой гигиены, и найдем тот самый «баланс» между комфортом и шапочкой из фольги. Подробности под катом!
Читать дальше →
Всего голосов 44: ↑43 и ↓1 +42
Комментарии 22

Как мы обезличиваем ПДн, сохраняя их смысл и качество. Чтобы тестовый стенд был полезным, будто там данные с прода

Уровень сложности Средний
Время на прочтение 18 мин
Количество просмотров 2.7K

Год назад мы выпустили «Маскировщик» — промышленный софт, который обезличивает персональные данные, сохраняя их качество и смысл. То есть гендерный баланс; социально‑демографическую структуру; родственные связи; страну и оператора в телефоне; валидность паспортов, ИНН, СНИЛС. В общем, «Маскировщик» делает так, чтобы вы тестировали продукты и обучали ML‑модели будто бы на «живых» ПД.

В этой статье пролью свет на методы изменения состава и семантики, которые использует продукт. Для простоты буду называть их «алгоритмами маскирования». Расскажу, по какой логике меняем одни данные другими, какие ограничения и как учитываем.

Разобраться в алгоритмах маскирования
Всего голосов 14: ↑14 и ↓0 +14
Комментарии 7

Anytype вместо Notion

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 12K

Да, N это очень круто, не спорю, но однажды у меня в N закончилось место в 1000 блоков (в A пространство так же ограничено 1Гб, но об этом позже) и дальше заметки вести невозможно, и N предлагает апгрейд

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 39

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
HolyJS
Дата 2 – 12 ноября
Время 15:00 – 19:00
Место Санкт-Петербург Онлайн
IT Recruiting – HR Forum 2023
Дата 8 – 10 ноября
Время 9:00 – 18:00
Место Москва
HR Форум РБК
Дата 9 ноября
Время 10:00 – 16:45
Место Москва
Яндекс Backend Tour
Дата 13 – 26 ноября
Время 18:00 – 23:00
Место Москва Нижний Новгород Екатеринбург Новосибирск Санкт-Петербург Онлайн
Национальный рекламный форум
Дата 15 – 17 ноября
Время 10:00 – 19:30
Место Москва
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
Импульс Т1
Дата 17 ноября
Время 13:00
Место Иннополис Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн
Импульс Т1
Дата 1 декабря
Время 12:30
Место Москва Онлайн

Один на 150 миллионов операций. Расследуем причины выброса времени отклика в операциях ввода-вывода

Время на прочтение 12 мин
Количество просмотров 2.9K

Привет! Я Александр Пищулин, перфоманс-инженер в компании YADRO. Сегодня расскажу об одном интересном случае траблшутинга в работе с системой хранения данных — он касается выброса времени отклика. Поиск причин сбоев, наверное, одно из самых увлекательных занятий в моей работе. Зачастую у подобных задач минимальная формализация подхода к решению, каждый раз может быть своего рода открытием или, если угодно, челленджем.

Так произошло и в случае, который я описываю под катом. Путь решения задачи может показаться не оптимальным, но в итоге именно он привел к неожиданной разгадке всей проблемы. Возможно, вы бы начали искать проблему иначе — предлагаю поделиться вашими соображениями или опытом в комментариях. 

Узнать решение →
Всего голосов 25: ↑25 и ↓0 +25
Комментарии 7

Висмут на пальцах: носимое устройство для хранения данных

Время на прочтение 15 мин
Количество просмотров 2.1K


Когда речь заходит о создании носимого устройства, то одним из первых возникает вопрос комфорта, который напрямую зависит от габаритов. Размеры и архитектура устройства напрямую зависят от функций, которые оно должно выполнять. Порой инженерам приходится создавать своеобразный слоеный торт, накладывая слои разных наноматериалов друг на друга. Естественно, многих тревожил вопрос — возможно ли мультифункциональное носимое устройство, созданное из единственного слоя наноматериала? Ученые из Мельбурнского королевского технологического университета (Австралия) провели исследование, в котором создали прототип такого чудо-устройства, носимого на пальце пользователя и способного не только собирать энергию от движений, но и записывать данные. Из чего было сделано устройство, каков принцип его работы, и каким может быть его практическое применение. Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 0

Restic: эффективное резервное копирование из Stdin

Время на прочтение 5 мин
Количество просмотров 2.3K

Про restic я уже рассказывал в статье Бэкап-хранилище для тысяч виртуальных машин свободными инструментами, с тех пор он остаётся моим любимым инструментом для бэкапа.

Сегодня я опишу вам готовый рецепт того как настроить эффективное бэкапирование чего угодно прямо из stdin, с дедупликацией и автоматической очисткой репозитория от старых копий.

Несмотря на то, что restic отлично подходит для сохранения целых каталогов с данными в этой статье мне хотелось бы сделать упор на сохранении резервных копий на лету прямо из Stdin.

Как правило это бывает актуально для сохранения бэкапов виртуальных машин, баз данных и других, представленных одним большим файлом, данных, которые можно последовательно вычитывать и сразу отправлять в систему бэкапирования.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 3

Размерности качества данных: обеспечение качества данных с помощью Great Expectations

Время на прочтение 7 мин
Количество просмотров 642

Качество данных играет критически важную роль в любом процессе управления данными. Организации используют данные для принятия решений и улучшения различных бизнес-показателей. Однако если данные усеяны неточностями, ошибками или несогласованностями, то они могут нанести больше вреда, чем пользы.

Согласно опросу Gartner за 2020 год, в среднем потери из-за низкого качества данных составляют примерно $12,8 миллиона за год. Как сообщается в последнем отчёте State of Data Quality, задержки продакшена (задержки с выпуском продукта) — характерный симптом низкого качества данных. Высококачественные и безошибочные данные повышают надёжность и верность полученных из них выводов.

Для повышения качества данных необходима система его оценки. В достижении этой цели вам помогут размерности качества данных. Размерности позволяют измерять покрытие и выявлять компоненты, требующие тестирования качества данных.

В этой статье рассматриваются шесть размерностей качества данных: полнота, согласованность, целостность, вневременная актуальность, уникальность и валидность. Определив их, вы сможете обеспечить исчерпывающее понимание качества данных и выявить аспекты, требующие совершенствования. И здесь нам на помощь приходит Great Expectation (GX).
Читать дальше →
Рейтинг 0
Комментарии 1

Эффективные бэкапы в S3 с помощью Restic: краткое пособие по настройке

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 2.3K

В 2007 многие администраторы настраивали бэкапы с помощью утилиты rsync, но для этого нужно было выделять отдельный хост для хранилища. И одной из частых проблем было резервирование этого сервера для бэкапов, которое увеличивало накладные расходы. Также хост бэкапирования располагался рядом с устройствами, для которых нужно было выполнить резервное копирование, настроить мониторинг и другое. Это нарушало правило 3-2-1, поэтому для построения действительно надежной системы нужно располагать хосты в разных дата-центрах.

Сегодня можно прибегнуть к услугам облачного хранения данных — например, использовать объектное хранилище Selectel. В этой инструкции рассмотрим, как работать с ним с помощью утилиты Restic.
Читать дальше →
Всего голосов 36: ↑35 и ↓1 +34
Комментарии 1

ЦЕРН увеличил объем своего хранилища до первого в истории эксабайта. Как хранятся данные Большого адронного коллайдера

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 18K

Когда Большой адронный коллайдер запущен — как например, во время своего второго цикла, с начала 2015 года по 2018 год, — он обрабатывает события на частоте 40 МГц. Другими словами, он учитывает 40 миллионов событий в секунду. Это необходимо, чтобы отслеживать столкновения между частицами, длящиеся менее 25 наносекунд.

Каждое событие содержит в себе примерно 1 мегабайт данных. Это значит, что в систему во время работы коллайдера входит примерно 40 терабайт данных. В секунду! Абсолютно фантастический объем информации, ведь петабайт набирается примерно за полминуты. Около 72 000 средних жестких дисков заполнялись бы каждый час.

Обрабатывать всё это на такой же скорости не представляется возможным; для анализа подобных объемов данных после окончания работы установки требуются годы. Значительная часть отфильтровывается еще на этапе сбора, на что тоже уходят огромные вычислительные ресурсы. Но всё‑таки остальную часть информации нужно где‑то хранить. Для этого европейская организация по ядерным исследованиям (ЦЕРН) содержит самый большой ЦОД в мире.

Читать далее
Всего голосов 61: ↑61 и ↓0 +61
Комментарии 39

TON Storage – прорыв в Web3 или провал?

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 3.4K

TON Storage - это часть экосистемы TON, изначально спроектированной командой Telegram, во главе с Павлом Дуровым. Она предоставляет возможность хранить, скачивать и делиться файлами децентрализованным способом.

Напомню, что работа TON (Telegram Open Network) на несколько лет была запрещена американским, а проект был передан сообществу и переименован в The Open Network.

TON Storage необходим в блокчейн-экосистеме как дешевый способ хранения больших файлов. Хранение файлов непосредственно в блокчейне будет очень дорогим, а потребность в обмене большими файлами между пользователями блокчейна существует. Например, NFT создаются не только на основе изображений, но и музыки и видео. И все эти данные нужно где-то хранить.

Читать далее
Всего голосов 13: ↑13 и ↓0 +13
Комментарии 5

Вклад авторов