Как стать автором
Обновить
75.16

Хранение данных *

Что имеем, то храним

Сначала показывать
Порог рейтинга
Уровень сложности

Как мы Schema Registry для Kafka настраивали, и что могло пойти не так…

Время на прочтение11 мин
Количество просмотров39K

Всем привет.

В статье я опишу, как мы настраивали реестр схем данных для того, чтобы использовать его для сериализации и десериализации сообщений Kafka.

Спойлер: на данный момент реестр схем данных настроен и используется в боевой системе, каких-то проблем, связанных с SR, замечено не было.

Читать далее
Всего голосов 3: ↑2 и ↓1+3
Комментарии4

Тестируем СХД OceanStor Dorado V6: производительность и отказоустойчивость

Время на прочтение6 мин
Количество просмотров4K


Ранее я рассказывал о результатах проверки работы некоторых функций младшей модели OceanStor Dorado V6 от компании Huawei. Была протестирована работа мгновенного виртуального снимка HyperSnap, функций создания мгновенных снимков с высокой частотой HyperCDP и полных копий исходных данных с использованием расписания HyperClone, а также настройки приоритезации потоков ввода-вывода SmartQOS.


Более подробно об организации стенда, подключении оборудования и проведенных ранее испытаниях можно прочитать в предыдущей части.


Ну а теперь, как и обещал, перейдем к тестированию производительности и отказоустойчивости.

Читать дальше →
Всего голосов 9: ↑9 и ↓0+9
Комментарии4

Apache Ozone: следующее поколение хранилища для платформы больших данных

Время на прочтение8 мин
Количество просмотров8.1K

Apache Ozone: следующее поколение хранилища для платформы больших данных

Распределенная файловая система Apache Hadoop (HDFS) де-факто является файловой системой для больших данных. Верная своим корням big data, HDFS работает лучше всего, когда большинство файлов имеют большой размер - от десятков до сотен мегабайт.

Ozone - это распределенное хранилище, которое может управлять как малыми, так и большими файлами. Ozone разрабатывается и внедряется командой инженеров и архитекторов, имеющих значительный опыт управления большими кластерами Apache Hadoop. Это дало нам представление о том, что HDFS делает хорошо, и о некоторых вещах, которые можно делать по-другому.

Читать далее
Всего голосов 4: ↑3 и ↓1+6
Комментарии1

Символы Unicode: о чём должен знать каждый разработчик

Время на прочтение7 мин
Количество просмотров408K


Если вы пишете международное приложение, использующее несколько языков, то вам нужно кое-что знать о кодировке. Она отвечает за то, как текст отображается на экране. Я вкратце расскажу об истории кодировки и о её стандартизации, а затем мы поговорим о её использовании. Затронем немного и теорию информатики.
Читать дальше →
Всего голосов 27: ↑19 и ↓8+25
Комментарии51

Истории

Китайцы воскрешают оптические носители, разработав лазерный диск емкостью 700 ТБ

Время на прочтение3 мин
Количество просмотров36K

Оптические диски уже не используются настолько массово, как это было совсем недавно. Фактически технология постепенно уходит, повторяя судьбу дискет, компакт-кассет и т.п. Правда, новая разработка ученых и инженеров из Китая и Австралии сможет вернуть оптические диски из забвения, если станет востребованной.

Объединенная команда инженеров и ученых из Шанхайского политехнического университета и Мельбурнского технологического института смогла создать новую технологию записи, позволяющую увеличить емкость диска до 700 терабайт. Это гораздо больше, чем у любого другого носителя, включая жесткие диски и SSD.
Читать дальше →
Всего голосов 48: ↑46 и ↓2+57
Комментарии95

Как токенизация упрощает работу с чувствительными данными

Время на прочтение3 мин
Количество просмотров3.7K

Сегодня речь пойдёт о защите информации: рассказываем, зачем превращать персональные данные в неперсональные и как это делается.

У разработчиков есть целый набор технологий для разных сценариев работы с персданными. Чтобы безопасно передать информацию, её шифруют. Чтобы оператор колл-центра не увидел состояние счёта клиента, цифры автоматически скрывают маской. А мы хотим рассказать про технологию токенизации, которую недавно внедрили в одном из наших проектов.

Читать далее
Всего голосов 2: ↑1 и ↓10
Комментарии3

Разработка инфраструктуры вождения автомобилей высокой автономности (HAD)

Время на прочтение20 мин
Количество просмотров2.5K

Технологии автономных автомобилей способны совершить настоящий переворот в транспортной отрасли и оказать существенное долгосрочное влияние на образ нашей жизни, работы и бизнеса: они могут снизить количество жертв дорожно-транспортных происшествий, разгрузить дорожную сеть и высвободить время. Кроме того, в этом случае появятся новые транспортные парадигмы, включая автономные такси и модели «перевозка как услуга» с автомобилями совместного владения.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Проверка двигателя на прочность: как мы тестируем динамические ИБП

Время на прочтение6 мин
Количество просмотров4.3K

Привет, Хабр! Меня зовут Виктор, я главный инженер-энергетик в мегаЦОДе "Удомля". Мои коллеги уже показывали, как мы организуем гарантированное электропитание дата-центра с помощью ДГУ и регулярно проверяем их работоспособность. Но кроме ДГУ есть другое оборудование, которое может одновременно обеспечить гарантированное электроснабжение и бесперебойное питание. Речь о дизельных динамических ИБП (ДИБП). Такие установки стоят в нашем мегаЦОДе, и мы уже немного рассказывали про их устройство в экскурсии по дата-центру.

Сегодня покажу, как мы проводим тестирование дизельных двигателей ДИБП, чтобы быть уверенными в их надежности.

Читать далее
Всего голосов 18: ↑18 и ↓0+18
Комментарии3

Функция AppsON в Dell EMC PowerStore: запускаем приложения прямо на массиве

Время на прочтение7 мин
Количество просмотров2.2K
Мы продолжаем цикл статей о нашей новой линейке систем хранения данных PowerStore. Этот материал посвящен уникальному функционалу, позволяющему запускать на борту системы пользовательские приложения – AppsON.

Для начала вкратце напомним основные особенности PowerStore. Система имеет микроконтейнерную архитектуру. Разные компоненты ОС выделяются в отдельные, изолированные функциональные элементы (контейнеры). Это обеспечивает простую переносимость функций, стандартизацию и быстрое внедрение нового функционала, а также максимальную гибкость развёртывания.


Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Как выбрать облачную систему хранения данных, чтобы получить лучшую производительность и оптимизировать стоимость

Время на прочтение17 мин
Количество просмотров15K

Многие компании активно переносят свои данные в облако, обеспечивая тем самым гибкость и масштабируемость своих приложений. Но те, кто впервые пробуют облачные технологии, нередко сталкиваются с проблемой выбора правильного облачного хранилища под конкретную задачу. Какой тип диска подключить? Когда использовать объектное хранилище, а когда файловое? Какие преимущества и недостатки у каждого из них в облаке? Как можно использовать их совместно, чтобы улучшить утилизацию ресурсов?

Я, Хамзет Шогенов, архитектор облачной платформы Mail.ru Cloud Solutions, расскажу о системах хранения данных, доступных на нашей платформе, подробно остановлюсь на их технических характеристиках и оптимальных вариантах использования.

Читать далее
Всего голосов 14: ↑13 и ↓1+24
Комментарии2

Учебный день Microsoft: основы работы с данными

Время на прочтение1 мин
Количество просмотров2K

22 марта и 23 марта, 11.00-14.20 (GMT+3)

Изучите основные концепции баз данных в облачной среде. Присоединяйтесь к нам на мероприятии «Microsoft Azure Virtual Training Day: основы данных», чтобы получить базовые знания об облачных сервисах обработки данных. Изучите предложения для работы с реляционными и нереляционными данными, а также решения для аналитики больших данных и современных хранилищ данных в Azure.

Подробности и регистрация

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Лицензии связи

Время на прочтение9 мин
Количество просмотров7.8K

Хорошо бы бизнесу дали работать без лицензий, но пока не дают эта статья может быть полезна.

В интернете очень много споров о том, когда и какая именно нужна лицензия связи. Проблема в том, что и в официальных документах эти вопросы описаны очень размыто. Более того, в ряде моментов законодательная база и документы РосКомНадзора не успевают за развитием отрасли. Видно, что ряд положений разрабатывались ещё в 90-е годы и не подходят чётко под современные услуги связи такие как хостинг или SaaS, где хранятся данные пользователей и передаются сообщения, и даже есть голосовая связь (у Slack, Telegram по-моему нет Лицензии на услуги связи по передаче данных для целей передачи голосовой информации).

Хостинг бывает разных типов, которые существенно отличаются друг от друга. Бывает shared-хостинг, виртуальный и размещение или аренда физического оборудования. Внешне для пользователей это всё хостинг, который служит обеспечению работы сайта. Различается техническая реализация. И споры часто сводятся к тому, что если просто хостинг, то лицензия не нужна, а если уже размещение и аренда серверов, то тут нужна. Разберём эти вопросы подробно основываясь на законодательной базе.

Читать далее
Всего голосов 6: ↑4 и ↓2+8
Комментарии6

Статистика и ЦОД: откуда берутся 5 кВт на стойку и почему это немало

Время на прочтение6 мин
Количество просмотров18K

В новостях про запуск дата-центров вы обязательно встретите упоминание мощности в «киловаттах на стойку». За последний год наша объединенная команда DataLine и  «Ростелеком-ЦОД» запустила 4 дата-центра, и мы каждый раз сталкивались с комментариями в соцсетях и вопросами в чатах: «Почему средняя мощность 5 кВт на стойку? Как так, 21-й век, 21-й год, а цифра не меняется? Это слишком мало». 

Сегодня по порядку ответим: как мы считаем мощность на стойку, почему эта цифра не ограничивает заказчика, а наоборот, экономит его ресурсы. Объясню с точки зрения статистики и возьму пару наглядных аналогий из популярной книги «Статистика и котики» (очень классного пособия для обновления забытых знаний).

Читать далее
Всего голосов 23: ↑23 и ↓0+23
Комментарии4

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
10 – 11 октября
HR IT & Team Lead конференция «Битва за IT-таланты»
МоскваОнлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн

Privacy Day 2021: важные дискуссии о приватности и проекты Privacy Accelerator

Время на прочтение21 мин
Количество просмотров1.7K

В День защиты персональных данных 28 января «РосКомСвобода» совместно с Digital Rights Center и Privacy Accelerator провела ежегодную международную конференцию Privacy Day 2021. На ней подвели итоги 2020 года и очертили тренды 2021-го.

Обсуждённые экспертами темы, такие как слежка на фоне пандемии COVID-19, непонимание государством, как правильно защищать персональные данные граждан и утечки информации из компаний, всё ещё остаются актуальными.

Также были представлены важные и интересные проекты Privacy Accelerator: Personalka, SelfPrivacy и Amnezia. С них и начнём.

Читать далее
Всего голосов 16: ↑16 и ↓0+16
Комментарии3

Блеск и нищета Virtual Tape Library

Время на прочтение9 мин
Количество просмотров9K

VTL (они же Virtual Tape Library, если по паспорту) можно назвать одним из самых странных порождений IT индустрии. Родившись в эпоху расцвета ленточных накопителей как классический софтовый эмулятор настоящего железа, многими они были восприняты как ответ на главный вопрос жизни (Вселенной и всего такого), и теперь одни умудряются продавать их за деньги, а другие использовать в проде и считать, что всё нормально.

Я не буду кричать что первые плохие, а вторых надо гнать из профессии. Нет. Я только лишь предлагаю трезво взглянуть на суть VTL.

Читать далее
Всего голосов 14: ↑14 и ↓0+14
Комментарии17

Почему накопители SSD ускоряются после очистки и насколько важен размер кэша — бенчмарки популярных моделей PCIe 4.0

Время на прочтение8 мин
Количество просмотров63K
Почему накопители SSD ускоряются после очистки и насколько важен размер кэша — бенчмарки популярных моделей PCIe 4.0



В прошлом году SSD впервые в истории обогнали HDD по объёму продаж. В отличие от винчестеров, здесь сумасшедший технический прогресс. За несколько лет рынок меняется кардинально: интерфейс NVMe вместо SATA, память SLC→MLC→TLC→QLC…

Замена системного диска с HDD на SSD — иногда самый мощный апгрейд, который можно сделать с компьютером. Главный прирост в отклике системы и софта даёт скорость случайного доступа, которая даже у самых дешёвых SSD на пару порядков быстрее, чем у HDD. А современные SSD практически не уступают по скорости оперативной памяти. Основная проблема — живучесть. При интенсивной эксплуатации они слишком быстро выходят из строя.

Давайте посмотрим, что произошло на рынке потребительских SSD за последние десять лет. И как выбор конкретных технологий влияет на производительность.
Читать дальше →
Всего голосов 34: ↑29 и ↓5+34
Комментарии102

Тест Seagate Exos X18 — жесткий диск корпоративного класса на 18 Тбайт

Время на прочтение7 мин
Количество просмотров17K

Недавно в нашем блоге были опубликованы статьи, посвященные технологиям двойного привода MACH.2 и термомагнитной записи HAMR. Сейчас диски HAMR доступны только ограниченному числу покупателей, и получить их можно в рамках программ Seagate Enterprise Data Systems и Lyve. Мы решили спуститься с небес на землю и поговорить о том, что можно пощупать руками уже сегодня. Героем нашего обзора будет флагманский HDD корпоративного класса Exos X18 на 18 Тбайт, который есть в розничной продаже по вполне разумной цене от 35 тыс. рублей.

В сентябре 2020 года Seagate представила 18-Тбайт HDD IronWolf Pro для SMB/SME NAS, за ним последовала флагманская корпоративная версия Exos X18. Вместе с накопителями была обновлена и конвергентная серверная платформа — представлена модель 2U на 12 3,5" отсеков Exos AP 2U12. Сервер поддерживает два порта 10GBASE-T и два 1 Гбит/с LAN. В качестве процессора используются модели из линейки Xeon v5 v4 с TDP до 85 Вт.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии7

Lenovo повысила производительность дата-центра DreamWorks Animation с помощью жидкостного охлаждения

Время на прочтение4 мин
Количество просмотров2.6K
Lenovo помогла DreamWorks Animation переоборудовать дата-центр, установив HPC-кластер с системой жидкостного охлаждения Neptune. Несмотря на перебои с поставками из-за COVID-19 и неожиданные изменения в планировке водопровода, проект успешно завершен.

DreamWorks Animation — всемирно известная компания, создавшая множество замечательных анимационных франшиз. Каждый год она ставит перед собой новые амбициозные цели и нуждается в высокопроизводительных вычислениях, чтобы их реализовать.


Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии3

Гуляем по новому дата-центру “Ростелеком-ЦОД” в Санкт-Петербурге

Время на прочтение8 мин
Количество просмотров16K

Сегодня отправимся в Калининский район Санкт-Петербурга и со всех сторон посмотрим на дата-центр "Ростелеком-ЦОД", который запустился в декабре 2020 года. Новый ЦОД построили "с нуля"  недалеко от корпусов завода ЛОМО по адресу: ул. Жукова, 43 (не путать с проспектом Маршала Жукова!). 

Пять лет назад здесь было заброшенное строительство мазутохранилища (а мы любим строить на территориях старых заводов). Сейчас на петербургской площадке заказчики уже арендовали первые стойки и заработали облачные сервисы DataLine. 

Погулять и посмотреть
Всего голосов 24: ↑22 и ↓2+22
Комментарии11

Компания LyteLoop Technologies разрабатывает технологию хранения данных на борту орбитальных спутников

Время на прочтение2 мин
Количество просмотров3K

На Хабре как-то рассказывали об идее разместить дата-центр прямо на орбите Земли. Конечно, высказывали ее не только здесь, но сейчас, похоже, она может быть реализована. Компания LyteLoop Technologies работает над созданием технологии по хранению данных на борту спутников. И это не просто фантазии: компании уже выделили $40 млн на реализацию планов.

Хранилище не совсем обычное. Это фотонное хранилище данных, где информация кодируется световыми импульсами, путешествующими в замкнутом оптоволокне или между зеркалами. Представители LyteLoop рассказывают о том, что и на Земле можно создать нечто подобное, но в космосе эту технологию использовать гораздо проще.
Всего голосов 19: ↑19 и ↓0+19
Комментарии11

Вклад авторов