Хранение данных *

Что имеем, то храним

Статьи Посты Новости Авторы Компании

alkir 6 часов назад

Как избежать проблем с производительностью S3 в своём приложении

Простой

12 мин

694

Блог компании Yandex Cloud & Yandex InfrastructureХранение данных*Хранилища данных*Облачные сервисы*

За время работы с объектными хранилищами я встречал немало «подводных рифов» на пути к быстрому и эффективному хранению.

В этой статье я покажу, где чаще всего проседает производительность при работе с S3-совместимым хранилищем, — на примерах из реальных кейсов технической поддержки.

badcasedaily1 8 авг в 20:40

Rust и иммутабельность

Простой

5 мин

1.8K

Блог компании OTUSВысокая производительность*Программирование*Rust*Хранение данных*

Обзор

Привет, Хабр!

Иммутабельность данных в Rust – это основа для создания систем, устойчивых к ошибкам и сайд-эффектам. В этой статье рассмотрим, как Rust позволяет использовать неизменяемые структуры данных для улучшения производительности и безопасности приложений.

Начнем с синтаксических особенностей.

Xcom-shop 6 авг в 12:40

Чем накопители промышленного уровня отличаются от бытовых

Простой

11 мин

7.3K

Блог компании Группа компаний X-ComХранение данных*Накопители

Обзор

Всем очевидно, что промышленные системы вычислений и хранения данных требуют особого подхода к обеспечению их надежности, долговечности и производительности. Поэтому и качество применяемого в таких условиях оборудования должно выходить за рамки стандартных потребительских решений. Сегодня мы поговорим подробнее о промышленных решениях Transcend и разберемся, в чем именно заключаются эти отличия.

+17

victorbuto 3 авг в 15:17

4 тысячи заметок?! Как я веду личную базу знаний в Obsidian

6 мин

43K

Хранение данных*Управление проектами*Контент и копирайтинг*Читальный залНаучно-популярное

Кейс

В моей базе знаний 4 000 заметок.

Да, у меня немного съехала крыша на этой теме. Но решение создать систему для ведения заметок три года назад — пока что лучшая из моих интеллектуальных инвестиций. В этом посте хочу поделиться, зачем я это делаю, в каком формате и какие полезные практические кейсы для себя нашел. Тема бездонная, на самом деле. Можете взять часть идей и развить у себя.

+43

107

ProductStarMain 2 авг в 14:40

Дискеты в наше время: Япония победила их в 2024, метро Сан-Франциско будет использовать до 2030

Простой

5 мин

3.4K

Блог компании ProductStarХранение данных*Хранилища данных*Исследования и прогнозы в IT*

Аналитика

Recovery Mode

В эпоху облачных хранилищ и многотерабайтных жестких дисков использование дискет кажется анахронизмом. Однако несмотря на ограниченную емкость и уязвимость к воздействию внешних факторов, они все еще находят применение.

Например, мы привыкли видеть Японию технологическим лидером во многих отношениях. Так и есть, но это не помогло им избежать проблемы хранения данных на флоппи-дисках. Анастасия Босина, ML-инженер, разобралась, почему Страна восходящего солнца начала борьбу с дискетами и победила, почему по тому же пути не пошел американский Сан-Франциско, и чем это грозит.

fil106 31 июл в 13:57

Как использовать S3-хранилище в Kubernetes: руководство с примерами

11 мин

6.2K

Блог компании SelectelIT-инфраструктура*Серверное администрирование*Хранение данных*Kubernetes*

S3 — не самое быстрое хранилище и подходит не для всех задач. Но это отличный вариант, если нужно организовать надежное и масштабируемое пространство для данных большого объема. По этой причине S3 часто используют в качестве хранилища для приложений, развернутых в Kubernetes.

Привет, Хабр! Меня зовут Филипп, я DevOps-инженер в Selectel. В своей обзорной статье хочу разобрать, какие есть решения для работы с объектным хранилищем из K8s. Соберу тестовый стенд из кластера Managed Kubernetes и покажу, как установить и настроить нужные компоненты через Terraform. Начинаем!

Читать дальше →

+38

randall 30 июл в 14:24

Пайплайны, разметка и версионирование — открытые решения для работы с неструктурированными данными

Простой

5 мин

1.1K

Блог компании MWSБлог компании МТСBig Data*Хранение данных*Data Engineering*

Обзор

Подготовили подборку решений для анализа и обработки неструктурированных данных. Инструменты помогут с разметкой текста, построением соответствующих пайплайнов и версионированием масштабных сводов информации для машинного обучения и не только. Поговорим про Sycamore, Surya, OmniParse, Unstract и Oxen — каждый из этих инструментов имеет открытый исходный код.

Кроме того, организации могут значительно сэкономить на управлении и эксплуатации неструктурированных данных за счет объектного облачного хранилища. Запустили тест-драйв, проверяйте.

+10

Ninil 29 июл в 15:28

Cloud Native vs Cloud Agnostic в Data Engineering'е: выбираем подход

Средний

12 мин

511

Big Data*Хранение данных*Управление разработкой*Хранилища данных*Data Engineering*

Кейс

Сейчас развертывание дата платформ и решений для аналитки в облаке - явление повсеместное. Кажется, что так было (и будет?) всегда. При этом существует постоянное (но не всегда очевидное) противостояние между подходами Cloud Native и Cloud Agnostic. Cloud Native поддерживает использование специфических сервисов конкретного облачного провайдера, в то время как Cloud Agnostic нацелен на создание приложений, которые могут работать на различных облачных платформах без изменений.

Важно осознавать различия между этими подходами и принимать обоснованные решения при выборе одного из них для своего проекта. Этот выбор может существенно повлиять на архитектуру, масштабируемость вашей дата платформы и стоимость разработки и поддержки.

Однако важно помнить, что не следует впадать в крайности и быть абсолютно приверженным только одному из подходов (вспомним акисому Эскобара). Иногда оптимальным решением может быть комбинация обоих подходов, чтобы достичь оптимального баланса между гибкостью и эффективностью.

В данной статье я попытаюсь описать подход, который в итоге я внедрил в своей команде для построения дата-инфраструктуры.

ptsecurity 29 июл в 11:40

Активоцентричность и хранение данных [Оголяемся технологически. MaxPatrol SIEM]

Простой

11 мин

Блог компании Positive TechnologiesИнформационная безопасность*Анализ и проектирование систем*Хранение данных*Хранилища данных*

Привет! Меня зовут Иван Прохоров, я руководитель продукта MaxPatrol SIEM. Мы продолжаем наше технологическое погружение в наш SIEM и сегодня расскажем об активоцентричности и хранении данных. А помогать мне в этом будет мой коллега, архитектор продукта MaхPatrol SIEM, Роман Сергеев.

В прошлой статье мы рассказали, как устроен MaхPatrol SIEM, взглянули на его пайплайн и поговорили про нормализацию и обогащение данных об инцидентах. Тогда же мы вскользь затронули тему активов и сегодня обсудим ее более детально. Разберемся, что такое цифровые активы, зачем они нужны, как их используют и защищают.

И вновь под капот!

Xcom-shop 26 июл в 13:16

Эффективность на максимум: как выбрать оптимальное сетевое хранилище (NAS) для корпоративной среды

Простой

10 мин

5.2K

Блог компании Группа компаний X-ComХранение данных*Хранилища данных*

Мнение

В современном мире, где объемы данных растут экспоненциально, а требования к их доступности и безопасности становятся все жестче, выбор оптимального сетевого хранилища (Network Attached Storage, NAS) становится критически важной задачей для профессионалов и продвинутых пользователей. Правильно подобранное NAS-решение может стать ключевым фактором эффективности IT-инфраструктуры, обеспечивая не только надежное хранение данных, но и повышая производительность всей системы в целом.

При покупке NAS необходимо учитывать множество факторов, каждый из которых может существенно повлиять на эффективность работы и общую стоимость владения системой. Рассмотрим подробнее основные аспекты, на которые следует обратить внимание при выборе NAS для корпоративного использования.

SolarSecurity 25 июл в 14:28

В чем сходство и различия технологий DLP и DAG? Почему один класс систем не заменяет другой?

Средний

8 мин

1.5K

Блог компании СоларИнформационная безопасность*Хранение данных*

Мнение

Дмитрий Богомолов, архитектор отдела проектирования, подготовил материал о ключевых различиям DLP и DAG-решений.

Стремительный рост объемов неструктурированного корпоративного контента стал одной из острейших проблем для ИТ- и ИБ-подразделений. При этом, по оценке международной аналитической компании ITC, суммарный объем данных в ближайшей перспективе достигнет уровня 175 зеттабайт, или 175 миллиардов гигабайт, и существенная доля такой информации будет неструктурированной.

Поэтому управление доступом к неструктурированным данным становится проблемой для большинства крупных компаний. Мы часто слышим, что для решения подобных задач достаточно использовать DLP-системы. Да, нередко подобные продукты закрывают ряд задач по управлению доступом к неструктурированным данным, но в большинстве случаев использование специализированных DAG-платформ более эффективно с точки зрения управления рисками в крупных компаниях.

ru_vds 24 июл в 16:00

Красота и изящество таблицы ASCII

Средний

7 мин

9.7K

Блог компании RUVDS.comПрограммирование*Хранение данных*Стандарты связи*История IT

Ретроспектива

Перевод

Если вы программист или хотя бы немного связаны с программированием¹, то без сомнения сталкивались с таблицей ASCII.

Таблица ASCII полезна. Но знали ли вы, что она ещё красива и изящна?

Сегодня даже не близкие к программированию люди могут знать об ASCII благодаря книгам и фильмам наподобие «Марсианина»²

ASCII по-прежнему с нами; даже если вы передаёте современный Unicode³, то должны знать, что самый популярный формат кодировки UTF-8 специально спроектирован как обратно совместимый с ASCII! Декодировав эту статью как ASCII, вы в целом поймёте её смысл… если закроете глаза на мусорные символы в конце предложений (прим. ред.: имеет смысл только для оригинальной статьи на английском).

Читать дальше →

+72

k0rsakov 24 июл в 08:00

Кто такой Data Engineer | Дата Инженер

Простой

4 мин

3.2K

Big Data*Хранение данных*Хранилища данных*Карьера в IT-индустрииData Engineering*

Туториал

В статье вы узнаете кто такой Data Engineer | Дата Инженер. Какие бывают направления и куда можно посмотреть, чтобы развиваться в дата-инженерии

JetHabr 22 июл в 17:31

СУБДиариум современного инфраструктурщика

5 мин

3.3K

Блог компании Инфосистемы ДжетIT-инфраструктура*Администрирование баз данных*Хранение данных*Софт

Еще относительно недавно (каких‑то лет 10–15 назад) выбор СУБД для приложения в среднестатистической корпоративной среде ограничивался всего тремя вариантами: Microsoft SQL, Oracle и MySQL. При этом каждое решение имело свою нишу. Нужно что‑то серьезное под большую нагрузку — вот вам Oracle, что‑то попроще — MS SQL, а если какое‑то веб‑приложение — то MySQL.

Но все чаще в корпоративной инфраструктуре появляются задачи, требующие нового подхода к выбору СУБД. Речь про потребности, которые смогут закрыть СУБД на основе искусственного интеллекта, или такие решения, как Big Data и NoSQL. При подборе новых решений традиционный способ выбора только ограничивает поиск и не дает нужной производительности и гибкости. При этом часто выбор СУБД сводится к «поставим PostgreSQL, на нем точно заработает». Да, в большинстве случаев заработает, так как сама по себе PostgreSQL модульная и из нее, как из конструктора, можно много чего сделать, но какими усилиями и ресурсами? Быть может, уже на этапе выбора платформы стоит задуматься о том, что подойдет лучше?

В этой статье я расскажу, какие сейчас бывают СУБД и как их можно систематизировать под конкретную задачу. Сразу оговорюсь: я не претендую на истину в последней инстанции, и вполне возможно, что кто‑то смотрит на структурирование СУБД по‑своему.

+15

neohmd 21 июл в 12:35

Как проектируют дата-центры? Разбираемся на практике

10 мин

8.9K

Блог компании SelectelIT-инфраструктура*Хранение данных*IT-компанииИнженерные системы*

Обзор

Стабильность IT-инфраструктуры напрямую зависит от дата-центра, в котором размещены серверы. Одно только расположение предопределяет подключение к электросети и другие коммуникации.

Привет, Хабр! Меня зовут Артём, я руководитель ИТО в Selectel. В этом материале расскажу, как проектируют дата-центры, и сделаю обзор на один из наших дата-центров — «Цветочная 2», который был запущен еще в 2015 году, 17 декабря. Разберем основные системы и покажем, как они выглядят в действии. Подробности под катом!

Читать дальше →

+46

Seleditor 20 июл в 11:26

Дискеты начинают и выигрывают: флот Германии до сих работает с экзотическими 8-дюймовыми флоппи-дисками

3 мин

70K

Блог компании SelectelХранение данных*Компьютерное железоНаучно-популярное

Совсем недавно мы публиковали статью «Япония, наконец, победила дискеты: flawless victory спустя несколько лет борьбы». Но оказывается, до всемирного отказа от флоппи-дисков еще далеко.

Немецкие фрегаты с момента ввода в эксплуатацию работают на 8-дюймовых дискетах. От этих очень экзотичных носителей зависит многое. Корабли не смогут выполнять свои прямые функции, если у команды не окажется подобной дискеты. Как так-то?

Читать дальше →

+59

303

XStepanPetrov 19 июл в 12:08

Huawei выпустила eKitStor Xtreme 200: скоростной SSD для требовательных пользователей

Простой

4 мин

2.6K

Блог компании Группа компаний X-ComХранение данных*НакопителиНастольные компьютерыНоутбуки

Обзор

Компания Huawei хорошо известна. В России прекрасно представлены ноутбуки, смартфоны и прочая мобильная электроника, а также телекоммуникационное оборудование. Но азиатского гиганта, похоже, никто не остановит, ведь компания решила пойти дальше и представила свой первый SSD‑накопитель — eKitStor Xtreme 200, предназначенный для профессионалов и продвинутых пользователей. Посмотрим, чем он так хорош.

k0rsakov 19 июл в 08:00

Всё что нужно знать про DuckDB

Простой

11 мин

6.9K

SQL*Big Data*Хранение данных*Хранилища данных*Data Engineering*

Туториал

В статье рассказано, как вам может помочь утка при работе с данными, с OLAP-нагрузкой и как она может плавать в вашем Data Lake. Вы узнаете всё самое важное про DuckDB и сможете попрактиковаться в работе с DuckDB.

+17

nivolg 18 июл в 16:35

Как перейти на многонодовую архитектуру без боли. Или почти без боли

Средний

13 мин

3.1K

Блог компании HFLabsВысокая производительность*IT-инфраструктура*Хранение данных*Распределённые системы*

Есть у нас флагманский продукт под названием «Единый клиент», с которым работают десятки энтерпрайз-клиентов, оперирующих в нем сотнями миллионов записей. Продукт массивный, обвешанный аналитикой и различными сложными сервисами. В какой-то момент большая часть клиентов захотела получить общий uptime в 99,9%, чего сложно достичь без резервирования решения. И мы начали погружаться в эту тему практически с нуля.

В этом материале хочу поделиться нашим опытом перехода с одной ноды на 10+, расскажу о технических нюансах и решениях, которые мы использовали, а также про всякие боли в процессе перехода.

+16

CyberAGF 17 июл в 09:22

Кибер Инфраструктура 6.0 — Что нового?

7 мин

942

Блог компании КиберпротектВиртуализация*Хранение данных*Хранилища данных*

Обзор

Привет Хабр!

Сегодня познакомимся с ключевыми новинками в версии 6.0 нашего продукта «Кибер Инфраструктура». Кибер Инфраструктура — это гиперконвергентное решение, объединяющее виртуализацию и программно‑определяемые хранилища. Наш продукт присутствует на рынке уже достаточно давно, используется заказчиками из различных отраслей, а также служит программной основой для программно‑аппаратных комплексов ведущих отечественных производителей. Подробнее о Кибер Инфраструктуре см. в обзоре новинок в версии 5.5 здесь.

2 3 ...

108 109

Хранение данных *

Как избежать проблем с производительностью S3 в своём приложении

Новости

Rust и иммутабельность

Чем накопители промышленного уровня отличаются от бытовых

4 тысячи заметок?! Как я веду личную базу знаний в Obsidian

Истории

Дискеты в наше время: Япония победила их в 2024, метро Сан-Франциско будет использовать до 2030

Как использовать S3-хранилище в Kubernetes: руководство с примерами

Пайплайны, разметка и версионирование — открытые решения для работы с неструктурированными данными

Cloud Native vs Cloud Agnostic в Data Engineering'е: выбираем подход

Активоцентричность и хранение данных [Оголяемся технологически. MaxPatrol SIEM]

Эффективность на максимум: как выбрать оптимальное сетевое хранилище (NAS) для корпоративной среды

В чем сходство и различия технологий DLP и DAG? Почему один класс систем не заменяет другой?

Красота и изящество таблицы ASCII

Кто такой Data Engineer | Дата Инженер

Ближайшие события

СУБДиариум современного инфраструктурщика

Как проектируют дата-центры? Разбираемся на практике

Дискеты начинают и выигрывают: флот Германии до сих работает с экзотическими 8-дюймовыми флоппи-дисками

Huawei выпустила eKitStor Xtreme 200: скоростной SSD для требовательных пользователей

Всё что нужно знать про DuckDB

Как перейти на многонодовую архитектуру без боли. Или почти без боли

Кибер Инфраструктура 6.0 — Что нового?

Вклад авторов