Администрирование баз данных *

Все об администрировании БД

Потери данных при репликации в аналитическое хранилище — автоматические сверки и мониторинг качества данных

Блог компании Туту.ру Администрирование баз данных *Big Data *Хранение данных *

Данные из боевых баз в нашей архитектуре асинхронно попадают в аналитическое хранилище (Clickhouse), где уже аналитики создают дашборды для продуктовых команд и делают выборки. Базы здоровые и под ощутимой нагрузкой: мы в день отправляем флот самолётов средней авиакомпании, несколько поездов и кучу автобусов. Поэтому взаимодействий с продуктом много.

ETL-процесс (извлечение данных, трансформация и загрузка в хранилище) часто подразумевает сложную логику переноса данных, и изначально нет уверенности в том, что данные доставляются без потерь и ошибок. Мы используем Kafka как шину данных, промежуточные сервисы на Benthos для трансформации записей и отправки в Clickhouse. На этапе создания пайплайна нужно было убедиться в отсутствии потерь с нашей стороны и корректной логике записи в шину данных.

Проверять вручную расхождения каждый раз не хотелось, кроме того мы нуждались в сервисе, который умел бы сверять новые данные по расписанию и показывать наглядно, где и какие имеются расхождения. Поэтому мы сделали сервис сверок, о котором я и расскажу, потому что готовых решений не нашёл.

Читать дальше →

+15

1.3K

Polina_Averina 21 сентября в 15:54

Apache Kafka в цепочке поставок в пищепроме и ритейле

Блог компании Southbridge Администрирование баз данных *Apache *Хранение данных *DevOps *

Перевод

Цепочка поставок в пищевой промышленности и ритейле — это сложная, медленная и ненадёжная система. В этой статье мы рассмотрим развёртывание Apache Kafka для обработки данных в реальном времени в таких сферах, как производство, логистика, розничная торговля, доставка, рестораны и другие части бизнеса. Это будут примеры из настоящих компаний: Walmart, Albertsons, Instacart, Domino’s Pizza, Migros и т. д.

1.2K

adely-originsecurity 19 сентября в 22:34

Руководство по парольной политике. Часть 2

Информационная безопасность *IT-инфраструктура *IT-стандарты *Администрирование баз данных *Профессиональная литература *

Продолжение. С первой частью можно ознакомиться здесь.

Вторая часть универсального руководства, переведенного экспертами Origin Security специально для наших читателей. Ознакомившись с этим документом, вы узнаете буквально все о создании надежных паролей.

3.2K

Zhbert 15 сентября в 09:46

Обзор UI-инструментов для мониторинга и управления кластерами Apache Kafka

Блог компании Флант Системное администрирование *Администрирование баз данных *DevOps *

Перевод

Прим. перев.: автор этого материала — Герман Осин, старший архитектор решений в Provectus. Осин сравнивает функциональность восьми UI-инструментов, которые помогают решить проблемы наблюдаемости и мониторинга Apache Kafka. Стоит отметить, что обзор скорее вводный. Он будет полезен для первоначального знакомства с возможностями решений.

Apache Kafka — незаменимый инструмент для обработки данных в реальном времени и отслеживания активности приложений. К сожалению, мониторинг кластеров Apache Kafka и управление ими — непростая задача. Решить ее помогают сторонние коммерческие или Open Source-инструменты с графическим интерфейсом и дополнительными функциями в области администрирования и мониторинга.

В статье представлен краткий обзор таких инструментов.

+25

2.3K

Olga_Mokshina 14 сентября в 12:42

Как базы данных «ключ-значение» обеспечивают производительность и масштабируемость без границ

Блог компании VK Администрирование баз данных *Big Data *Хранение данных *

Перевод

Команда VK Cloud перевела статью о базах «ключ-значение». Вы узнаете, в чем их преимущества перед другими БД, какие базы работают по этому принципу и чем они отличаются между собой.

В чем суть баз «ключ-значение»

Суть проста — объекты в них хранятся и извлекаются с помощью ключа. Так мы прощаемся с:

таблицами, столбцами и вводом ant data — всем, что можно так или иначе назвать blob-объектом;
отношениями между объектами;
сложными операциями.

Что же мы получаем взамен, когда отбрасываем все это?

Читать дальше →

+14

7.8K

JetHabr 13 сентября в 10:00

«Сами мы не местные», или Как мы провели миграцию с Oracle на PostgreSQL

Блог компании Инфосистемы Джет Oracle *PostgreSQL *Администрирование баз данных *

Недавно мы написали о том, насколько экономически разумно «переезжать» с Oracle на PostgreSQL. В этом материале хотели бы поделиться практическим опытом, как осуществить миграцию небольшой СУБД, и какие подводные камни вас могут ожидать при этом.

4.6K

Cloud4Y 9 сентября в 17:55

ITить-КОЛОТИТЬ, серии 10-11

Блог компании Cloud4Y Системное администрирование *Администрирование баз данных *DevOps *IT-компании

Привет! Мы продолжаем выкладывать новые выпуски нашего сериала про айтишников. Как он появился и как снимался второй сезон нашего мини-сериала, рассказывали ранее.

1.4K

Orient_19 9 сентября в 09:05

Обзор операторов PostgreSQL для Kubernetes. Часть 3: CloudNativePG

Блог компании Флант PostgreSQL *Администрирование баз данных *DevOps *Kubernetes *

Статья продолжает наш обзорный цикл о PostgreSQL-операторах для Kubernetes. В первой части мы рассматривали операторы Stolon, Crunchy Data и Zalando. Во второй — KubeDB и StackGres, а также объединили все пять операторов в сравнительную таблицу. В этот раз разбираем решение CloudNativePG, его возможности и особенности, а заодно актуализируем таблицу.

+32

2.4K

a_nikitin 8 сентября в 14:07

Куда мы катимся? Вторая часть

Open source *PostgreSQL *Администрирование баз данных *

Tutorial

Продолжим наше знакомство с Point in time Recovery.

В первой части мы рассмотрели ситуацию, когда нужно найти момент, в который была очищена таблица и произвели восстановление до точки находящейся перед этим событием.

В этот раз мы рассмотрим более сложную ситуацию.

5.7K

RED_SOFT 8 сентября в 13:02

Многопоточный бекап и рестор в СУБД Ред База Данных

Блог компании РЕД СОФТ Администрирование баз данных *Firebird/Interbase *Софт

Добрый день. Меня зовут Сергей, я работаю системным архитектором в компании "РЕД СОФТ". При эксплуатации СУБД Ред База Данных или Firebird возникает необходимость выполнить операцию резервного копирования и восстановления. На БД размером сотни гигабайт бекап и рестор занимает часы, а на БД размером несколько терабайт занимает сутки и более. Как ускорить процесс я расскажу под катом.

1.2K

Anna_sokol22 7 сентября в 13:39

Четыре важных теста для Apache Kafka CI/CD с GitHub Actions

Блог компании Southbridge Администрирование баз данных *Apache *GitHub *

Перевод

Если вы используете GitHub для создания приложений Apache Kafka®, наверняка вы захотите интегрировать Kafka в свою среду разработки и эксплуатации GitOps. Эта статья для тех, кто понимает принципы GitOps, ценность непрерывной интеграции и поставки (CI/CD) и важность промежуточных сред (staging).

Мы поговорим о том, как применять принципы GitOps к жизненному циклу разработки клиентского приложения Kafka с помощью GitHub Actions — для тестирования в локальной среде и Confluent Cloud, со Schema Registry и без него, и для эволюции схемы.

+11

1.1K

a_nikitin 6 сентября в 11:31

Куда мы катимся? Первая часть

Open source *PostgreSQL *Администрирование баз данных *

Tutorial

Сегодня я хочу поговорить с вами про такую замечательную вещь как Point in time recovery (PITR) в PostgreSQL.

Механизм восстановления на определенную точку во времени работает таким образом – у нас есть базовый бэкап, созданный при помощи какой-либо утилиты создания бэкапов (например pg_basebackup), а также набор журнальных файлов, постепенно применяя (накатывая) который, мы можем восстановиться до указанной точки.

Звучит это довольно просто, но, как водится, в каждой простой вещи есть какие-то нюансы, вот о них мы сегодня с вами и поговорим.

+10

2.9K

mr-pickles 5 сентября в 12:25

Разбираемся с Redis

Блог компании Wunder Fund Разработка веб-сайтов *Администрирование баз данных *Хранение данных *

Перевод

Этот материал представляет собой глубокое исследование всего, что связано с Redis. В частности — речь пойдёт о различных способах организации хранилищ Redis, о постоянном хранении данных, о форках процессов.

+62

27K

Cloud4Y 2 сентября в 17:52

ITить-КОЛОТИТЬ, серии 7-9

Блог компании Cloud4Y Системное администрирование *Администрирование баз данных *Хранение данных *IT-компании

Продолжаем выкладывать новые выпуски нашего сериала про айтишников. Как он появился и как снимался второй сезон нашего мини-сериала, рассказывали ранее.

1.3K

den-mesh 2 сентября в 09:30

Миграция Laravel Nova с PostgreSQL на CockroachDB. Наш опыт и решение

Блог компании Совкомбанк Технологии PHP *PostgreSQL *Администрирование баз данных *Laravel *

Часто бывает, при ближайшем рассмотрении некоторая проблема выявляет более глубокую, погружаясь в решение которой находишь для себя много интересного.

О такой ситуации на одном из наших проектов и пойдет речь.

2.8K

Anna_sokol22 31 августа в 17:02

Почему KRaft заменил ZooKeeper

Блог компании Southbridge IT-инфраструктура *Администрирование баз данных *

Перевод

Зачем менять ZooKeeper на встроенный лог Apache Kafka® для управления метаданными? В этой статье вы узнаете, зачем нужна была эта замена, какие преимущества даёт протокол консенсуса на основе кворума, вроде Raft, и как работает контроллер кворума поверх протоколов KRaft.

+19

4.6K

dikirilov 30 августа в 15:07

В поисках СУБД для MarTech? Обратите внимание на GreenPlum

Блог компании GlowByte PostgreSQL *Администрирование баз данных *

Несмотря на общую популярность и тренд, Massive Parallel Processing (MPP) РСУБД всё ещё очень редко используются для целей автоматизации маркетинга (платформы aCRM). Часто быстрее и удобнее использовать классическую РСУБД. Однако рано или поздно организации приходят к тому, что вертикальное масштабирование уже не спасает, а бизнес продолжает расти.

В рамках данной статьи хотим поделиться опытом использования Massive Parallel Processing (MPP) РСУБД на примере GreenPlum в проекте внедрения платформы aCRM для автоматизации маркетинговых процессов в крупном Retail.

Поехали!

1.3K

Shyhartskoi 29 августа в 15:03

Нетривиальные способы применить блокчейн на практике

Блог компании Timeweb Cloud Децентрализованные сети *IT-инфраструктура *Администрирование баз данных *Хранение данных *

Перевод

Введение

Блокчейн – это интегрированное решение сразу многих задач информатики, реализованное как единая общедоступная база данных, рассчитанная на постоянную дозапись, при этом прозрачная и поддающаяся криптографической проверке, работающая в распределенной и децентрализованной среде.

Мне много раз доводилось слышать, что технология блокчейна существует, а задачу, которая бы решалась с ее помощью – еще поискать. Я не согласен с такой оценкой, поскольку технологии и информатика, лежащие в основе блокчейна, приложимы на практике для решения повседневных инженерных задач. Один из вариантов использования блокчейна, сразу приходящий на ум – система верификации при управлении зависимостями.

Что, если бы мы хотели гарантировать следующее: всякий раз, когда мы вытягиваем код из VCS (системы контроля версий) этот код будет ровно одинаковым, независимо от того, когда мы его вытянем?

Читать дальше →

3.1K

JetHabr 29 августа в 13:51

«Надо переехать с Oracle на PostgreSQL. Ты только не волнуйся!»

Блог компании Инфосистемы Джет Oracle *PostgreSQL *Администрирование баз данных *

С этого сообщения в мессенджере началось мое масштабное расследование вопроса, который давно не дает спать многим айтишникам — можно ли вот так взять и переехать с Oracle на «свободную» СУБД PostgreSQL?

Этот вопрос сначала бередил умы только тех, кто был в курсе стоимости закупок лицензий. В крупных компаниях бюджет на это мог составлять несколько десятков миллионов долларов. А потом каждый год поддержка вендора «съедала» ещё 22% от стоимости лицензий. Теперь та финансовая боль сменилась другой, и у компаний поменялся запрос: а можно ли заменить? И главное, можно ли организовать это в разумные сроки и по адекватной стоимости?

Скажу сразу, что в этом посте не будет технических аспектов миграции с СУБД Oracle на PostgreSQL. Как это делать и как обходить сложности — разберем в следующий раз. Тут же больше поговорим о целесообразности и возможности миграции. С этим мы разбирались в ходе одного проекта, а заодно развенчали строй существующих иллюзий.

Красная таблетка

+55

20K

Lika_Chernigo 26 августа в 14:59

Как ускорить работу PostgreSQL с помощью конфигурации базы и оптимизации запросов

Блог компании Southbridge Системное администрирование *IT-инфраструктура *Серверное администрирование *Администрирование баз данных *

Когда работаешь с данными, скорость запросов — один из главных показателей эффективности. Чтобы повысить эту скорость, нужно знать не только как оптимизировать сами запросы, но и как конфигурация самой базы влияет на скорость выполнения запроса.

Администратор баз данных в Southbridge и ведущий инженер компании Data Driven Lab Иван Чувашов занимается базами данных 15 лет и сегодня хочет поговорить про оптимизацию запросов. Разбирать все будет на примере PostgreSQL, так как именно с этой базой он сейчас работает плотнее всего.

Эта статья — конспект бесплатного вебинара об оптимизации PostgreSQL от «Слёрма». Если вам удобнее смотреть, а не читать, переходите на YouTube.

+15

11K