Как стать автором
Обновить
58.52
Рейтинг

Администрирование баз данных *

Все об администрировании БД

Сначала показывать
Порог рейтинга

Потери данных при репликации в аналитическое хранилище — автоматические сверки и мониторинг качества данных

Блог компании Туту.ру Администрирование баз данных *Big Data *Хранение данных *


Данные из боевых баз в нашей архитектуре асинхронно попадают в аналитическое хранилище (Clickhouse), где уже аналитики создают дашборды для продуктовых команд и делают выборки. Базы здоровые и под ощутимой нагрузкой: мы в день отправляем флот самолётов средней авиакомпании, несколько поездов и кучу автобусов. Поэтому взаимодействий с продуктом много.

ETL-процесс (извлечение данных, трансформация и загрузка в хранилище) часто подразумевает сложную логику переноса данных, и изначально нет уверенности в том, что данные доставляются без потерь и ошибок. Мы используем Kafka как шину данных, промежуточные сервисы на Benthos для трансформации записей и отправки в Clickhouse. На этапе создания пайплайна нужно было убедиться в отсутствии потерь с нашей стороны и корректной логике записи в шину данных.

Проверять вручную расхождения каждый раз не хотелось, кроме того мы нуждались в сервисе, который умел бы сверять новые данные по расписанию и показывать наглядно, где и какие имеются расхождения. Поэтому мы сделали сервис сверок, о котором я и расскажу, потому что готовых решений не нашёл.
Читать дальше →
Всего голосов 15: ↑15 и ↓0 +15
Просмотры 1.3K
Комментарии 19

Новости

Apache Kafka в цепочке поставок в пищепроме и ритейле

Блог компании Southbridge Администрирование баз данных *Apache *Хранение данных *DevOps *
Перевод

Цепочка поставок в пищевой промышленности и ритейле — это сложная, медленная и ненадёжная система. В этой статье мы рассмотрим развёртывание Apache Kafka для обработки данных в реальном времени в таких сферах, как производство, логистика, розничная торговля, доставка, рестораны и другие части бизнеса. Это будут примеры из настоящих компаний: Walmart, Albertsons, Instacart, Domino’s Pizza, Migros и т. д.

Читать дальше
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 1.2K
Комментарии 0

Руководство по парольной политике. Часть 2

Информационная безопасность *IT-инфраструктура *IT-стандарты *Администрирование баз данных *Профессиональная литература *

Продолжение. С первой частью можно ознакомиться здесь.

Вторая часть универсального руководства, переведенного экспертами Origin Security специально для наших читателей. Ознакомившись с этим документом, вы узнаете буквально все о создании надежных паролей.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Просмотры 3.2K
Комментарии 8

Обзор UI-инструментов для мониторинга и управления кластерами Apache Kafka

Блог компании Флант Системное администрирование *Администрирование баз данных *DevOps *
Перевод

Прим. перев.: автор этого материала — Герман Осин, старший архитектор решений в Provectus. Осин сравнивает функциональность восьми UI-инструментов, которые помогают решить проблемы наблюдаемости и мониторинга Apache Kafka. Стоит отметить, что обзор скорее вводный. Он будет полезен для первоначального знакомства с возможностями решений.

Apache Kafka — незаменимый инструмент для обработки данных в реальном времени и отслеживания активности приложений. К сожалению, мониторинг кластеров Apache Kafka и управление ими — непростая задача. Решить ее помогают сторонние коммерческие или Open Source-инструменты с графическим интерфейсом и дополнительными функциями в области администрирования и мониторинга.

В статье представлен краткий обзор таких инструментов.

Читать далее
Всего голосов 25: ↑25 и ↓0 +25
Просмотры 2.3K
Комментарии 6

Как базы данных «ключ-значение» обеспечивают производительность и масштабируемость без границ

Блог компании VK Администрирование баз данных *Big Data *Хранение данных *
Перевод


Команда VK Cloud перевела статью о базах «ключ-значение». Вы узнаете, в чем их преимущества перед другими БД, какие базы работают по этому принципу и чем они отличаются между собой.

В чем суть баз «ключ-значение»


Суть проста — объекты в них хранятся и извлекаются с помощью ключа. Так мы прощаемся с:

  • таблицами, столбцами и вводом ant data — всем, что можно так или иначе назвать blob-объектом;
  • отношениями между объектами;
  • сложными операциями.

Что же мы получаем взамен, когда отбрасываем все это?
Читать дальше →
Всего голосов 16: ↑15 и ↓1 +14
Просмотры 7.8K
Комментарии 7

«Сами мы не местные», или Как мы провели миграцию с Oracle на PostgreSQL

Блог компании Инфосистемы Джет Oracle *PostgreSQL *Администрирование баз данных *

Недавно мы написали о том, насколько экономически разумно «переезжать» с Oracle на PostgreSQL. В этом материале хотели бы поделиться практическим опытом, как осуществить миграцию небольшой СУБД, и какие подводные камни вас могут ожидать при этом.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Просмотры 4.6K
Комментарии 11

ITить-КОЛОТИТЬ, серии 10-11

Блог компании Cloud4Y Системное администрирование *Администрирование баз данных *DevOps *IT-компании

Привет! Мы продолжаем выкладывать новые выпуски нашего сериала про айтишников. Как он появился и как снимался второй сезон нашего мини-сериала, рассказывали ранее.

Читать далее
Всего голосов 13: ↑10 и ↓3 +7
Просмотры 1.4K
Комментарии 2

Обзор операторов PostgreSQL для Kubernetes. Часть 3: CloudNativePG

Блог компании Флант PostgreSQL *Администрирование баз данных *DevOps *Kubernetes *

Статья продолжает наш обзорный цикл о PostgreSQL-операторах для Kubernetes. В первой части мы рассматривали операторы Stolon, Crunchy Data и Zalando. Во второй — KubeDB и StackGres, а также объединили все пять операторов в сравнительную таблицу. В этот раз разбираем решение CloudNativePG, его возможности и особенности, а заодно актуализируем таблицу.

Читать далее
Всего голосов 32: ↑32 и ↓0 +32
Просмотры 2.4K
Комментарии 1

Куда мы катимся? Вторая часть

Open source *PostgreSQL *Администрирование баз данных *
Tutorial

Продолжим наше знакомство с Point in time Recovery.

В первой части мы рассмотрели ситуацию, когда нужно найти момент, в который была очищена таблица и произвели восстановление до точки находящейся перед этим событием.

В этот раз мы рассмотрим более сложную ситуацию.

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Просмотры 5.7K
Комментарии 0

Многопоточный бекап и рестор в СУБД Ред База Данных

Блог компании РЕД СОФТ Администрирование баз данных *Firebird/Interbase *Софт

Добрый день. Меня зовут Сергей, я работаю системным архитектором в компании "РЕД СОФТ". При эксплуатации СУБД Ред База Данных или Firebird возникает необходимость выполнить операцию резервного копирования и восстановления. На БД размером сотни гигабайт бекап и рестор занимает часы, а на БД размером несколько терабайт занимает сутки и более. Как ускорить процесс я расскажу под катом.

Читать далее
Всего голосов 11: ↑8 и ↓3 +5
Просмотры 1.2K
Комментарии 0

Четыре важных теста для Apache Kafka CI/CD с GitHub Actions

Блог компании Southbridge Администрирование баз данных *Apache *GitHub *
Перевод

Если вы используете GitHub для создания приложений Apache Kafka®, наверняка вы захотите интегрировать Kafka в свою среду разработки и эксплуатации GitOps. Эта статья для тех, кто понимает принципы GitOps, ценность непрерывной интеграции и поставки (CI/CD) и важность промежуточных сред (staging).

Мы поговорим о том, как применять принципы GitOps к жизненному циклу разработки клиентского приложения Kafka с помощью GitHub Actions — для тестирования в локальной среде и Confluent Cloud, со Schema Registry и без него, и для эволюции схемы.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 1.1K
Комментарии 0

Куда мы катимся? Первая часть

Open source *PostgreSQL *Администрирование баз данных *
Tutorial

Сегодня я хочу поговорить с вами про такую замечательную вещь как Point in time recovery (PITR) в PostgreSQL.

Механизм восстановления на определенную точку во времени работает таким образом – у нас есть базовый бэкап, созданный при помощи какой-либо утилиты создания бэкапов (например pg_basebackup), а также набор журнальных файлов, постепенно применяя (накатывая) который, мы можем восстановиться до указанной точки.

Звучит это довольно просто, но, как водится, в каждой простой вещи есть какие-то нюансы, вот о них мы сегодня с вами и поговорим.

Читать далее
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 2.9K
Комментарии 4

Разбираемся с Redis

Блог компании Wunder Fund Разработка веб-сайтов *Администрирование баз данных *Хранение данных *
Перевод

Этот материал представляет собой глубокое исследование всего, что связано с Redis. В частности — речь пойдёт о различных способах организации хранилищ Redis, о постоянном хранении данных, о форках процессов.

Читать далее
Всего голосов 64: ↑63 и ↓1 +62
Просмотры 27K
Комментарии 5

ITить-КОЛОТИТЬ, серии 7-9

Блог компании Cloud4Y Системное администрирование *Администрирование баз данных *Хранение данных *IT-компании

Продолжаем выкладывать новые выпуски нашего сериала про айтишников. Как он появился и как снимался второй сезон нашего мини-сериала, рассказывали ранее.

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Просмотры 1.3K
Комментарии 0

Миграция Laravel Nova с PostgreSQL на CockroachDB. Наш опыт и решение

Блог компании Совкомбанк Технологии PHP *PostgreSQL *Администрирование баз данных *Laravel *

Часто бывает, при ближайшем рассмотрении некоторая проблема выявляет более глубокую, погружаясь в решение которой находишь для себя много интересного.

О такой ситуации на одном из наших проектов и пойдет речь.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 2.8K
Комментарии 10

Почему KRaft заменил ZooKeeper

Блог компании Southbridge IT-инфраструктура *Администрирование баз данных *
Перевод

Зачем менять ZooKeeper на встроенный лог Apache Kafka® для управления метаданными? В этой статье вы узнаете, зачем нужна была эта замена, какие преимущества даёт протокол консенсуса на основе кворума, вроде Raft, и как работает контроллер кворума поверх протоколов KRaft.

Читать далее
Всего голосов 21: ↑20 и ↓1 +19
Просмотры 4.6K
Комментарии 0

В поисках СУБД для MarTech? Обратите внимание на GreenPlum

Блог компании GlowByte PostgreSQL *Администрирование баз данных *

Несмотря на общую популярность и тренд, Massive Parallel Processing (MPP) РСУБД всё ещё очень редко используются для целей автоматизации маркетинга (платформы aCRM). Часто быстрее и удобнее использовать классическую РСУБД. Однако рано или поздно организации приходят к тому, что вертикальное масштабирование уже не спасает, а бизнес продолжает расти.

В рамках данной статьи хотим поделиться опытом использования Massive Parallel Processing (MPP) РСУБД на примере GreenPlum в проекте внедрения платформы aCRM для автоматизации маркетинговых процессов в крупном Retail.

Поехали!
Всего голосов 5: ↑4 и ↓1 +3
Просмотры 1.3K
Комментарии 2

Нетривиальные способы применить блокчейн на практике

Блог компании Timeweb Cloud Децентрализованные сети *IT-инфраструктура *Администрирование баз данных *Хранение данных *
Перевод
image

Введение


Блокчейн – это интегрированное решение сразу многих задач информатики, реализованное как единая общедоступная база данных, рассчитанная на постоянную дозапись, при этом прозрачная и поддающаяся криптографической проверке, работающая в распределенной и децентрализованной среде.

Мне много раз доводилось слышать, что технология блокчейна существует, а задачу, которая бы решалась с ее помощью – еще поискать. Я не согласен с такой оценкой, поскольку технологии и информатика, лежащие в основе блокчейна, приложимы на практике для решения повседневных инженерных задач. Один из вариантов использования блокчейна, сразу приходящий на ум – система верификации при управлении зависимостями.

Что, если бы мы хотели гарантировать следующее: всякий раз, когда мы вытягиваем код из VCS (системы контроля версий) этот код будет ровно одинаковым, независимо от того, когда мы его вытянем?
Читать дальше →
Всего голосов 11: ↑8 и ↓3 +5
Просмотры 3.1K
Комментарии 7

«Надо переехать с Oracle на PostgreSQL. Ты только не волнуйся!»

Блог компании Инфосистемы Джет Oracle *PostgreSQL *Администрирование баз данных *

С этого сообщения в мессенджере началось мое масштабное расследование вопроса, который давно не дает спать многим айтишникам — можно ли вот так взять и переехать с Oracle на «свободную» СУБД PostgreSQL?

Этот вопрос сначала бередил умы только тех, кто был в курсе стоимости закупок лицензий. В крупных компаниях бюджет на это мог составлять несколько десятков миллионов долларов. А потом каждый год поддержка вендора «съедала» ещё 22% от стоимости лицензий. Теперь та финансовая боль сменилась другой, и у компаний поменялся запрос: а можно ли заменить? И главное, можно ли организовать это в разумные сроки и по адекватной стоимости? 

Скажу сразу, что в этом посте не будет технических аспектов миграции с СУБД Oracle на PostgreSQL. Как это делать и как обходить сложности — разберем в следующий раз. Тут же больше поговорим о целесообразности и возможности миграции. С этим мы разбирались в ходе одного проекта, а заодно развенчали строй существующих иллюзий. 

Красная таблетка
Всего голосов 57: ↑56 и ↓1 +55
Просмотры 20K
Комментарии 72

Как ускорить работу PostgreSQL с помощью конфигурации базы и оптимизации запросов

Блог компании Southbridge Системное администрирование *IT-инфраструктура *Серверное администрирование *Администрирование баз данных *

Когда работаешь с данными, скорость запросов — один из главных показателей эффективности. Чтобы повысить эту скорость, нужно знать не только как оптимизировать сами запросы, но и как конфигурация самой базы влияет на скорость выполнения запроса.

Администратор баз данных в Southbridge и ведущий инженер компании Data Driven Lab Иван Чувашов занимается базами данных 15 лет и сегодня хочет поговорить про оптимизацию запросов. Разбирать все будет на примере PostgreSQL, так как именно с этой базой он сейчас работает плотнее всего.

Эта статья — конспект бесплатного вебинара об оптимизации PostgreSQL от «Слёрма». Если вам удобнее смотреть, а не читать, переходите на YouTube.

Читать далее
Всего голосов 19: ↑17 и ↓2 +15
Просмотры 11K
Комментарии 13

Вклад авторов

Работа