SQL *

Формальный непроцедурный язык программирования

Статьи Посты Новости Авторы Компании

neoflex 13 часов назад

Как расширить компетенции аналитиков при работе с Big Data

Средний

5 мин

458

Блог компании Neoflex SQL *Big Data *

Мнение

В данной статье мы решили рассмотреть вопрос повышения эффективности работы единого хранилища данных компании. Хотим поделиться опытом: как повышение экспертизы аналитиков ЕХД влияет на процесс взаимодействия с хранилищем, и как применять современные тренды в данном процессе. Статья будет полезна командам, которые используют возможности ЕХД больших компаний и занимаются их проектированием.

torus1st 20 часов назад

Иерархическая база данных

Средний

10 мин

2.4K

Oracle *PostgreSQL *SQL *

Из песочницы

Эта статья посвящена реально работающей информационной системе (ИС), основанной на иерархической модели данных. Скажу точнее - это не просто ИС - это инструмент разработки ИС любого уровня сложности, включая ERP, CRM, PPM и т.д., обладающий полным набором средств разработки (инструментом описания структуры данных, встроенным процедурным языком и языком запросов, инструментом разработки экранных форм, инструментом написания программного кода и т.д).

В статье я расскажу не только как это выглядит, но и как это все устроено. Статья будет большая, и поэтому мне придется разбить ее на несколько частей.

Kilor 2 ноя в 09:45

PostgreSQL Antipatterns: ходим по JSON-граблям

Простой

3 мин

7.7K

Блог компании Тензор Высокая производительность *PostgreSQL *SQL *Администрирование баз данных *

Кейс

Недавно попался на глаза примерно такой кусок запроса, и тут прекрасно примерно все:

• множество чтений из CTE (хоть и единственной записи, но все же);

• извлечение по каждому ключу текста с раскастовкой в jsonb;

• извлечение каждого отдельного json-ключа в каждое отдельное одноименное поле;

• "ручное" преобразование текстового представления массива в json в текстовое представление PostgreSQL.

А как - правильно?

+23

MaxRokatansky 1 ноя в 17:15

SQLx: raw SQL в Rust

9 мин

3.4K

Блог компании OTUS SQL *Rust *

Перевод

Когда речь заходит об использовании SQL, экосистеме Rust есть что нам предложить: к счастью, нам доступны несколько отличных готовых к использованию решений. SQLx — это чисто асинхронный, независящий от рантайма SQL-крейт, позволяющий использовать проверяемые во время компиляции запросы без какого-либо DSL.

+11

kkmspb 25 окт в 22:32

Пишем свой QTableView с нуля

Сложный

6 мин

8.5K

C++ *SQL *Qt *

Туториал

Итак жил был фреймворк Qt и последние 10 лет ничего в нем не менялось. И захотел один чел написать свой QTableView с нужным ему функционалом, а именно захотелось ему выводить ячейки в несколько рядов (по горизонтали) в одной строке. Ещё ему хотелось растягивать одну из ячеек по ширине двух других.

Искал, искал чел готовый пример в интернете и не находил. И вот однажды подумал он посмотреть как сделан внутри сам QTableView и стало плохо ему от количества строк кода, не одна тысяча там.

+16

pluzanov 24 окт в 15:24

PostgreSQL 17: Часть 2 или Коммитфест 2023-09

Средний

11 мин

3.5K

Блог компании Postgres Professional PostgreSQL *SQL *

Продолжаем следить за новинками 17-й версии PostgreSQL. На этот раз поговорим о том, чем запомнился сентябрьский коммитфест.

Самое интересное об июльском коммитфесте ― в предыдущей статье серии: 2023-07.

Читать дальше →

+14

NewTechAudit 24 окт в 09:39

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Средний

9 мин

3.3K

Блог компании Сбер SQL *Машинное обучение *Искусственный интеллект

Обзор

Привет, Хабр! На связи участница профессионального сообщества NTA Марина Коробова.

Данные занимают центральное место в информационном обществе. Именно информация является основой для принятия решений, развития бизнеса и научных исследований. Многие организации инвестируют огромные средства в системы, способные хранить, обрабатывать и анализировать данные.

Одной из главных проблем, с которыми сталкиваются компании, это непосредственная работа с базами данных с помощью языка SQL (Structured Query Language). Не все знают этот язык, и не у всех есть время изучать его. Поэтому на рынке появляются инструменты, позволяющие писать запрос на естественном языке и получать ответ на языке запросов.

В посте познакомлю вас с двумя AI-инструментами для генерации SQL-запросов: SQLCoder Defog и SQLthroughAI.

+14

badcasedaily1 17 окт в 11:44

Построение OLAP-запросов с использованием аналитических функций

Простой

7 мин

1.7K

Блог компании OTUS Анализ и проектирование систем *SQL *

Обзор

Привет, уважаемые читатели Хабра! Сегодня мы вас познакомим с OLAP и аналитическими функциями.

OLAP, или Online Analytical Processing, представляет собой технологию для анализа и извлечения данных из больших наборов информации. Это позволяет производить сложные агрегации, расчеты, фильтрации и срезы данных, что особенно полезно при работе с огромными объемами информации. В отличие от OLTP (Online Transaction Processing), который ориентирован на операции с данными, OLAP нацелен на поддержку бизнес-аналитики, многомерного анализа и принятия решений.

apostoldevel 14 окт в 10:59

Отправка и обработка HTTP запросов в PostgreSQL

Средний

7 мин

12K

PostgreSQL *Программирование *SQL *Разработка под Linux *

Из песочницы

Эта статья о том как отправлять и обрабатывать HTTP-запросы непосредственно из/в PostgreSQL. Автор расскажет о том, что такое асинхронное уведомление в PostgreSQL, и наглядно продемонстрирует, как с его помощью можно взаимодействовать с внешними системами из самой СУБД.

+12

neoflex 10 окт в 18:16

Airflow vs NiFi: исследуем оркестратор для формирования витрин данных

Средний

19 мин

2.5K

Блог компании Neoflex Python *SQL *Data Engineering *

Обзор

Сегодня концепция витрин данных является стандартом и используется повсеместно. Поэтому даже небольшим компаниям важно определиться с помощью каких инструментов они будут решать проблему оркестрации процессов построения витрин. Какой инструмент в условиях относительно небольшого бюджета позволит достигать поставленных целей? Этот вопрос мы и постараемся раскрыть в статье. Для этого рассмотрим два известных инструмента: Airflow и NiFi, а также постараемся выявить их сильные и слабые стороны.

Stenlav 8 окт в 14:31

Повышение эффективности SQL-запросов: советы и рекомендации

Средний

12 мин

7.5K

Блог компании OTUS SQL *Microsoft SQL Server *

Из песочницы

Перевод

В статье представлен ряд советов и методов, которые помогут читателям оценить производительность своих SQL-запросов и улучшить ее при необходимости. Здесь будут рассмотрены некоторые ключевые аспекты оптимизации запросов для SQL Server, чтобы помочь пользователям сделать их более эффективными и быстрыми.

+14

oshurkovata 5 окт в 13:28

Регулярные выражения в реальных задачах

Простой

11 мин

11K

Блог компании Росбанк Программирование *SQL *Регулярные выражения *

Туториал

Привет, Хабр! Меня зовут Татьяна, я разработчик в Росбанке, и в этом посте я расскажу про регулярные выражения. По своему опыту могу сказать, что регулярки — это очень полезный инструмент. Я часто пользуюсь ими, решая задачи по обработке текста в базах данных. Вначале я остановлюсь на теории, а затем рассмотрю несколько реальных задач, которые были решены с использованием регулярных выражений.

+17

asmyasnikov 4 окт в 16:34

О Prepared statements, серверном кэше скомпилированных запросов или как эффективно кэшировать запросы в YDB

Средний

9 мин

1.1K

Блог компании YDB SQL *

Туториал

Перевод

Существуют различные способы снижения стоимости выполнения SQL-запросов в современных СУБД. Наиболее распространенными подходами являются использование подготовленных запросы и кэширование. Оба метода доступны в YDB.

Кэширование запросов позволяет скомпилировать запрос один раз (проанализировать его, построить оптимальный план запроса, в т.ч. JIT-скомпилировать в машинный код), а затем повторно выполнить его с разными значениями параметров. Это позволяет сократить общее время выполнения запроса на величину времени компиляции запроса. Кроме того, кэширование запросов значительно сокращает объем вычислительных ресурсов, необходимых для выполнения повторяющихся пользовательских запросов, поскольку они компилируются только при первом запросе (и инвалидации кеша). Ниже мы объясняем, почему в самых общих случаях необходима Prepare, какие трудности возникают с этим в случае распределенной СУБД и как кэшировать запросы без Prepare.

bolik_23 1 окт в 11:30

Многоуровневая группировка в SQL: Grouping sets

Средний

3 мин

8.5K

SQL *

Из песочницы

Описан основной принцип работы конструкции Grouping sets в SQL на примере. Статья будет полезна для тех, кто хочет быстро разобраться с основными принципами группировки с использованием Grouping sets.

+11

yureesk 28 сен в 18:31

Небольшой тест нескольких БД при работе с многими таблицами

Простой

4 мин

5.6K

Тестирование IT-систем *MySQL *PostgreSQL *SQL *SQLite *

Из песочницы

Я новичок в работе с базами данных и для их изучения (а заодно для изучения Питона) начал небольшой пет-проект. В процессе оказалось, что в моей многопользовательской системе запросы к БД всегда касаются только одного пользователя. «Отлично!» подумал я, «раздам каждому пользователю по табличке и сэкономлю ресурсы сервера на индексации!». Конечно сначала я почитал литературу и подобных решений в ней не нашел. Потом сходил на один из популярных ресурсов и там мне объяснили, что так делать нельзя. Но почему – никто объяснить не смог (или возможно не захотел). Поэтому я решил сделать небольшой тест на самых популярных БД – проверить что будет на самом деле.

-5

erbanovanastasia 27 сен в 13:05

Погружаемся в базы данных и SQL: полезные материалы и инструменты от сотрудников Selectel

4 мин

Блог компании Selectel MySQL *SQL *Администрирование баз данных *

Почему программисты SQL так плохо шутят? Потому что их юмор — это всегда "SELECT * FROM jokes WHERE is_funny = 1".

Новичку нужно перебрать много сайтов, чтобы научиться работать с базами данных и понимать такие шутки. Это усложняется тем, что в открытом доступе мало действительно полезных материалов, которые могут закрыть все пробелы в знаниях.

Мы попросили наших коллег порекомендовать полезные ресурсы, которые помогут сделать первые шаги в работе с базами данных и SQL. Сохраняйте подборку в закладки, чтобы сэкономить время на изучение темы, и делитесь своими вариантами в комментариях.

Читать дальше →

+40

zmiik 23 сен в 11:00

Oracle/ClickHouse. DWH. Партицирование как средство быстрого обновления данных

Средний

6 мин

5.3K

Oracle *Программирование *SQL *

Из песочницы

В этой статье хотелось бы рассмотреть такой вопрос - как частичное обновление больших объемов данных в таблицах, которые активно используются пользователями на чтение. Задача является типовой, и с ней сталкивается каждый инженер данных. При этом не важно на какой ступеньке своей карьерной лестницы вы находитесь, Junior или Senior, такие задачи будут.

PastorGL 22 сен в 16:36

Искусство ETL. FAQ по Data Cooker ETL

5 мин

2.4K

Open source *SQL *Big Data *Hadoop *Data Engineering *

FAQ

Как и было обещано, в завершение серии ( 1 • 2 • 3 • 4 • 5 ) статей о разработке инструмента для ETL больших данных, я выкладываю выжимку ответов на вопросы.

А то статьи были в формате туториала для разработчиков таких инструментов (длинные и с высоким уровнем сложности), так что стоит рассказать более кратко и понятно для каждого.

Q. Что это такое?

A. Специализированный инструмент для а) быстрого создания ETL процессов и б) эффективного по стоимости их выполнения.

Промка: https://dcetl.ru
Исходники: https://github.com/PastorGL/datacooker-etl
Официальная группа в телеге: https://t.me/data_cooker_etl

Читать дальше →

Maxilect 19 сен в 15:25

Clickhouse — непростая жизнь в продакшене

Сложный

13 мин

16K

Блог компании Maxilect Высокая производительность *Системное администрирование *SQL *Администрирование баз данных *

Кейс

Около двух лет назад вышла небольшая статья Kafka Streams — непростая жизнь в production, в которой я описывал сложности, с которыми наша команда столкнулась при попытке решить задачи проекта с помощью kafka-streams. Эксперимент вышел неудачным, и мы в итоге совсем отказались от этой технологии. Вместо нее решили попробовать Clickhouse (CH), и сейчас уже можно сказать, что эта база нам очень хорошо подошла и отлично решает почти все задачи, которые нам ставит бизнес. В этой статье я расскажу об особенностях использования CH.

+41

PastorGL 18 сен в 16:34

Искусство ETL. Пишем собственный движок SQL на Spark [часть 5 из 5]

Сложный

14 мин

1.3K

Open source *Программирование *SQL *Big Data *Hadoop *

Туториал

REPL

В данной серии статей я подробно рассказываю о том, как написать на Java собственный интерпретатор объектно-ориентированного диалекта SQL с использованием Spark RDD API, заточенный на задачи подготовки и трансформации наборов данных.

Краткое содержание предыдущей серии, посвящённой API расширения и разного рода технической обвязке:

Расширяемость. API подключаемых функций
Режимы запуска. Пакетный режим, сборка для разных окружений, автотесты

Теперь можно поговорить о последних штрихах, делающих инструмент — инструментом, а именно, об интерактивно-отладочном режиме, то есть, REPL, клиенте и сервере, а также о генераторе документации.

Предупреждение о рейтинге «M for Mature»

Уровень сложности данной серии статей — высокий. Базовые понятия по ходу текста вообще не объясняются, да и продвинутые далеко не все. Поэтому, если вы не разработчик, уже знакомый с терминологией из области бигдаты и жаргоном из дата инжиниринга, данные статьи будут сложно читаться, и ещё хуже пониматься. Я предупредил.

Читать дальше →

2 3 ...

49 50

SQL *

Как расширить компетенции аналитиков при работе с Big Data

Новости

Иерархическая база данных

PostgreSQL Antipatterns: ходим по JSON-граблям

SQLx: raw SQL в Rust

Истории

Пишем свой QTableView с нуля

PostgreSQL 17: Часть 2 или Коммитфест 2023-09

LLM'ы в преобразовании запроса на естественном языке в SQL (text2sql)

Построение OLAP-запросов с использованием аналитических функций

Отправка и обработка HTTP запросов в PostgreSQL

Airflow vs NiFi: исследуем оркестратор для формирования витрин данных

Повышение эффективности SQL-запросов: советы и рекомендации

Регулярные выражения в реальных задачах

О Prepared statements, серверном кэше скомпилированных запросов или как эффективно кэшировать запросы в YDB

Ближайшие события

Многоуровневая группировка в SQL: Grouping sets

Небольшой тест нескольких БД при работе с многими таблицами

Погружаемся в базы данных и SQL: полезные материалы и инструменты от сотрудников Selectel

Oracle/ClickHouse. DWH. Партицирование как средство быстрого обновления данных

Искусство ETL. FAQ по Data Cooker ETL

Clickhouse — непростая жизнь в продакшене

Искусство ETL. Пишем собственный движок SQL на Spark [часть 5 из 5]

Вклад авторов