Визуализация данных

Облекаем данные в красивую оболочку

Материалы митапа для аналитиков: ценообразование, дашборд для SCRUM-команд, построение процессов

Блог компании Авито Визуализация данных Конференции

По традиции делимся материалами своего последнего митапа для аналитиков. В этот раз записи могут пригодиться тем, кто нанимает людей в команду и начинает выстраивать аналитические процессы, сотрудникам маркетплейсов и площадок для объявлений, а также SCRUM-мастерам.

328

geodezes 5 октября в 16:45

Как делали онлайн карту объектов культурного наследия

Визуализация данных

Из песочницы

В нашем рассказе речь пойдет про то, как мы реализовывали проект “Сохраним наследие” и делали онлайн карту памятников истории и культуры historymap.online. Это небольшая обзорная статья про наш проект. Она не содержит каких либо решений только общую концепцию. В дальнейшем планируем более детально описать этапы работ.

+12

1.3K

chemtech 5 октября в 10:49

Учим Kibana работать с Clickhouse (Ярослав Саган, Николай Нестеренко)

Визуализация данных DevOps *

Сотрудники ECOMMPAY IT Ярослав Саган и Николай Нестеренко на конференции HighLoad++2019 рассказали об архитектурном решении для компактного хранения логов в ClickHouse.

На основе их доклада я сделал статью с расшифровкой, так как тема оказалась полезной.

(Ярослав Саган) Мы расскажем о том, как делали архитектуру для компактного хранения логов в ClickHouse; как прикручивали Kibana для просмотра логов, их фильтрации и аналитики. А также расскажем, с какими трудностями столкнулись и что у нас получилось в итоге.

Читать дальше →

+12

1.6K

snakendead 1 октября в 16:52

Букварь материалиста

Алгоритмы *Визуализация данных Мозг Логические игры Визуальное программирование *

Из песочницы

Мир вокруг нас порой поражает воображение, но часто доходит до того, что воображение поражает мозг, после чего он отказывается работать правильно. Все чаще вокруг себя я вижу примеры иррационального мышления, и ощущаю его влияние на мою жизнь. Результаты такого мышления в большинстве своем плачевны.

Иррациональное мышление живет в идеалистическом мире, который живет в хаосе, не подчиняясь никаким законам. Ведь если для каждого закон свой, то закона нет ни для кого. Ловушка иррациональности работает сама собой, для ее захлопывания не нужно предпринимать никаких усилий. Намного проще не делать ничего, вместо того чтобы делать хоть что-то.

Я захотел ответить на вопрос - почему люди отказываются от рационального мышления, и почему позволяют идеалистическому миру заменить материалистический. Эта статья была написана как сборник заметок в процессе изучения диалектики Гегеля, когда я решил заменить тяжелые для слуха и восприятия определения на более легкие и удобоваримые. В процессе написания этих заметок я начал делать выводы, на основе собственных суждений, что и стало основой этой статьи.

Я - человек планеты земля

5.1K

120

Mojsha 28 сентября в 18:55

Потрясающе красиво: как отобразить десятки признаков в данных

Блог компании SkillFactory Python *Программирование *Визуализация данных Машинное обучение *

Перевод

Tutorial

Пока эксперты Хабра дегустируют наши курсы, пробуем алгоритм UMAP урожая 2018, раскрывающий тонкие оттенки данных высокой размерности.

Статья напомнит об этой прекрасной альтернативе t-SNE или PCA и поможет с визуализацией на флагманском курсе Data Science.

4.3K

PythonAnalyst 28 сентября в 13:55

Мегаанализ распространения Covid-19 в Москве

Python *Big Data *Визуализация данных Машинное обучение *Здоровье

Из песочницы

В этой части целого цикла статей я представлю только статистические данные. В последующих главах будет выполнено предсказание тяжести заболевания, влияния загрязнения воздуха и даже сделано фундаментальное открытие, обобщающее закон Гомперца на различные тяжести течения Covid- 19.

+13

3.9K

TatianaLi 24 сентября в 17:14

Геоаналитика с помощью Python и открытых данных: пошаговое руководство

Python *OpenStreetMap *Геоинформационные сервисы *Открытые данные *Визуализация данных

Из песочницы

Геоаналитика с помощью Python: GeoPandas, folium, Uber H3, OSM + примеры как можно определять лучшие локации для поиска помещений под открытие кофейни (и не только).

+27

7.2K

lionwing 24 сентября в 12:24

(Любительский) временной анализ ДЭГ в Москве

Визуализация данных Статистика в IT

Из песочницы

По следам замечательной статьи "Что же не так с ДЭГ в Москве?" я решил проанализировать распределение голосов за разных кандидатов по времени. Результаты меня, мягко говоря, удивили.

Хочу смотреть графики

+26

6.5K

olgakamasheva 22 сентября в 13:06

Как мы в Miro используем Miro

Блог компании Miro Визуализация данных Удалённая работа

Из песочницы

Собрали примеры, как инженеры и тимлиды в Miro используют доску Miro по работе и в личных проектах. Расскажем, какие фичи они применяют и как это можно повторить. Возможно, что-то из примеров вам пригодится.

+12

3.3K

volodya_research 19 сентября в 02:52

Q-Q Plots. От чайника до профессионала за один гайд

Визуализация данных Статистика в IT

Tutorial

Как понять, что выборка данных принадлежит определенному распределению? Есть 2 метода: аналитический тест Колмогорова-Смирнова (тест Шапиро-Уилка для нормального) и графический метод при помощи графика квантиль-квантиль плот.

Чем так замечателен второй вариант? Он позволяет делать выводы, не основываясь на таких спорных показателях как p.value .

Графический метод является мощнейшим инструментом анализа, но как сказано в англоязычной статье википедии про Q-Q Plots, требует серьезных навыков для интерпретации. В данной статье я представляю дорожную карту пути к пониманию квантильных графиков.

2.7K

Kilor 13 сентября в 17:10

Кластеризуем миллионы планов PostgreSQL

Блог компании Тензор PostgreSQL *Алгоритмы *Администрирование баз данных *Визуализация данных

Как найти самые "горячие" запросы на вашем PostgreSQL-сервере? Поискать их в логе и проанализировать план или воспользоваться расширением pg_stat_statements.

А если в лог попадает миллион запросов за сутки?.. Тогда любое значение лимита pg_stat_statements.max окажется недостаточно велико, чтобы собрать правдивую статистику. Так давайте собирать эту статистику прямо с планов!

Но для некоторых сервисов СБИС нам в "Тензоре" производительность запросов к базе настолько важна, что auto_explain.log_min_duration приходится выставлять в единицы миллисекунд - и вот они, миллионы планов... Как не потеряться в них?

3.1K

Yellow_ki 12 сентября в 18:27

Битва за условное форматирование: дополняем стандартный функционал Power BI

Big Data *Визуализация данных Статистика в IT

Из песочницы

Как использовать для визуализации такой замечательный инструмент, как условное форматирование, если ваши данные против этого? Как добавить в отчет красивую карту, если несколько точек "портят" всю картину? Как использовать статистические методы для настройки внешнего вида вашего отчета?

Я постарался рассказать об этом на примере выполнения задания для хакатона по Power BI.

2.2K

abbey 7 сентября в 10:00

Вывод SEO мета тегов title и description в виде визуальной структуры для каждой веб-страницы за один раз

Веб-дизайн *Разработка веб-сайтов *Визуализация данных Поисковая оптимизация Дизайн

Перевод

Давно существует куча инструментов от Ahrefs, Mooz, Semrush и т.д., которые показывают главные мета теги для каждой страницы отдельно, в лучшем случае списком.

Но кто-нибудь видел инструмент, который выводит сразу все title и description за раз и показывает это в виде удобной иерархической визуальной структуры для всего веб-сайта?

Давайте по порядку ...

-4

2.4K

eduard93 7 сентября в 09:48

Создание отчетов в InterSystems Reports

Блог компании InterSystems Визуализация данных

Tutorial

Введение

! В связи с проблемами Хабра с отображением md текстов, вы можете ознакомится с полным текстом статьи на GitHub.

В мире огромных объемов данных как никогда важно сделать информацию доступной и легко интерпретируемой. С помощью InterSystems Reports (Logi Reports) вы можете легко и эффективно представлять сложные данные. InterSystems Reports – модуль InterSystems IRIS и InterSystems IRIS for Health. Это современное решение для создания и публикации отчетов, которое включает в себя:

Встроенную оперативную отчетность, которая может быть настроена как разработчиками отчетов, так и конечными пользователями.
Точное форматирование, позволяющее создавать специализированные формы, например, макеты для счетов, документов и т.д.
Макеты, обеспечивающие структуру для отображения как агрегированных, так и транзакционных данных.
Позиционирование заголовков, колонтитулов, агрегированных и подробных данных, изображений и вложенных отчетов.
Разнообразные типы отчетов.
Публикация и распространение отчетов, включая экспорт в PDF, XLS, HTML, XML и другие форматы файлов, печать и архивирование для соблюдения нормативных требований.

Читать дальше →

-8

516

Anastasia_rova 6 сентября в 13:35

«Футбол в цифрах»: как аналитика может улучшить ситуацию с футболом в России

Блог компании Нетология Визуализация данных Статистика в IT DIY или Сделай сам Data Engineering *

Привет, Хабр! Меня зовут Владимир Герингер, я автор проекта «Футбол в цифрах». В нём я собираю футбольную статистику, анализирую данные, вывожу закономерности и рассказываю аудитории о самом интересном в виде коротких заметок и подробных статей. Данные — моё хобби, я собрал их достаточно, чтобы сделать выводы об основных проблемах российского футбола и предложить решения.

Как рост и вес футболистов влияют на игру

3.4K

Troechnik 1 сентября в 12:34

Красивое дерево PATRICIA (Реализация на C++)

C++ *Визуализация данных Хранение данных *Хранилища данных *Учебный процесс в IT

Из песочницы

Tutorial

Забытое, сложное, изумительное, красивое дерево со звуком ломающихся коленок.

Прострелить колени о патрицию

+16

4.7K

volodya_research 29 августа в 00:07

Анализ распределения временных интервалов между покупками на R

R *Визуализация данных Статистика в IT

Из песочницы

В статье я провожу ресёрч интервалов между собственными банковскими тратами за последние полгода и с помощью статистических методов в R пытаюсь понять, какому распределению эти интервалы подчиняются.

Я представляю:

1. Код на R для анализа любых временных интервалов.

2. Подбор экспоненциального и степенного распределения под данные с помощью метода максимального правдоподобия (MLE). Для экспоненциального я использую fitdistr() из пакета MASS, а для степенного fit_power_law() из пакета igraph.

3. Проверку данных на соответствие подобранному распределению с помощью теста Колмогорова-Смирнова. Я использую функцию ks.test() из пакета stats.

+12

1.9K

dima_vs 27 августа в 17:07

Как мы внедрили BI-платформу и начали развивать self-service аналитику

Блог компании inDriver Data Mining *Визуализация данных Исследования и прогнозы в IT Статистика в IT

Всем привет! Меня зовут Дима. Я BI Engineering Manager в inDriver. В компанию я пришел в марте 2020 года развивать направление Business Intelligence. О том, как это происходило и происходит сейчас, с какими вызовами приходится сталкиваться и какие у нас планы на будущее по этому направлению, читайте далее в этой статье.

4.3K

ekatsher 26 августа в 14:54

Анализируем данные с помощью визуализации: рисуем поверх Google Maps

Блог компании Ozon Tech Python *Анализ и проектирование систем *Maps API *Визуализация данных

Привет, я Катя, системный аналитик в Ozon. Одна из первых задач, которую мне поручили здесь — проверить качество географических данных. Формально эта задача больше относится к анализу данных, чем к системному анализу. Но меня она очень заинтересовала, ведь требовался не только анализ, но и исследование и, по возможности, реализация решения, а для меня это самое интересное в работе.

Впереди меня ждала RnD-задача с исследованием картографических форматов, рисованием поверх Google Maps и реализацией скрипта на Python. Как я боролась с визуализацией картографических данных, расскажу в этой статье.

+16

4.6K

apolozov 23 августа в 22:04

Как подружить ClickHouse и Power Bi

Визуализация данных Хранилища данных *

Из песочницы

Однажды на работе мне потребовалось построить дашборд в Power BI, но данные хранились в ClickHouse. В Power BI есть много различных конекторов, но специального для ClickHouse нет. В этой статье мы разберемся с данной проблемой!

2.6K

2 3 ...

49 50

Визуализация данных

Материалы митапа для аналитиков: ценообразование, дашборд для SCRUM-команд, построение процессов

Как делали онлайн карту объектов культурного наследия

Учим Kibana работать с Clickhouse (Ярослав Саган, Николай Нестеренко)

Букварь материалиста

Потрясающе красиво: как отобразить десятки признаков в данных

Мегаанализ распространения Covid-19 в Москве

Геоаналитика с помощью Python и открытых данных: пошаговое руководство

(Любительский) временной анализ ДЭГ в Москве

Как мы в Miro используем Miro

Q-Q Plots. От чайника до профессионала за один гайд

Кластеризуем миллионы планов PostgreSQL

Битва за условное форматирование: дополняем стандартный функционал Power BI

Вывод SEO мета тегов title и description в виде визуальной структуры для каждой веб-страницы за один раз

Создание отчетов в InterSystems Reports

Введение

«Футбол в цифрах»: как аналитика может улучшить ситуацию с футболом в России

Красивое дерево PATRICIA (Реализация на C++)

Анализ распределения временных интервалов между покупками на R

Как мы внедрили BI-платформу и начали развивать self-service аналитику

Анализируем данные с помощью визуализации: рисуем поверх Google Maps

Как подружить ClickHouse и Power Bi

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги