Как стать автором
Обновить
52.01
Рейтинг

Визуализация данных

Облекаем данные в красивую оболочку

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

Как собрать требования к дашборду у технолога, который всегда занят

Блог компании КРОК Big Data *Визуализация данных Data Engineering *
Tutorial

Бывало ли у вас так, что, приготовив потрясающе аппетитное блюдо, на дегустации вы обнаруживали, что что-то напутали с ингредиентами, например, пересолили рыбу? У меня бывало…

Я старший консультант по внедрению бизнес-приложений ИТ-компании КРОК, и это моя задача, чтобы как у плиты, так на рабочем месте, в наших проектах по внедрению озер данных и разработке BI-инструментов для производственных компаний все ингредиенты были на месте. А для этого нужно знать, на какой кухне ты готовишь.

Озера данных, наверное, не были бы так ценны и востребованы, если бы не позволяли «сдруживать» разнообразные стандартные производственные системы и аналитические решения. Для меня озеро - это база, платформа, если хотите, к которой прирастают аналитические решения (в моем случае - BI-дашборды), с которыми непосредственно работает конечный потребитель.

При создании BI-дашбордов для производственных подразделений мне важно обеспечить их бизнес-ценность не только для заказчика в глобальном смысле – некоего металлургического или нефтегазового гиганта, но, прежде всего, для рядового пользователя: если пользователю есть толк от наших панелек, значит и Компания получит эффект.

Если кратенько описывать, то дашборды, которые мы разрабатываем, можно обобщенно отнести к направлению мониторинга отклонений.

Для чего они предназначены? Разберемся.
Всего голосов 18: ↑18 и ↓0 +18
Просмотры 1.3K
Комментарии 2

Новости

InterSystems Reports Server

Блог компании InterSystems Визуализация данных
Tutorial

InterSystems Reports


InterSystems Reports – модуль InterSystems IRIS и InterSystems IRIS for Health. Это современное решение для создания и публикации отчетов, которое включает в себя:


  • Встроенную оперативную отчетность, которая может быть настроена как разработчиками отчетов, так и конечными пользователями.
  • Точное форматирование, позволяющее создавать специализированные формы, например, макеты для счетов, документов и т.д.
  • Макеты, обеспечивающие структуру для отображения как агрегированных, так и транзакционных данных.
  • Позиционирование заголовков, колонтитулов, агрегированных и подробных данных, изображений и вложенных отчетов.
  • Разнообразные типы отчетов.
  • Публикация и распространение отчетов, включая экспорт в PDF, XLS, HTML, XML и другие форматы файлов, печать и архивирование для соблюдения нормативных требований.
Читать дальше →
Рейтинг 0
Просмотры 249
Комментарии 0

Геопривязка pointcloud по опорным точкам

Работа с 3D-графикой *Геоинформационные сервисы *Визуализация данных
Tutorial

Наш маленький стартап решил испытать силы в трёхмерном моделировании городской инфраструктуры. Стоит сразу оговориться, что подразумевается не высокоточное геодезическое картографирование, а оперативное получение трехмерной карты на движущемся транспорте. Для решения этой задачи подобрали бесхозный лидар (трехмерный сканер) и соорудили конструкцию для установки на автомобиль. Надо было быстро и дешево отработать прототип софта для сбора информации. В стек навигации входила инерциалочка и GPS-приёмник. После нескольких заездов по Санкт-Петербургу основной проблемой оказалась точная склейка трехмерных сканов по данным навигации. Чтобы обойти этот момент, мы решили испробовать SLAM-алгоритм чтобы карта строилась только по лидарной съемке. В результате SLAM у нас получилась карта в локальной системе координат, относительно старта маршрута. Для заказчика требовалось выдать трехмерную карту с географической привязкой.

После каждой поездки сохранялся набор облаков точек и трек маршрута. На выходе мы должны получить объединенный pointcloud, где каждая точка будет в глобальной географической системе координат.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 629
Комментарии 2

Аномалии электоральной статистики на выборах в Государственную Думу 2021 года по 125 ОИК

Открытые данные *Визуализация данных Статистика в IT
Из песочницы

Статистика 377 участковых избирательных комиссий Королёва, Пушкино, Сергиева Посада, входящих 125 ОИК по голосованию 19 сентября 2021 года по выборам депутатов Государственной Думы РФ. Диаграммы явки и результативности партий, поиск критерия определения "предполагаемых" фальсификаций. Расчет скорректированного результата.

Три частично перекрывающихся кластера УИК.

Первый: явка 20-45% при доле Единой России 20-40%, условно его обозначим “гладкое голосование”.

Второй: явка 40-65% при доле Единой России 35-65%, условно его обозначим “административная мобилизация”.

Третий: явка более 65% при доле Единой России более 60%, условно его обозначим “предполагаемые грубые фальсификации”.

Читать далее
Всего голосов 27: ↑20 и ↓7 +13
Просмотры 5.7K
Комментарии 34

Веб приложение для анализа и визуализации результатов выборов в Государственную Думу в 2021

Python *Django *Открытые данные *Визуализация данных Data Engineering *
Из песочницы

В результате выборов, которые завершились 19 сентября был сформирован большой массив данных, которые могут рассказать исследователям интресные истории. В статье представлен проект и прототип веб приложения для анализа и визуализации данных выборов в Государственную Думу 2021. В проекте используется фреймворк Django и набор библиотек : Pandas, Matplotlib. 

Читать далее
Всего голосов 14: ↑13 и ↓1 +12
Просмотры 1.9K
Комментарии 5

Будущее BI за открытым ПО

Open source *Визуализация данных Карьера в IT-индустрии
Из песочницы
Перевод

В то время, пока программное обеспечение до сих пор активно развивается в мире, становится ясно, что всё более и более значимую роль сегодня играет программное обеспечение с открытым исходным кодом.

В этой статье я объясню, почему будущее BI за открытым исходным кодом.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 3.7K
Комментарии 4

Анализ статей Хабрахабр

Программирование *Алгоритмы *Визуализация данных

Решила повторить исследование, сделанное в 2017 году и посмотреть, что изменилось за 5 лет. Ссылка на предыдущую статью Анализ статей Хабрахабр и Geektimes. Дизайн сайта изменился, поэтому делала все в jupyter python, а не wolfram mathematica. Далеко не все графики удалось воспроизвести заново. Получился анализ более чем 260000 статей.

Читать далее
Всего голосов 22: ↑22 и ↓0 +22
Просмотры 3.7K
Комментарии 25

Материалы митапа для аналитиков: ценообразование, дашборд для SCRUM-команд, построение процессов

Блог компании Авито Визуализация данных Конференции

По традиции делимся материалами своего последнего митапа для аналитиков. В этот раз записи могут пригодиться тем, кто нанимает людей в команду и начинает выстраивать аналитические процессы, сотрудникам маркетплейсов и площадок для объявлений, а также SCRUM-мастерам. 

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 684
Комментарии 0

Как  делали онлайн карту объектов культурного наследия

Визуализация данных
Из песочницы

В нашем рассказе речь пойдет про то, как мы реализовывали проект “Сохраним наследие” и делали онлайн карту памятников истории и культуры historymap.online. Это небольшая обзорная статья про наш проект. Она не содержит каких либо решений только общую концепцию. В дальнейшем планируем более детально описать этапы работ. 

Читать далее
Всего голосов 14: ↑14 и ↓0 +14
Просмотры 1.5K
Комментарии 17

Учим Kibana работать с Clickhouse (Ярослав Саган, Николай Нестеренко)

Визуализация данных DevOps *


Сотрудники ECOMMPAY IT Ярослав Саган и Николай Нестеренко на конференции HighLoad++2019 рассказали об архитектурном решении для компактного хранения логов в ClickHouse.


На основе их доклада я сделал статью с расшифровкой, так как тема оказалась полезной.


(Ярослав Саган) Мы расскажем о том, как делали архитектуру для компактного хранения логов в ClickHouse; как прикручивали Kibana для просмотра логов, их фильтрации и аналитики. А также расскажем, с какими трудностями столкнулись и что у нас получилось в итоге.

Читать дальше →
Всего голосов 12: ↑12 и ↓0 +12
Просмотры 1.9K
Комментарии 2

Букварь материалиста

Алгоритмы *Визуализация данных Мозг Логические игры Визуальное программирование *
Из песочницы

Мир вокруг нас порой поражает воображение, но часто доходит до того, что воображение поражает мозг, после чего он отказывается работать правильно. Все чаще вокруг себя я вижу примеры иррационального мышления, и ощущаю его влияние на мою жизнь. Результаты такого мышления в большинстве своем плачевны. 

Иррациональное мышление живет в идеалистическом мире, который живет в хаосе, не подчиняясь никаким законам. Ведь если для каждого закон свой, то закона нет ни для кого. Ловушка иррациональности работает сама собой, для ее захлопывания не нужно предпринимать никаких усилий. Намного проще не делать ничего, вместо того чтобы делать хоть что-то. 

Я захотел ответить на вопрос - почему люди отказываются от рационального мышления, и почему позволяют идеалистическому миру заменить материалистический. Эта статья была написана как сборник заметок в процессе изучения диалектики Гегеля, когда я решил заменить тяжелые для слуха и восприятия определения на более легкие и удобоваримые. В процессе написания этих заметок я начал делать выводы, на основе собственных суждений, что и стало основой этой статьи.

Я - человек планеты земля
Всего голосов 20: ↑13 и ↓7 +6
Просмотры 5.5K
Комментарии 124

Потрясающе красиво: как отобразить десятки признаков в данных

Блог компании SkillFactory Python *Программирование *Визуализация данных Машинное обучение *
Перевод
Tutorial

Пока эксперты Хабра дегустируют наши курсы, пробуем алгоритм UMAP урожая 2018, раскрывающий тонкие оттенки данных высокой размерности.

Статья напомнит об этой прекрасной альтернативе t-SNE или PCA и поможет с визуализацией на флагманском курсе Data Science.

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Просмотры 4.6K
Комментарии 0

Мегаанализ распространения Covid-19 в Москве

Python *Big Data *Визуализация данных Машинное обучение *Здоровье
Из песочницы

В этой части целого цикла статей я представлю только статистические данные. В последующих главах будет выполнено предсказание тяжести заболевания, влияния загрязнения воздуха и даже сделано фундаментальное открытие, обобщающее закон Гомперца на различные тяжести течения Covid- 19.

Читать далее
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 4K
Комментарии 7

Геоаналитика с помощью Python и открытых данных: пошаговое руководство

Python *OpenStreetMap *Геоинформационные сервисы *Открытые данные *Визуализация данных
Из песочницы

Геоаналитика с помощью Python: GeoPandas, folium, Uber H3, OSM + примеры как можно определять лучшие локации для поиска помещений под открытие кофейни (и не только).

Читать далее
Всего голосов 27: ↑27 и ↓0 +27
Просмотры 7.9K
Комментарии 34

(Любительский) временной анализ ДЭГ в Москве

Визуализация данных Статистика в IT
Из песочницы

По следам замечательной статьи "Что же не так с ДЭГ в Москве?" я решил проанализировать распределение голосов за разных кандидатов по времени. Результаты меня, мягко говоря, удивили.

Хочу смотреть графики
Всего голосов 32: ↑29 и ↓3 +26
Просмотры 6.6K
Комментарии 16

Как мы в Miro используем Miro

Блог компании Miro Визуализация данных Удалённая работа
Из песочницы

Собрали примеры, как инженеры и тимлиды в Miro используют доску Miro по работе и в личных проектах. Расскажем, какие фичи они применяют и как это можно повторить. Возможно, что-то из примеров вам пригодится.

Читать далее
Всего голосов 12: ↑12 и ↓0 +12
Просмотры 3.8K
Комментарии 4

Q-Q Plots. От чайника до профессионала за один гайд

Визуализация данных Статистика в IT
Tutorial

Как понять, что выборка данных принадлежит определенному распределению? Есть 2 метода: аналитический тест Колмогорова-Смирнова (тест Шапиро-Уилка для нормального) и графический метод при помощи графика квантиль-квантиль плот.

Чем так замечателен второй вариант? Он позволяет делать выводы, не основываясь на таких спорных показателях какp.value.

Графический метод является мощнейшим инструментом анализа, но как сказано в англоязычной статье википедии про Q-Q Plots, требует серьезных навыков для интерпретации. В данной статье я представляю дорожную карту пути к пониманию квантильных графиков.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2.9K
Комментарии 2

Кластеризуем миллионы планов PostgreSQL

Блог компании Тензор PostgreSQL *Алгоритмы *Администрирование баз данных *Визуализация данных

Как найти самые "горячие" запросы на вашем PostgreSQL-сервере? Поискать их в логе и проанализировать план или воспользоваться расширением pg_stat_statements.

А если в лог попадает миллион запросов за сутки?.. Тогда любое значение лимита pg_stat_statements.max окажется недостаточно велико, чтобы собрать правдивую статистику. Так давайте собирать эту статистику прямо с планов!

Но для некоторых сервисов СБИС нам в "Тензоре" производительность запросов к базе настолько важна, что auto_explain.log_min_duration приходится выставлять в единицы миллисекунд - и вот они, миллионы планов... Как не потеряться в них?

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Просмотры 3.2K
Комментарии 4

Битва за условное форматирование: дополняем стандартный функционал Power BI

Big Data *Визуализация данных Статистика в IT
Из песочницы

Как использовать для визуализации такой замечательный инструмент, как условное форматирование, если ваши данные против этого? Как добавить в отчет красивую карту, если несколько точек "портят" всю картину? Как использовать статистические методы для настройки внешнего вида вашего отчета?

Я постарался рассказать об этом на примере выполнения задания для хакатона по Power BI.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 2.2K
Комментарии 2

Вывод SEO мета тегов title и description в виде визуальной структуры для каждой веб-страницы за один раз

Веб-дизайн *Разработка веб-сайтов *Визуализация данных Поисковая оптимизация Дизайн
Перевод

Давно существует куча инструментов от Ahrefs, Mooz, Semrush и т.д., которые показывают главные мета теги для каждой страницы отдельно, в лучшем случае списком.

Но кто-нибудь видел инструмент, который выводит сразу все title и description за раз и показывает это в виде удобной иерархической визуальной структуры для всего веб-сайта?

Давайте по порядку ...

Читать далее
Всего голосов 4: ↑0 и ↓4 -4
Просмотры 2.5K
Комментарии 7

Вклад авторов