Как стать автором
Обновить
106.03

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

DORA для DevSecOps: как оценить эффективность процессов ИБ

Время на прочтение 7 мин
Количество просмотров 408

Всем привет! Меня зовут Анастасия Арсеньева, я аналитик данных в Swordfish Security. Наша команда разрабатывает модуль визуализации метрик DevSecOps в рамках развития платформы AppSec.Hub. В предыдущих статьях мы рассказывали вам о том, как можно оценить риски ИБ, зрелость подхода Shift Left и эффективность обработки обнаруженных уязвимостей. Сегодня мы разберем еще один дашборд для оценки процессов безопасности в разработке и поговорим о проекции метрик DORA на DevSecOps.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Новости

FineBI-g brother is still watching: как мы усовершенствовали мониторинг

Уровень сложности Сложный
Время на прочтение 7 мин
Количество просмотров 426

Привет, Хабр! На связи BI-команда Tele2. Ранее мы уже рассказывали о нашем опыте перехода на Fine BI и подходе к анализу действий пользователей на платформе.

В нашем случае мониторинг пользователей и объектов на платформе – вопрос жизненной необходимости. Fine BI пользуется популярностью у бизнес-пользователей, также мы активно развиваем подход self-service: лицензия Сreator предоставлена 300 сотрудникам, всего опубликовано около 400 дашбордов, а неопубликованных пользовательских ad-hoc дашбордов насчитывается несколько тысяч, доступ к платформе есть более чем у 2,5 тыс человек, а MAU стремится к 2000 пользователей.

Под катом про то, как мы усовершенствовали объединение таблиц из FineDB и LogDB в один датасет, решили проблему потери логов из-за замены уже опубликованных дашбордов и углубили возможности мониторинга действий пользователей и взаимосвязей пользовательских действий с объектами.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 2

Как мы научили заводчан строить красивые инженерные отчеты из Jupyter Notebook на Python

Время на прочтение 14 мин
Количество просмотров 5.3K

Была у нас тут история, когда легкий перфекционизм помог привести в порядок конструкторскую документацию и регулярно экономить инженерам кучу дней на прохождение бюрократических процедур. В ее основе – создание системы управления расчетными данными и переход от трудночитаемых и трудноинтегрируемых отчетов Mathcad к гибкой связке Jupyter Notebook с Python и Teamcenter. Но основной рассказ будет про то, как преобразовывать и экспортировать математические формулы, таблицы и другие элементы из Jupyter в красивый и удобный вид.

Читать далее
Всего голосов 51: ↑51 и ↓0 +51
Комментарии 3

Хочу всё знать

Время на прочтение 4 мин
Количество просмотров 1.6K

Я с детства испытывал тягу к знаниям. Смотрел шоу "Своя игра" и поражался тому, откуда можно знать о мире настолько широко. Невозможно было игнорировать тот факт, что гроссмейстеры были в основном, пожилыми, а я хотел все знать сейчас, а не когда я выйду на пенсию. Поэтому я много читал и не переставал мечтать о том, чтобы можно было загрузить информацию в голову напрямую.

Последние несколько лет, компания Neuralink, с Илоном Маском в роли сооснователя, активно работает над созданием такого чипа. Этот факт, однако, повлек дискуссии, что именно произойдет, если информация попадет на чип, к которому у вас есть доступ, однако нейронные связи в вашем мозгу не сформировались и вы эту информацию не обдумывали? Чем эта ситуация отличается от того, когда информация находится в книге, на жестком диске, в телефоне или на компьютере, но вы книгу еще не читали? Разве что простотой доступа?

Эта дискуссия заставила меня задуматься над тем, есть ли иной способ ускорить освоение информации, не подвергаясь рискам от установки чипа, которого, в любом случае, не существует и не появится в обозримом будущем? Так я начал изучать технологии обучения.

Методов обучения множество. Часть из них ориентированы больше на усиление запоминания информации, а другая часть на углубление понимания. Однако, меня интересовало то, что увеличило бы именно скорость. Само собой напрашивается скорочтение. Тут хотелось бы остановиться и обсудить этот метод. Есть многочисленные исследования различных вариаций скорочтения и все они показывают, что скорочтение это миф и те, кто его практикуют, просто водят глазами по странице. Более того, если мы говорим не о художественных произведениях или текстах полных воды, а о "нормальных книгах", то очевидно, что прочитать страницу занимает 1 минуту, а обдумать - 10. Если даже за счет техник скорочтения можно было бы научиться прочитывать страницу за секунду, все еще остается потратить 10 минут на обдумывание.

Читать далее
Всего голосов 11: ↑9 и ↓2 +7
Комментарии 5

Истории

Разоблачаем эффект Даннинга-Крюгера — теперь с регрессией

Время на прочтение 6 мин
Количество просмотров 2.5K

Кратко:

1. В оригинальном исследовании показано совсем не то, что люди думают.

2. Оригинальное исследование так криво сделано статистически, что просто не удовлетворяет критерию фальсифицируемости. Простыми словами - генератор случайных чисел демонстрирует такой же результат.

3. Единственное, что этот эффект демонстрирует - это любовь людей к красивым историям (а математику никто не любит … и вообще есть ложь, большая ложь и статистика).

Читать далее
Всего голосов 16: ↑13 и ↓3 +10
Комментарии 18

Лучшие патенты России за 2018-2022 года

Уровень сложности Средний
Время на прочтение 17 мин
Количество просмотров 1.7K

В своей прошлой статье я анализировал разные параметры патентной активности в РФ в 2018–2022 годах. Выяснилось, что очень много патентов на полезные модели ничего не стоят, а вузы создали конвейер по патентованию полезных моделей ради отчетности и показателей.

В этой статье я анализирую наиболее ценные патенты — те, по которым были осуществлены распоряжения правами (заключены лицензионные договоры, сублицензионные договоры, договоры отчуждения или договоры залога). Это объективный индикатор ценности патента, так как если кто‑то платит за него деньги, то, значит, он действительно нужен на рынке. Конечно, есть патенты, которые используют сами правообладатели, и они действительно могут приносить им большую пользу, но выявить их и оценить на практике не представляется возможным, поэтому, вероятно, часть действительно ценных патентов в эту статью не попала.

Код и исходные данные здесь.

Как осуществлялось исследование

Из открытых данных  была собрана база всех заявок и выданных по ним патентов, отобраны патенты, по которым осуществлялось распоряжение интеллектуальными правами, обеспеченными этими патентами. Далее этот массив патентов анализировался.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 16

Нетипичные сценарии использования BI-системы (Apache Superset)

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 4K

Всем привет!

Сегодня поговорим о немного нетипичной для меня теме, а именно — Apache Superset. Обычно я пишу длинные «философские» статьи «на свободную тему», но в этот раз — это будет туториал. Так что кому‑то может показаться банальностью, но, опять таки, вдруг кому поможет. Почему‑то именно по суперсету на Хабре оскорбительно мало материалов. Да, у него в целом неплохая документация, но она все же — документация, поэтому в меру сухая, в ней нет дополнительных объяснений, примеров. Попробуем хоть немного исправить эту ситуацию.

Читать далее
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 7

Выбор информационной системы для автоматизации вашей бизнес-задачи – разбираемся вместе с GlowByte

Время на прочтение 12 мин
Количество просмотров 1.3K

Вопрос автоматизации бизнес-процессов всегда был актуален для большого количества современных компаний, и в последние несколько лет тренд на автоматизацию набирает всё большие обороты.  

Информационные системы (ИС) позволяют повысить качество бизнес-процессов компании, в том числе связанных со стратегическим планированием, прогнозированием и оценкой эффективности бизнеса в целом.

На рынке существует множество ИС, которые позиционируют себя как продукты, способные решить подобные задачи. В аббревиатурах вообще можно запутаться (BI, ERP, CRM, CPM, EPM, BPM и т. д.). Все эти аббревиатуры, на самом деле, представляют очень разные типы информационных систем, и надо бы разобраться, какой из них подходит под вашу конкретную задачу. При этом внутри каждого типа существует большой выбор различных вендоров, и вопрос выбора становится ещё менее очевидным: не погружённому в специфику продуктов пользователю далеко не всегда понятно, сможет ли конкретная система полностью удовлетворить запрос именно его компании. 

Мы – направление FI (Financial Intelligence) компании GlowByte, специализируемся на внедрении информационных систем, знаем особенности, плюсы и минусы каждой. Этой статьёй мы начинаем цикл публикаций о том, как сделать автоматизацию бизнес-процессов эффективной, безболезненной и успешной. Всё, о чём мы будем писать, основано на личном опыте внедрения. Специалисты нашей команды имеют опыт внедрений в различных отраслях и спецификах, а также являются обладателями сертификатов DipIFR и CIMA, поэтому нам легко понять язык заказчика, прочувствовать все его “боли” и оценить, какой из существующих на рынке продуктов лучше всего подойдёт в каждом конкретном случае. 

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 0

Искусство создания понятных графиков

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 17K

Эта статья — субъективное эссе о хороших и плохих практиках в визуализации данных, в нём приведены примеры и объяснения.

В папке Scripts/ на Github есть файлы .Rmd, генерирующие показанные ниже графики. Для их работы требуются R, RStudio и пакет rmarkdown.

Читать дальше →
Всего голосов 88: ↑87 и ↓1 +86
Комментарии 8

FineBI: Обработка данных для начинающих пользователей

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 3.3K

Хабр, привет!

На связи команда Business Intelligence GlowByte. Да-да, те самые неугомонные, которые создали самое крупное русскоязычное сообщество FineBI, проводят обучения, собирают дайджесты и ежегодно организуют масштабные конференции

Меня зовут Александр, я руководитель центра поддержки и обучения BI-решений в GlowByte, и сегодня хочу поделиться с вами небольшим гайдом по обработке данных в FineBI. Этот материал будет полезен начинающим BI-разработчикам.

Данная статья состоит из четырех уроков, которые помогут вам ближе познакомиться с функциями редактирования данных в FineBI. Если после прочтения вы захотите разобраться со всеми особенностями платформы, закрепить базовые знания и прокачать навыки создания сложных визуализаций, приглашаю на наши курсы.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 0

Сравнение Open Source BI-платформ

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 9.3K

Привет, Habr!

Меня зовут Остапенко Настя, я лидирую направление BI в компании Axenix. Год назад мы выпустили статью с большим обзором Российского рынка BI. На этот раз мы проведем сравнение трех популярных Open-Source BI-платформ: Apache Superset, Metabase и относительно нового участника - Yandex Datalens, который совсем недавно стал доступен в качестве Open-Source продукта.

Читать далее
Всего голосов 21: ↑21 и ↓0 +21
Комментарии 19

Разоблачаем Эффект Даннинга-Крюгера. Статистический артефакт, пример автокорреляции

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 21K

Слышали ли вы об «эффекте Даннинга-Крюгера»? Это (очевидная) тенденция неквалифицированных людей переоценивать свою компетентность. Обнаруженный в 1999 году психологами Джастином Крюгером и Дэвидом Даннингом эффект с тех пор стал очень знаменитым.

И вы понимаете почему.

Это слишком сочная идея, чтобы не быть правдой. Все «знают», что идиоты, как правило, не осознают своего идиотизма. Или, как выразился Джон Клиз...

Разоблачаем популярный миф
Всего голосов 116: ↑102 и ↓14 +88
Комментарии 72

Анализируем 15 млн чеков за 3 секунды: как мы прошли путь от калькулятора акций до CDP-платформы

Время на прочтение 12 мин
Количество просмотров 3.6K

Рассказываем историю о том, как калькулятор скидок в составе кассового ПО стал CDP-платформой с аналитическим модулем, управляемым с минимальным участием разработчиков.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 2

Ближайшие события

Кейс: как мы доработали SLA с помощью ETL

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 1.3K

Привет, Хабр.

Мы с командой Modus решили один из внутренних кейсов по учету времени на решение и статусов задач. В этой статье я расскажу, как мы применили для этого ETL и сэкономили 80% времени и ресурсов на кастомизацию таск-трекера. Если у вас есть ETL – берите на вооружение.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0

Развитие продукта в общем цифровом пространстве

Уровень сложности Средний
Время на прочтение 13 мин
Количество просмотров 1K

Стартапы часто сталкиваются с проблемами и вызовами, которые требуют гибкого управления. Задача руководителя – приведение организации на путь устойчивого развития.

В статье Артём Варкулевич, CEO и основатель стартапа Онтонет, руководитель отдела бизнес-архитектуры с 20-летним стажем в ИТ, расскажет, как подходы системной инженерии и онтологическая платформа поддерживают гибкие подходы к разработке в стартапе. Похожие проблемы роста существуют и в историях корпоративных команд.

Статья подводит технологический задел под существующие процессы и показывает, как обеспечить команды инструментарием управления разработкой.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 1

И снова о генеалогических деревьях

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 10K

Когда в очередной раз меня охватило желание собрать всю информацию по своим родственникам, я стал подробно смотреть на доступные инструменты. Основное, что предлагается широкому потребителю, это книги с выделенными листами под того или иного родственника. Надо ли говорить, что никакую структуру родства описать таким образом не получится, и максимум что можно в такой формат уместить, это, пожалуй, только родители, дети, бабушки, дедушки и браться с сестрами. Иными словами, непосредственные родственники, а для прародителей и каких-нибудь двоюродных теть такой формат уже не подходит совсем – степень родства придется описывать словами, и вместо структуры получится каша.

Итак, мне захотелось визуализировать каким-то вменяемым образом свое генеалогическое дерево, включив туда всех прямых и непрямых родственников, о которых хоть что-нибудь известно. Данная статья описывает подходы к этой задаче, полученные результаты и ряд интересных вопросов, которые возникают при более глубоком погружении в эту тему. Все алгоритмы и отрисовка были реализованы на python из-за удобства работы со списками и словарями. Код носит базовый характер, связанный со структурами данных, их обработкой и самой простой визуализацией. Конечно же, изложенный подход можно упаковать в интересный продукт, о чем также пару слов будет сказано в конце статьи. Поехали.

Читать далее
Всего голосов 7: ↑4 и ↓3 +1
Комментарии 14

Бизнес в одном окне. Повышаем прибыль с помощью грамотной визуализации данных

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 2.7K

Изменения сегодня происходят гораздо быстрее, чем это было буквально несколько лет назад. До 2020 года много ли было сервисов, доставляющих что-то кроме пиццы или роллов за час? А сегодня за час могут доставить штангу с блинами или велосипед. Если на конец 2019 года в Ozon было 6,5 тысяч продавцов, то сейчас их число перевалило за 200 000. А есть ещё и другие маркетплейсы – Wildberries, Яндекс.Маркет, СберМаркет. Есть обособленные онлайн-магазины, которые активно рекламируют себя через социальные сети, развлекательные площадки и другие сайты. И социальные сети, которые тоже активно осваивают рынок электронной коммерции. 

Приходится использовать сразу множество площадок и бежать быстрее других, чтобы продавать и зарабатывать. Без анализа статистики это невозможно, но часто для каждой площадки – свои инструменты. Данные бизнеса в одном месте с одним интерфейсом всегда проще и эффективней, чем множество разных приложений. Необходима грамотная визуализация. Только так можно ясно увидеть многогранную “картина бизнеса”.

Ну, или вам придётся иметь шесть-восемь рук, три экрана перед глазами со всей открытой статистикой и пару голов… 

Бонус: рассказываем, как мы открыли интернет-магазин для эксперимента и потратили 160 тысяч рублей на CRM, хотя лучших результатов в итоге достигли с помощью нашей платформы. 

Читать далее
Всего голосов 7: ↑6 и ↓1 +5
Комментарии 3

Clickhouse, Grafana и 3000 графиков. Как построить систему быстрых дашбордов

Время на прочтение 17 мин
Количество просмотров 21K

Меня зовут Валя Борисов, и я — аналитик в команде Ozon. Задача нашей команды — создавать инструменты для мониторинга и анализа скорости. 

Наши усилия направлены на то, чтобы в реальном времени следить за тем, как быстро работают наши сервисы и платформа. Благодаря инструментам, которые мы создаём и поддерживаем, команды разработки получают представление о том, как пользователи видят работу нашего сайта или приложения. Мы помогаем выявлять причины деградации скорости и определять узкие места в инфраструктуре.

Наши дашборды играют ключевую роль в предоставлении информации о скорости работы платформы. Вместе с командой аналитиков я занимаюсь созданием и поддержкой этой системы в Grafana. Мы стремимся делать ее не только информативной, но и быстрой, стабильной и удобной для всех пользователей. В этой статье я хочу поделиться методами и приемами, к которым мы пришли в процессе работы.

Читать далее
Всего голосов 40: ↑40 и ↓0 +40
Комментарии 23

Зачем BI малому и среднему бизнесу?

Время на прочтение 4 мин
Количество просмотров 4.2K

Привет, Хабр.

За последние год-два мы получили много запросов, где заказчики хотели получить BI-продукт для малого и среднего бизнеса, такой легковесный и недорогой, который может быстро стартовать в аналитике без закупок серверов или сложных настроек у себя во внутреннем контуре. И мы обнаружили, что на самом деле продуктов такого рода на рынке практически нет: потому что зарубежные вендоры, у которых стоимость лицензии была около 10$ в месяц, а сам продукт был полнофункциональной разработкой, покинули рынок. По сути, остались спешно собранные версии on-premise систем, DataLens и другие опенсорсные продукты и, естественно, классические Excel, PowerPoint и прочие непрофессиональные аналитические инструменты.

Параллельно стали разбираться, какую пользу он мог бы принести? Почему не Excel, которым пользуются практически все, или другие программы похожего вида? Чем может быть полезен BI сектору SMB? В статье постараюсь ответить на эти вопросы.

Читать далее
Всего голосов 8: ↑5 и ↓3 +2
Комментарии 9

Делаем дашборд для логов используя Promtail Loki Grafana

Время на прочтение 8 мин
Количество просмотров 6.4K

Как используя связку Promtail + Loki + Grafana настроить сбор логов из текстового файла и сделать простой, но функциональный дашборд.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 10

Вклад авторов