Как стать автором
Обновить
46.59

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Порог рейтинга
Уровень сложности

Метрики: их очарование и коварство

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 2K

Максим Лунев

Аналитик отдела аналитики производственного департамента Security Vision

Они окружили нас

Метрики прочно вошли в нашу жизнь. Финансы и спорт, бизнес и социальные сети - практически невозможно найти область, где те или иные количественные характеристики не решали бы много, если не все. Метрики рушат карьеры и возносят на пьедестал, вгоняют в депрессию и сулят золотые горы, могут стать лучшими друзьями или злейшими врагами. Не обошли они стороной и мир информационной безопасности.

 Все больше и больше современных SOC-центров активно внедряют в свою деятельность мониторинг и измерение своей эффективности. Это позволяет быстро выявить и устранить «бутылочные горлышки», оценить качество работы команд по реагированию, определить свои слабые места и составить стратегию развития. И, конечно же, проиллюстрировать свою ценность перед руководством компании, оправдав все вложенные инвестиции.

Читать далее
Всего голосов 14: ↑13 и ↓1 +12
Комментарии 7

Новости

Собирать данные VS интерпретировать их: типичные ошибки в e-commerce аналитике

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 1.3K

Каждый день мы собираем больше 200 ГБ данных о клиентах Lamoda, которые листают сайт и делают заказы. Но красивые цифры про наше хранилище — это одно, а правильные выводы из данных — совсем другое.

Меня зовут Александр Айваз, я руковожу командой Data & Analytics в Lamoda Tech. И сегодня расскажу об ошибках в аналитике, которые легко совершить, глядя на данные в ретейле и e-commerce. Уверен, кому-то статья поможет иначе взглянуть на собственный продукт — или даст представление о том, с какими вопросами работают продуктовые аналитики.

Конечно, многие из этих ошибок когда-либо совершали и мы сами. В статье я постараюсь не углубляться в цифры, а расскажу о причинах на собственном примере. 

Читать далее
Всего голосов 19: ↑18 и ↓1 +17
Комментарии 2

Как проводят оценку качества данных в Airbnb

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 1.5K


Сегодня, когда объем собираемых компаниями данных растет в геометрической прогрессии, мы понимаем, что больше данных — не всегда лучше. На самом деле слишком большой объем информации, особенно если вы не можете гарантировать ее качество, может помешать компании и замедлить процесс принятия решений. Или это приведет к принятию неправильных решений.

Рост показателей Airbnb до 1,4 миллиарда гостей на конец 2022 года привел нас в точку, когда снижение качества данных стало мешать нашим специалистам по работе с этими самыми данными. Еженедельные отчеты по метрикам стало сложно предоставлять вовремя, такие базовые показатели как «Активные объявления» стали иметь целую паутину зависимостей. Для полноценной работы с данными стали требоваться значительные институциональные знания, просто чтобы преодолеть все «подводные камни» в нашем информационном потоке.

Чтобы решить эту проблему, мы внедрили процесс под кодовым названием «Мидас» (Midas), который предназначался для сертификации наших данных. Начиная с 2020 года, процесс Midas, а также работа по реорганизации наших наиболее важных моделей позволили значительно повысить качество и оперативность получения важнейших данных Airbnb. Однако достижение всех критериев качества данных требует значительных межфункциональных инвестиций в такие вещи как проектирование, разработка, проверка и поддержка необходимых информационных ассетов и документации.
Читать дальше →
Всего голосов 31: ↑29 и ↓2 +27
Комментарии 3

Технические предпочтения пользователей с нарушениями зрения в 2023 году. Исследование Яндекса

Уровень сложности Средний
Время на прочтение 22 мин
Количество просмотров 1.9K

Цифровые продукты и сервисы стали обыденным явлением, и сегодня это часть повседневной жизни самых обычных людей, а не только ранних энтузиастов новых технологий. Однако есть пользователи, которые по-прежнему испытывают существенные трудности при взаимодействии с современными информационными технологиями. Они вынуждены преодолевать большой порог вхождения, осваивать не самые простые дополнительные инструменты и нетривиальные способы взаимодействия с компьютерной техникой, а также постоянно сталкиваются с неудобными или просто неработоспособными интерфейсами.


Привет, Хабр. Меня зовут Никита, я помогаю коллегам из Яндекса с технической экспертизой по вопросам accessibility. В этой статье я хочу поделиться результатами очередного исследования технических предпочтений пользователей с нарушениями зрения, которое предназначено для специалистов, работающих в сфере цифровой доступности. О подобном исследовании я рассказывал в 2020 году.


Круговая диаграмма с долями основных программ экранного доступа по данным таблицы 10
Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 0

Истории

Топ-10 качеств идеального ментора в IT. Мы опросили сто аналитиков

Время на прочтение 3 мин
Количество просмотров 4.2K

Всем привет! Меня зовут Артём Полуян, я руководитель системных аналитиков в SM Lab. В этой статье хочу поделиться одной любопытной статистикой, которую мне удалось собрать за два года. 

Что за статистика и откуда она у меня взялась? Дело в том, что у меня есть своего рода хобби: раз в три месяца я провожу тренинг по менторству (наставничеству) для сотрудников нашего департамента системного анализа. За два года я провёл девять таких тренингов, которые посетило суммарно около ста системных аналитиков и аналитиков данных. 

На тренинг приходят ребята с самым разным опытом. Кто-то только готовится стать ментором в своей команде, а кто-то, уже имея некоторый опыт, приходит обменяться экспертизой с коллегами. Формат мероприятия больше напоминает дискуссии, в рамках которых определяются оптимальные варианты выхода из различных ситуаций, в которых может оказаться ментор. 

На всякий случай обозначу, кто такой ментор в нашем понимании. Ментор — опытный участник команды, который прикрепляется к новому сотруднику (менти) для осуществления онбординга. Тут у нас всё примерно так же, как и в любых современных IT-компаниях. 

Читать далее
Всего голосов 15: ↑12 и ↓3 +9
Комментарии 4

Метрики команды разработки

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 3K

Заказчику задачи в конечном счёте всё равно, какой методологией управления разработкой пользуется команда исполнителей - точная дата получения результата для него важнее.

Чтобы называть эту дату более обоснованно, необходимо понимать, как на самом деле работает команда: сколько поставляет задач, как долго проходит процесс анализа задачи перед взятием в работу, на каких этапах в целом происходит "застревание" задачи.

Под катом - описание метрик и способы их расчёта.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 9

Финансовые данные: об измерении автокорреляции, тяжелых хвостах и других статистиках (Vol 1)

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 2.2K

Финансовые данные — одни из самых популярных данных для анализа сегодня. Однако применимы ли классические методы статистического анализа для работы с финансовыми данными? В данной статье мы обсудим ключевые свойства данных о доходностях финансовых активов и поговорим о подводных камнях при работе с ними. Мы увидим, что некоторые "нестандартные" свойства распределения доходностей финансовых активов делают классические статистические подходы плохо применимыми и не надежными при работе с данными такого вида. Мы предложим глубокое и полное объяснение описанных фактов с математической точки зрения.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 22

Типичные задачи аналитика данных. Часть 1. Упала метрика

Уровень сложности Средний
Время на прочтение 15 мин
Количество просмотров 9.3K

В прошлой статье мы рассматривали неочевидные проблемы АБ тестирования и как можно с ними справляться [ссылка]. Но часто бывает так, что при внедрении новой функциональности АБ тестирование провести нельзя. Например, это типично для маркетинговых кампаний нацеленных на массовую аудиторию. В данной ситуации существует вероятность того, что пользователи контрольной группы, которым недоступна рекламируемая функциональность, начнут массово перерегистрироваться. Также возможен сценарий, при котором возникнет значительное количество негативных отзывов из-за воспринимаемой дискриминации. Но задача оценки таких нововведений одна из наиболее частых, которые приходится решать аналитикам. Если метрики только улучшаются, то это обычно легко объяснить хорошей работой, а если метрика ухудшилась, то сразу появляется задача на аналитика. В этой заметке мы рассмотрим первую часть задачи - а действительно ли метрика упала и если да, то имеет ли смысл разбираться дальше?

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 0

AvsV, или Мальчики против Девочек

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 3K

....При прочих равных мужчина выберет место между женщин, женщина же...

....тоже выберет место между женщин, если она не навеселе и не ищет приключений.

Читать далее
Всего голосов 30: ↑25 и ↓5 +20
Комментарии 3

Статистика QA вакансий и резюме. Декабрь 2023

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 10K

Раз в месяц я и команда QA Studio вручную собираем статистику по вакансиям и резюме тестировщиков с нескольких ресурсов. Сегодня — статистика за декабрь 2023. Мы не делаем выводы, а оставляем сухие цифры. Много или мало открытых вакансий и что с рынком — каждый может интерпретировать по-своему.

Посмотреть статистику
Всего голосов 13: ↑12 и ↓1 +11
Комментарии 3

Смотри, огромное море: насколько велик YouTube и сколько там роликов?

Время на прочтение 4 мин
Количество просмотров 5.7K

Первый ролик на YouTube был загружен в далёком 2005 году. С тех пор сервис стал частью Google, это один из наиболее популярных в мире сервисов. Но насколько он большой, кто может подсчитать? Официальной статистики корпорация не даёт, так что приходится всё делать своими руками.

Именно так и поступили исследователи, одним из которых является доцент кафедры государственной политики, коммуникаций и информации Массачусетского технологического института (MIT), сооснователь блог-агрегатора Global Voices, интернет-активист и блогер Итан Цукерман (Ethan Zuckerman). Он с коллегами и подсчитал, что сейчас на сервисе опубликовано свыше 13,325 млрд роликов. О методике подсчёта и других нюансах — под катом.

Читать далее
Всего голосов 31: ↑27 и ↓4 +23
Комментарии 13

Press F. Что из мира IT мы потеряли в 2023 году

Время на прочтение 12 мин
Количество просмотров 32K

2023 год стал годом больших технологических достижений. Мы стали свидетелями роста популярности ChatGPT и других моделей генеративного искусственного интеллекта, Apple наконец-то выпустила свою долгожданную гарнитуру XR — Vision Pro, Sony выпустила новый контроллер Access для PS5, было открытие Сферы в Лас-Вегасе и много других инноваций в роботехнике, энергетике, 3D-печати, производстве электроники и в области квантовых компьютеров. Но ничто не вечно, особенно в Кремниевой долине. И пока одни празднуют успехи, есть продукты и услуги из мира IT, для которых год был не просто неудачным, а фатальным.

Время идёт, и корпоративные приоритеты меняются. Продукты и услуги регулярно выходят из строя, причем многие без всякого ажиотажа. Здесь список тех, которые потерпели последний крах в 2023 году. В этом списке есть технологии, которые прожили долгую и здоровую жизнь, те, которые ушли в расцвете сил, а также те, которые были сняты с производства или отключены, потому что вообще остались незамеченными.

Читать далее
Всего голосов 65: ↑59 и ↓6 +53
Комментарии 35

Итоги блога RUVDS на Хабре в 2023 году

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 1.5K
27 декабря Хабр подвёл итоги года, которые довольно интересные — из них видно, что Хабр не стоит на месте и продолжает расти и активно развиваться. У нас год ещё не закончился, но мы решили тоже подвести итоги — и чтобы сравнить их с предыдущими периодами, и чтобы как-то соотнести с итогами Хабра, да и в целом, возможно, они кому-то будут интересны.



В этот раз не хочется писать длинные вступления и подводки — допускаем, что и вам не очень хочется читать их в выходной день :) Поэтому только самое-самое.
Читать дальше →
Всего голосов 43: ↑36 и ↓7 +29
Комментарии 1

Ближайшие события

One Day Offer от УЦСБ
Дата 17 февраля
Время 10:00
Место
Онлайн

Биномиальный тест

Уровень сложности Сложный
Время на прочтение 11 мин
Количество просмотров 2.6K

Вы когда-нибудь задавались вопросом, как узнать, насколько хорошо работает ваша рекламная кампания, ваш новый продукт или ваша стратегия игры? Например, если вы запустили рекламу на сайте и хотите узнать, увеличилась ли конверсия клиентов после этого. Или если вы выпустили новый вкус чипсов и хотите узнать, нравится ли он покупателям больше, чем старый. Или если вы играете в монетку и хотите узнать, не жульничает ли ваш соперник, подбрасывая монету с двумя орлами. Для всех этих ситуаций вам может пригодиться биномиальный тест!

Биномиальный тест - это статистический метод, который позволяет сравнить долю успехов в двух группах и проверить, есть ли между ними значимая разница. Успехом может быть любое событие, которое имеет два исхода: да или нет, купил или не купил, орел или решка и т.д.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Хабр — Итоги 2023 года

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 18K

Итак, 2023 год. Обнаружена планета с высокой вероятностью существования жизни, на 3D‑принтере учатся печатать сердце, сделаны шаги в борьбе с раком и деменцией, одобрили первое лекарство от болезни Альцгеймера и разработали препарат от болезни Бехтерева, пересадили глаз целиком, запустили GPT-4 и целую кучу нейронок — и это только малая часть итогов года. 2023, как и все остальные, дал нам много нового в науке, карьере, что‑то изменил у каждого в жизни. Менялся и Хабр: где‑то заметно, где‑то не очень, на уровне логики, чтобы каждому пользователю стало чуть быстрее и чуть приятнее. Традиционно в конце года мы всех посчитали и делимся самым важным с самыми важными — с пользователями, читателями и гостями Хабра.

Читать далее
Всего голосов 149: ↑149 и ↓0 +149
Комментарии 106

Обзор макроэкономических показателей связи РФ: 2014-2023

Время на прочтение 5 мин
Количество просмотров 897

Некоторое время назад мы начали мониторинг статистических и экономических показателей в рамках нашего проекта SETEWIKI, в котором мы отслеживаем состояние «здоровья» российской связи.  

Сегодня мы предлагаем вашему вниманию первые наблюдения по итогам работы раздела «Экономика связи РФ», в котором собраны данные с 2014 года по нескольким направлениям:

Читать далее
Всего голосов 11: ↑6 и ↓5 +1
Комментарии 0

Hippotable — анализ данных прямо в браузере

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 4.5K

Сегодня я расскажу про hippotable — удобный инструмент для анализа данных. Мне часто нужно поковыряться в датасете среднего размера (1–100 Мб), чтобы ответить на довольно простые вопросы. Ни один из существующих инструментов (bash, google sheets, jupyter + pandas) не показался мне особо подходящим для такой задачи, и я... решил сделать свой! Хотел поделиться результатом, показать пару интересных JS-инструментов для обработки и отображения данных, и рассказать, как дальше планирую развивать продукт. Запрыгивайте, будет интересно.

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 13

Торговый бот на Python с нуля (с использованием Binance API), часть 2

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 15K

Продолжение первой части статьи о создании торгового бота на python с нуля с использованием Binance API!

В данной статье мы напишем полностью рабочую реальную стратегию с использованием биржевых данных. Я расскажу что такое линии Боллинджера, а также о других популярных стратегиях. Мы подробно разберем реализацию стратегии Боллинджера на python, и напишем production-ready код!

Читать далее
Всего голосов 17: ↑14 и ↓3 +11
Комментарии 30

Учимся анализировать данные на примере API Codewars

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 3.7K

Для начинающего специалиста, входящего в мир ИТ, одной из приоритетных задач трудоустройства является отработка и получение навыков хотя бы в одном (а лучше нескольких) языках программирования.

Мой опыт через решение алгоритмических задач показал, что этот метод помогает развить системное мышление. В жизни и в работе данный навык очень важен, поскольку существуют задачи, требующие нестандартного подхода к их решению.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 0

Самый конец 2023 года: оцениваем рейтинги языков программирования по версии TIOBE и PYPL

Время на прочтение 3 мин
Количество просмотров 9.2K

Востребованность языков программирования постоянно меняется. Какие-то с течением времени остаются актуальными, а часть постепенно прекращает использоваться и уходит с рынка. Есть, конечно, долгожители вроде COBOL, но их не так много. Тем не менее некоторые ЯП находятся в топах разных рейтингов годами, то теряя пару позиций, то восстанавливаясь. Сейчас конец 2023 г., поэтому самое время посмотреть, какие языки на данный момент самые популярные. Подробности — под катом.

Читать далее
Всего голосов 14: ↑13 и ↓1 +12
Комментарии 5

Вклад авторов