Как стать автором
Обновить
253.34
Рейтинг

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

«Направления» Рувеба

Веб-дизайн *Разработка веб-сайтов *IT-стандарты *Usability *Статистика в IT

Статья задумана как констатация существующей проблемы – сравнительно низкого качества российских веб-ресурсов, и как стартер для серии предстоящих публикаций, развивающих эту тему. Обозначить проблему – единственная ее цель, поэтому она не предполагает какого бы то ни было анализа, тем более готовых ответов на логичный вопрос «что делать?».

В отличие от российских дорог (используются здесь в качестве метафоры), космоса, науки, медицины, образования, экономики и с чем еще наши дела обстоят не лучшим образом, развитию которых традиционно что-то мешает, как то яйц, простите, санкции, шпионы и иноагенты, встречный ветер, сглаз и т. п., пример веба примечателен.

Во-первых, он по природе своей децентрализован и в настоящее время на удивление демократично не стеснен законодательством – во-вторых.

Объяснить состояние российского веба одной лишь неблагоприятной экономической обстановкой вряд ли получится. Как мы увидим из представленных в статье данных, в Китае, в котором перечисленные выше, а заодно и другие сферы деятельности находятся в менее удручающем и более оптимистичном состоянии, качество веба также оставляет желать лучшего.

Технологии и наилучшие практики, использующиеся во всем мире для строительства веба, доступны повсеместно и многие из них open source и free. Сам процесс строительства не требует капитальных вложений, требующихся на строительство дорог, газопроводов, запуск космических станций. Поэтому, в отличие от прочих глобальных составляющих жизни любого общества, применительно к вебу вопрос «почему он у нас такой хреновый?» не является риторическим.

Поехали!..
Всего голосов 10: ↑4 и ↓6 -2
Просмотры 1.4K
Комментарии 2

Цены на электронику вниз не идут: похоже, отрасль попала в «идеальный шторм»

Блог компании Selectel Исследования и прогнозы в IT Производство и разработка электроники *Статистика в IT Гаджеты

Не так давно мы публиковали статью, в которой говорилось о довольно оптимистичном прогнозе аналитиков из Trendforce. Они заявили, что есть далеко ненулевая вероятность того, что в IV квартале 2021 года цены на чипы оперативной памяти и SSD начнут резко снижаться. Но, вероятно, в текущих условиях это чрезмерно оптимистичная оценка.

Более того, ситуация указывает как раз на то, что цены будут лишь расти, а отрасль производства электронных компонентов, а также индустрии, связанные с ней, либо уже находятся в «идеальном шторме», либо находятся очень близко к нему. Здесь и сейчас вместе сошлись несколько негативных факторов, которые и по отдельности могут повысить цены на компоненты и электронику, а уж совокупное их действие способно поднять стоимость очень быстро.
Читать дальше →
Всего голосов 44: ↑43 и ↓1 +42
Просмотры 15K
Комментарии 31

Разбираюсь в математике = легко стану программистом?

Python *Программирование *Учебный процесс в IT Статистика в IT Изучение языков
Перевод

Согласно исследованию - влияние есть, но незначительное. Обучаемость скорее связана с навыками изучения новых языков (не программирования).

Что в первую очередь ассоциируется у вас с программированием? Может быть математика? Большинство знакомых мне программистов не связывают то, чем они занимаются, в первую очередь с математикой. Они скорее говорят о логике. Тем не менее, идея о том, что навыки программирования связаны со способностями к математике, остается живой даже среди программистов.

Совсем недавно было опубликовано исследование Вашингтонского университета. В нем исследователи выяснили роль математики в способностям к обучению программированию.

Читать далее
Всего голосов 16: ↑13 и ↓3 +10
Просмотры 10K
Комментарии 34

«Рост зарплат в IT это плохо? Вы же шутите, да?»

Блог компании Headz.io Исследования и прогнозы в IT Карьера в IT-индустрии Статистика в IT

Недавно мы выпустили статью «Дефицит в IT: платите больше» о росте зарплат. Совпадение или нет, но чуть позже вышла статья о минусах большого заработка у российских айтишников. Автор рассуждал о том, как высокие зарплаты могут навредить IT-отрасли. На первый взгляд аргументы выглядят логично. Но это только на первый взгляд.

Читать далее
Всего голосов 95: ↑76 и ↓19 +57
Просмотры 58K
Комментарии 312

Что же не так с любыми электронными голосованиями?

Криптография *Тестирование IT-систем *Data Mining *Открытые данные *Статистика в IT

Данная публикация написана по мотивам поста «Что же не так с ДЭГ в Москве?». Его автор описывает, как можно выгрузить и расшифровать данные по электронному голосованию, а также приводит целый список замечаний к его текущей системе.

Статья хорошая, её выводы и замечания я полностью поддерживаю, но мне захотелось дополнить её в обеих частях. Первая — с анализом того, как в процессе голосования менялись отданные за различных кандидатов голоса (и обнаруженные в этом аномалии); вторая — моя позиция о фундаментальных недостатках любого электронного голосования, которые неустранимы на практике (особенно в современной России).

UPD: Добавил также графики по партийным спискам + отметил некоторые странности в соотношении выданных/полученных транзакций в самом начале (возможно, это объяснимо техническими проблемами).

Читать далее
Всего голосов 193: ↑186 и ↓7 +179
Просмотры 35K
Комментарии 423

(Любительский) временной анализ ДЭГ в Москве

Визуализация данных Статистика в IT
Из песочницы

По следам замечательной статьи "Что же не так с ДЭГ в Москве?" я решил проанализировать распределение голосов за разных кандидатов по времени. Результаты меня, мягко говоря, удивили.

Хочу смотреть графики
Всего голосов 32: ↑29 и ↓3 +26
Просмотры 6.5K
Комментарии 16

Оперативная память и SSD начнут дешеветь в конце года, но это неточно

Блог компании Selectel Исследования и прогнозы в IT Статистика в IT Компьютерное железо

Мы стараемся отслеживать ценовые тенденции на рынке электронных компонентов, включая процессоры, оперативную память, SSD. В начале этого года в нашем блоге была опубликована статья, где говорилось о том, что все это будет дорожать и конца-края росту цен не видно.

Многие аналитики до сих пор придерживаются того же мнения. Причин тому несколько, включая экономическую войну США и Китая, дефицит редкоземельных металлов, рост спроса на сами чипы. Но недавно стали звучать и голоса тех, кто считает, что цены вскоре таки начнут падать.
Читать дальше →
Всего голосов 56: ↑53 и ↓3 +50
Просмотры 11K
Комментарии 4

Что творилось, что творится: обзор киберугроз первого полугодия 2021

Блог компании Trend Micro Информационная безопасность *Исследования и прогнозы в IT Статистика в IT

Глобальный ландшафт киберугроз находится в постоянном движении: появляются новые группировки, выявляются новые тактики и техники, происходят громкие инциденты. Мы систематически собираем информацию о состоянии безопасности с помощью платформы Trend Micro Smart Protection Network (SPN), а лаборатория Trend Micro Research анализирует события, произошедшие в отрасли. В этом посте мы расскажем о наиболее значимых угрозах первой половины 2021 года.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 1.5K
Комментарии 0

Данные выборов получили, теперь деобфусцируем и очищаем

Открытые данные *Статистика в IT

В 2021 году Центризбирком РФ обфусцировал статистические данные выборов на своем сайте. Несколько дней назад я сделал и выложил в комментариях к новости на хабре деобфускатор, чтобы помочь исследователям обнаружить статистические аномалии в результатах. Сегодня взял день отпуска, написать этот пост и поделиться очищенными данными в формате sqlite по федеральному избирательному округу, которыми поделился @illusionofchaos в посте Получаем данные результатов выборов с сайта Центризбиркома РФ

Под катом я предлагаю еще раз посмотреть, какими техническими методами затрудняли анализ программисты сайта ЦИК-а. Новых идей там нет, решения примитивные , даже обидно что кто-то за них квартиру получил[*]. Вся работа по написанию деобфускатора заняла меньше рабочего дня (точнее вечера + полночи). Основная цель этой статьи не в описании методов, а дополнительный анонс деобфускатора для исследователей. Обсуждать решение применить методики запутывания на государственном сайте куда интереснее, но этим бессмысленно заниматься в интернете.

Итак, они реализовали четыре метода:

Читать далее
Всего голосов 211: ↑210 и ↓1 +209
Просмотры 45K
Комментарии 72

Получаем данные результатов выборов с сайта Центризбиркома РФ

Разработка веб-сайтов *Открытые данные *Реверс-инжиниринг *Swift *Статистика в IT
Из песочницы

Прочитав новость о том, что Центризбирком РФ выложил результаты выборов на своем сайте в обфусцированном виде, многие начали публиковать в комментариях свои варианты деобфускаторов, как с использованием OCR, так и без него. Но я подумал, что есть более первостепенная задача — а именно выгрузка и сохранение данных с сайта ЦИК, так как они могут в любой момент измениться, и никто этого не заметит.

Кому интересны только сырые обфусцированные данные, архив с ними можно скачать здесь (внимание: в распакованном виде файлы занимают 11 ГБ). А кому интересно как я их получил, и какие методы обфускации в них применяются — добро пожаловать под кат.

Читать далее
Всего голосов 112: ↑111 и ↓1 +110
Просмотры 22K
Комментарии 33

Q-Q Plots. От чайника до профессионала за один гайд

Визуализация данных Статистика в IT
Tutorial

Как понять, что выборка данных принадлежит определенному распределению? Есть 2 метода: аналитический тест Колмогорова-Смирнова (тест Шапиро-Уилка для нормального) и графический метод при помощи графика квантиль-квантиль плот.

Чем так замечателен второй вариант? Он позволяет делать выводы, не основываясь на таких спорных показателях какp.value.

Графический метод является мощнейшим инструментом анализа, но как сказано в англоязычной статье википедии про Q-Q Plots, требует серьезных навыков для интерпретации. В данной статье я представляю дорожную карту пути к пониманию квантильных графиков.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2.6K
Комментарии 2

Цены на редкоземельные металлы, дефицит чипов и торговые войны: стоимость гаджетов будет только расти

Блог компании Selectel Исследования и прогнозы в IT Производство и разработка электроники *Статистика в IT Финансы в IT

В начале этого года мы писали о том, что Китай планирует начать ресурсную войну в отношении США. Это должно было стать ответом КНР на санкции Соединенных штатов. Пока что открытой и активной войны нет, хотя предпосылки были, но, возможно, ресурсная война и не потребуется. Дело в том, что за последние несколько месяцев резко повысились цены на редкоземельные металлы.

Стоимость ресурсов — крайне мощный ценовой фактор для всей индустрии производства электронных компонентов и гаджетов. Их стоимость и так постепенно увеличивается, а сейчас игроки рынка ожидают уже не плавного, а скачкообразного роста цен буквально на все.
Читать дальше →
Всего голосов 60: ↑60 и ↓0 +60
Просмотры 14K
Комментарии 13

Битва за условное форматирование: дополняем стандартный функционал Power BI

Big Data *Визуализация данных Статистика в IT
Из песочницы

Как использовать для визуализации такой замечательный инструмент, как условное форматирование, если ваши данные против этого? Как добавить в отчет красивую карту, если несколько точек "портят" всю картину? Как использовать статистические методы для настройки внешнего вида вашего отчета?

Я постарался рассказать об этом на примере выполнения задания для хакатона по Power BI.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 2.2K
Комментарии 2

Пыль партийная

Управление сообществом *Читальный зал Управление медиа *Статистика в IT Социальные сети и сообщества

Считанные дни остались до очередных парламентских выборов. Снова россиянам предстоит (не более чем формально) определиться, кто в следующие пять лет будет бешеными темпами принимать не всегда полезные для страны законы.

И хотя россияне делают это почти на автомате и далеко уже не первый раз, оказывается, они совершенно не знают, кому они доверяют столь ответственную работу. По крайней мере об этом свидетельствуют результаты нашего очередного исследования, проведенного в рамках проекта «Россия в соцсетях. Соцсети в России».

Коты в мешке

Для оценки популярности (известности) российских политических партий у населения, имеющих право участвовать в выборах, мы использовали данные о количестве их подписчиков в социальных сетях (подробнее см. Методологию).

У 30 партий, претендующих на попадание в Госдуму (из них 14 с правом участия без сбора подписей), подписчиков набралось чуть менее 2 миллионов, что «по текущему курсу» составляет 1,35% населения России (рисунок 1).i

Тэк-с, тэк-с...
Всего голосов 48: ↑33 и ↓15 +18
Просмотры 8.5K
Комментарии 44

«Футбол в цифрах»: как аналитика может улучшить ситуацию с футболом в России

Блог компании Нетология Визуализация данных Статистика в IT DIY или Сделай сам Data Engineering *

Привет, Хабр! Меня зовут Владимир Герингер, я автор проекта «Футбол в цифрах». В нём я собираю футбольную статистику, анализирую данные, вывожу закономерности и рассказываю аудитории о самом интересном в виде коротких заметок и подробных статей. Данные — моё хобби, я собрал их достаточно, чтобы сделать выводы об основных проблемах российского футбола и предложить решения.

Как рост и вес футболистов влияют на игру
Всего голосов 13: ↑11 и ↓2 +9
Просмотры 3.3K
Комментарии 37

Вероятность выигрыша в покере

Математика *Статистика в IT

Некоторое время назад обратились ко мне с вопросом, как сделать программу, которая будет выигрывать в покер. После некоторого количества обсуждений, заказчик не захотел узнавать результат моих размышлений на эту тему, посчитал что дорого. Поэтому я разместил эти свои размышления здесь и за бесплатно.

Так же будет небольшая программка, которая может грубо и быстро обсчитать начальный расклад.

Сразу оговорюсь, что я в покер не играю, и знаю его хуже чем те, кто играет свои первые партии в жизни. Но может это не так уж и важно?

Читать далее
Всего голосов 26: ↑24 и ↓2 +22
Просмотры 26K
Комментарии 30

Анализ распределения временных интервалов между покупками на R

R *Визуализация данных Статистика в IT
Из песочницы

В статье я провожу ресёрч интервалов между собственными банковскими тратами за последние полгода и с помощью статистических методов в R пытаюсь понять, какому распределению эти интервалы подчиняются.

Я представляю:

1. Код на R для анализа любых временных интервалов.

2. Подбор экспоненциального и степенного распределения под данные с помощью метода максимального правдоподобия (MLE). Для экспоненциального я использую fitdistr() из пакета MASS, а для степенного fit_power_law() из пакета igraph.

3. Проверку данных на соответствие подобранному распределению с помощью теста Колмогорова-Смирнова. Я использую функцию ks.test() из пакета stats.

Читать далее
Всего голосов 14: ↑13 и ↓1 +12
Просмотры 1.9K
Комментарии 11

Как мы внедрили BI-платформу и начали развивать self-service аналитику

Блог компании inDriver Data Mining *Визуализация данных Исследования и прогнозы в IT Статистика в IT

Всем привет! Меня зовут Дима. Я BI Engineering Manager в inDriver. В компанию я пришел в марте 2020 года развивать направление Business Intelligence. О том, как это происходило и происходит сейчас, с какими вызовами приходится сталкиваться и какие у нас планы на будущее по этому направлению, читайте далее в этой статье.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Просмотры 4.3K
Комментарии 12

Москва по развитию цифровых услуг опередила все города мира?

Блог компании ITSumma IT-инфраструктура *Статистика в IT Киберпанк Урбанизм


Месяц назад большой резонанс среди российских пользователей фейсбука вызвала заметка Ивана Замесина (сооснователь и CEO компании Focus Calendar) о том, что Москва и Санкт-Петербург стали мировыми лидерами по качеству цифровых продуктов и услуг. В первую очередь имеются в виду финтех, телеком, веб-сервисы и т. д. По словам Замесина, этот факт признают многие знакомые, которые «живут на несколько стран»:

«Необанки в приложениях для нас привычная реальность. Быстрый мобильный интернет стоит $10/мес. В Москве, Питере и миллионниках продукты приезжают за 15-20 минут… Няни, уборщицы, доставка, химчистка, ремонт, любые специалисты любой компетентности — всё оцифровано, качественно и в любой бюджет. — пишет Иван, выражая комплименты российской ИТ-отрасли и отечественным инженерам. — Возьмите похожие по концентрации людей города-страны: Сингапур, Голландию, Нью-Йорк, Лос-Анджелес. Там уровень сервисов и продуктов уровня Сызрани [nothing personal]».

Что ж, давайте проверим, насколько справедливы эти тезисы. Посмотрим объективные рейтинги по некоторым пунктам.
Читать дальше →
Всего голосов 47: ↑40 и ↓7 +33
Просмотры 8K
Комментарии 41

PC park observer — система учёта комплектующих компьютеров парка, базирующегося на MS Windows

Информационная безопасность *Системное программирование *IT-инфраструктура **nix *Статистика в IT
Из песочницы

Данная система предназначена для учёта комплектующих в компьютерном парке, базирующемся на Windows. Я выложил систему под GNU/GPL v. 3 лицензией, так что денег не прошу, можете использовать как угодно... Все пожелания и т.п. обсуждаются отдельно...

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 3.5K
Комментарии 25

Вклад авторов