Как стать автором
Обновить

Все потоки

Сначала показывать
Порог рейтинга

Гистограммы и графики распределения в Python

Блог компании SkillFactory Python *Старое железо DIY или Сделай сам
Перевод

Визуализация одномерных данных в Python



Построение графика одной переменной кажется простой задачей. Но насколько это просто в действительности — эффективно отобразить данные со всего одним измерением? Долгое время я обходился стандартной гистограммой, которая показывает расположение значений, разброс и форму распределения данных (нормальное, скошенное, двухпиковое и др). Но недавно я столкнулся со случаем, когда гистограмма не помогла. И тогда понял, что настало время узнать больше о построении графиков. Я нашёл в сети отличную бесплатную книгу о визуализации данных и попробовал некоторые методы. Я решил, что (и мне, и другим людям) будет полезно, если я поделюсь этими знаниями и составлю руководство по построению на Python гистограмм и их крайне полезной альтернативы — графиков распределения плотности (density plots). Подробности — к старту нашего курса по анализу данных.

Читать дальше →
Всего голосов 2: ↑1 и ↓1 0
Просмотры 763
Комментарии 0

Новости

Как и зачем компании накручивают голоса на хабре

Habr Управление сообществом *Контент-маркетинг *Социальные сети и сообщества


Так получилось, что я много лет занимаюсь консалтингом различных компаний на хабре по теме того, как надо вести блог. На данный момент консультирую несколько компаний. И вижу, что большинство блогов, которые выходят на хабр, не понимают что это за аудитория и как с ней работать. Поэтому решил сделать серию статей о том как надо или не надо писать статьи, вести блог и что следует или не следует делать на хабре. Начать хочу с порочной практики, которыми грешат некоторые компании — это накрутка голосов.

Большинству читателей хабра даже невдомёк, что на этом ресурсе идёт настоящая корпоративная борьба за первые места в рейтинге компаний. Это престиж, имя, реклама и вообще можно почесать чувство собственной важности. Хотя в новой версии хабра, особенно мобильной, это совершенно потеряло смысл, потому что рейтинг компаний не видно.

Главная цель быть на первых местах: чтобы имя компании было узнаваемым. И в целом, если борьба идёт честной: ищут хороших авторов, приносят годный материал на ресурс и вообще стараются сделать его лучше, то это всегда идёт только на пользу читателям и хабру в целом. Но, понятно, что честными методами долго держать такой темп невозможно. Поэтому в какой-то момент начинают компании мухлевать, поднимая свой рейтинг искусственным путём.

Сегодня мы на хабре наблюдаем просто удивительную гонку накрутки рейтинга, которая выражается в том, что некоторые компании ушли в неадекватный отрыв от всех остальных компаниях в списке, в гонке за право быть на первом месте.

Чем это плохо для нас, читателей: мы не получаем адекватную оценку статей на хабре, средние статьи занимают первые места, а по-настоящему качественный материал теряется за накрутками.

Сократ мне друг, но истина дороже

Поэтому расскажу вам, механизм рейтинга, и как компании его накручивают. И предложить методы борьбы с накрутками у компаний, для администрации Хабра.
Читать дальше →
Всего голосов 83: ↑79 и ↓4 +75
Просмотры 3K
Комментарии 50

Как работают рекомендации в Spotify

Алгоритмы *Growth Hacking *Natural Language Processing *
Перевод

Когда просишь назвать самые крутые в персонализации бренды, то много лет подряд все называют Amazon и Netflix.

Но теперь появился и третий брат, Spotify, со своим функционалом персонального плейлиста из 50 треков - Discover Weekly. По словам ML-лидера Spotify именно этот функционал он считает в продукте флагманским, хотя сами алгоритмы и ранее работали в приложении.

🚀В чем же фишка? Персонализированные подборки строятся на 3 основных ML-алгоритмах:

1. Коллаборативная фильтрация

Это довольно популярный алгоритм товарных рекомендаций, который делает подборки на основании того, что нравится людям с похожим поведением/вкусом. То есть, если у другого человека в плейлисте преобладают те же треки, что и у вас, но есть дополнительные, то алгоритм порекомендуют вам их или на них похожие.  

2. Natural Language Processing (NLP)

С помощью NLP компания анализирует статьи, блоги и другую информацию по треку, транскрибирует их в текст, размечает трек тегами и сравнивает их между собой с учетом весов. Напоминает алгоритм товарных рекомендаций аффинити, только в этом случае атрибуты берутся не из товарного фида, а с помощью NLP. 

3. Convolutional Neural Networks (CNN)

Модель, которая обычно используется для распознавания лиц, в случае Spotify распознает аудио треки и раскладывает их на биты, уровень шума, ноты и тд. Этот алгоритм "подкручивает" выборку, добавляя туда менее популярные треки, которые вряд ли попали бы туда после работы двух первых алгоритмов. 

____

Реализация выглядит очень впечатляюще. И по окружению все в восторге от рекомендаций Spotify. 

Читать далее
Всего голосов 9: ↑0 и ↓9 -9
Просмотры 736
Комментарии 7

Геймификация в маркетинге. Статистика и кейсы

Интернет-маркетинг *

Почему мы говорим об этом?

▪️Рынок геймификации к 2025 году вырастет в 3 раза (ссылка на статистику ниже).

▪️Геймификация будет проникать в другие отрасли бизнеса, не только ритейл и образование, где сейчас это в основном используется.

▪️Персонализация + геймификация будут все более часто встречающейся связкой в сферах обучения, HR и тд.

Читать далее
Всего голосов 5: ↑3 и ↓2 +1
Просмотры 166
Комментарии 0

Персонализация в маркетинге: 10 мифов, в которые многие верят

Интернет-маркетинг *Повышение конверсии *
Из песочницы

Персонализация в маркетинге как одно из направлений в диджитал-сфере уже давно у всех на слуху. Тем не менее эта область вызывает большое количество вопросов и сомнений. Начиная с того, что сам термин и область его применения все толкуют совершенно по-разному.

Я решила собрать и развенчать основные мифы персонализации в маркетинге, которые я много раз встречала за более чем 7 лет работы в этом направлении: с разными платформами, руководителями, командами и результатами.

Читать далее
Всего голосов 6: ↑2 и ↓4 -2
Просмотры 681
Комментарии 9

Почему стоит регистрировать программы для ЭВМ как изобретения: 5 примеров из практики

Блог компании Онлайн Патент Программирование *Патентование *

Компьютерные программы помогают компаниям справляться со всё большим количеством задач. Они регистрируются российскими компаниями для выявления простоев оборудования, определения наиболее выгодных способов инвестирования, программ автоследования инвестиционных портфелей и других целей. Сейчас программы для ЭВМ регистрируются не только IT-компаниями, но и предприятиями самых разных отраслей. Мы уже писали про это отдельный материал на Хабре.  

Однако это относится к регистрации компьютерных программ в качестве объектов авторского права. Более высокий уровень их защиты — регистрация в качестве изобретения. Об этом мы подробно расскажем ниже. 

Читать далее
Всего голосов 14: ↑9 и ↓5 +4
Просмотры 2K
Комментарии 6

Магия размерностей и магия Котлина. Часть третья: Смешение магий

Программирование *Kotlin *Физика

Это третья, заключительная статья серии, посвящённой библиотеке по манипулировали физическими величинами системы СИ, а также другими величинами, в Котлин. В ней мы рассмотрим, как фундаментальные математические структуры, которые природа “заложила” в систему СИ, предопределяют дизайн библиотеки и как возможности и ограничения Котлина были использованы при разработке библиотеки KotUniL.

Читать далее
Всего голосов 7: ↑6 и ↓1 +5
Просмотры 871
Комментарии 3

Антипаттерны проектирования

Блог компании Southbridge Программирование *Анализ и проектирование систем *

В этой статье разбираемся, что такое антипаттерны проектирования, зачем их знать и что с ними делать. А также говорим о наиболее распространенных антипаттернах.

Читать далее
Всего голосов 23: ↑18 и ↓5 +13
Просмотры 3.8K
Комментарии 8

Обновление Системы ценообразования App Store: 700 новых ценовых пунктов

Разработка под iOS *Swift *IT-компании
Перевод

Обновление Системы Ценообразования App Store: 700 новых ценовых пунктов

Apple объявила об изменениях в своей системе ценообразования App Store - прочитайте об этом все.

Читать далее
Всего голосов 1: ↑0 и ↓1 -1
Просмотры 621
Комментарии 1

Заражённый разум

Научно-популярное Мозг Здоровье

Культурный код Запада тесно связан с идеей верховенства разума над бренной телесной оболочкой. Мы с вами привыкли отождествлять себя прежде всего с головным мозгом, закованным в скафандр из мяса и кожи. В костюм-экзоскелет, который можно прокачать в спортзале, украсить в салоне красоты, модифицировать на операционном столе, зарядить энергией за обеденным столом… И любые неисправности нашего скафандра вроде недомогания, слабости и боли мы воспринимаем словно как бы отдельно от себя: словно это не Я сам затронут болезнью, это затронуто болезнью мое транспортное средство, несущее меня по дорогам этого странного мира.

В целом, эта точка зрения вполне имеет право на существование. Однако что, если состояние нашего тела влияет на то, что мы считаем «самим собой»? Что, если существуют поразительные патогены, способные при заселении в тело манипулировать нами, а то и даже менять саму нашу психику, наше отношение к миру?

Читать далее
Всего голосов 78: ↑71 и ↓7 +64
Просмотры 5.7K
Комментарии 20

Автоматизируем Telegram-канал с AWS Lambda и DynamoDB

Python *Облачные вычисления *NoSQL *Amazon Web Services *Облачные сервисы *
Tutorial

В этом материале вы узнаете, как создать Telegram-канал, который будет сам обновляться, получая данные из открытых источников. Используем Python, AWS Lambda, DynamoDB и BeautifulSoup.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 978
Комментарии 0

Product backlog refinement — затраты или инвестиции команды?

Блог компании Иннотех Управление проектами *Управление продуктом *

Насколько детально нужно заниматься уточнением бэклога продукта (PBR) и нужно ли это вообще или это лишняя трата времени проектной команды? Руководитель направления аналитики управления автоматизации Группы «Иннотех» Владимир Золотопупов поделился опытом своей команды и рассказал о том, как этот процесс выстроен у них.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 364
Комментарии 0

Удаляем фон у фото используя CoreML

Разработка под iOS *Разработка мобильных приложений *Интерфейсы *Swift *Машинное обучение *
Tutorial

Всем привет! В рамках данной статьи я хотел бы рассказать, с чем мне пришлось столкнуться, и как я реализовал вырезание заднего фона у фотографий в приложении на iOS.

Узнать как вырезать фон
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 930
Комментарии 2

Первый электрогрузомобиль в России: кто уже стоит в очереди за новым авто

Разработка под e-commerce *Производство и разработка электроники *Энергия и элементы питания Автомобильные гаджеты Экология

В России в 2023 году планируют выпустить одну тысячу электрогрузомобилей собственного производства. Об этом рассказал ТАСС один из создателей автомобиля, учредитель и генеральный директор компании "Электромобили Мануфэкчуринг рус" Илья Рашкин. Вместе с партнером он уже вложил в этот проект в общей сложности около 300 миллионов рублей. Еще 700 миллионов планируют привлечь у инвестора. Когда ждать серийное производство, и кто уже интересуется новинкой - электрогрузомобилем EVM Pro?

Читать далее
Всего голосов 26: ↑13 и ↓13 0
Просмотры 2.4K
Комментарии 18

Истории

Лучшие практики безопасности Node.js

Блог компании OTUS Информационная безопасность *JavaScript *Node.JS *
Перевод

Назначение

Этот документ призван расширить текущую модель угроз и предоставить подробные рекомендации по обеспечению безопасности приложения Node.js.

Читать далее
Всего голосов 5: ↑2 и ↓3 -1
Просмотры 980
Комментарии 0

Графы в Python: введение и знакомство с лучшими библиотеками

Блог компании RUVDS.com Python *Визуализация данных *Машинное обучение *
Перевод

Граф – это математическая структура данных, представляющая собой множество связанных элементов. Поскольку графы, по своей сути, являются очень гибкими и позволяют сохранять информацию в знакомой и удобной для восприятия форме, они всегда активно использовались в компьютерной науке и сфере технологий. С появлением же машинного и глубокого обучения, графы обрели ещё бо́льшую популярность, создав новое направление — машинное обучение на графах.

В этой статье я расскажу вам о наиболее полезных библиотеках Python, которые использовал для сетевого/графового анализа, визуализации и машинного обучения. Если говорить конкретнее, то это будут:

  • NetworkX для общего анализа графов;
  • PyVis для интерактивной визуализации графов прямо в браузере;
  • PyG и DGL для решения различных задач в области машинного обучения на графах.
Читать дальше →
Всего голосов 16: ↑14 и ↓2 +12
Просмотры 1.8K
Комментарии 0

Особенности работы мобильного аналитика в банковских проектах

Блог компании Surf Анализ и проектирование систем *Аналитика мобильных приложений *

Чем проект банковского мобильного приложения отличается от других? Та же работа с заказчиком, уточнение и описание требований, проектирование функциональностей, согласования ТЗ… Но так кажется только на первый взгляд. 

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 550
Комментарии 1

Как ссориться основателям. Советы юриста и гайд по медиации

Управление проектами *Развитие стартапа Управление персоналом *

Пока Фаундер №1 и Фаундер №2 выясняют отношения, умирает продукт и разваливается команда. Как правильно выйти из кризиса? Чем подстраховаться от будущих конфликтов? Распределяем обязанности и ставим фокус

Читать далее
Всего голосов 10: ↑5 и ↓5 0
Просмотры 922
Комментарии 0

Может ли Java-приложение использовать больше памяти, чем размер кучи

Блог компании OTUS Программирование *Java *
Перевод

Возможно, вы замечали, что Java-приложение может превышать лимит памяти, указанный в параметре -Xmx (максимальный размер кучи). Дело в том, что JVM помимо кучи использует и другие области памяти. 

Давайте начнем со структуры памяти Java-приложения и источников потребления памяти.

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Просмотры 1.2K
Комментарии 0