Как стать автором
Обновить

Moscow Data Science Major August 2019: программа и регистрация

Время на прочтение 10 мин
Количество просмотров 6.2K
Блог компании VK Big Data *Машинное обучение *Конференции Искусственный интеллект
image
UPD: Присоединяйтесь к онлайн-трансляции:


31 августа 2019г. Mail.ru Group и сообщество Open Data Science приглашают на Moscow Data Science Major. Это как Data Fest, только мини. Событие состоит из 8 тематических блоков докладов, 1 ML-тренировки и 8 часов ударной порции нетворкинга и знакомств. Знакомьтесь с программой и регистрируйтесь! Вход на событие бесплатный, по одобренной регистрации. Регистрация закрывается в 28 августа в 17:00.
Смотреть программу
Всего голосов 33: ↑32 и ↓1 +31
Комментарии 9

В России резко вырос спрос на специалистов по данным и машинному обучению

Время на прочтение 6 мин
Количество просмотров 15K
Data Mining *Big Data *Машинное обучение *Управление e-commerce *Карьера в IT-индустрии


Академия больших данных MADE и HeadHunter опубликовали совместное исследование «Портрет российского Data Scientist» со статистикой вакансий для специалистов этой профессии в 2015−2019 годы.

Судя по цифрам, рынок переживает настоящий бум. В 2018 году количество вакансий с упоминанием специальности data scientist выросло в семь раз по сравнению с 2015 годом, а вакансий с ключевыми словами machine learning — в пять раз. В интернет-компаниях и IT дата-сайентистам предлагают медианную зарплату 145 000 руб., а в в сфере услуг для бизнеса — 170 000 руб. В последнем случае речь идёт об анализе больших массивов данных, в том числе алгоритмами машинного обучения, чтобы выявить полезные для бизнеса закономерности, которые не очевидны для человеческого мозга.
Читать дальше →
Всего голосов 21: ↑17 и ↓4 +13
Комментарии 21

Завершился отбор заявок на хакатон от «Честного знака» MARKING HACK

Время на прочтение 2 мин
Количество просмотров 255
Спортивное программирование *Конференции IT-компании

Завершился отбор заявок на хакатон MARKING HACK. MARKING HACK представляет собой хатакатон по созданию продуктов на основе данных из системы цифровой маркировки «Честный знак». К участию в конкурсе планировалось допустить 30 команд, но по итогам заявочной кампании количество расширили до 60, сообщили информационной службе Хабра в пресс-службе «Честного знака». 

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 1

Новый запуск курса My First Data Project: от идеи к продукту

Время на прочтение 2 мин
Количество просмотров 400
Блог компании AI Talent Hub Big Data *Машинное обучение *Искусственный интеллект Data Engineering *

10 апреля сообщество AI Talent Hub и Передовая Инженерная Школа ИТМО запускают второй поток онлайн-курса My First Data Project по созданию реального продукта на данных с менторской поддержкой и возможностью поступить в магистратуру ИТМО без экзаменов.
Рассказываем, что нужно сделать!

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Материалы с нашего первого X5 Data Science Meetup

Время на прочтение 1 мин
Количество просмотров 254
Блог компании X5 Tech Тестирование IT-систем *Big Data *Конференции Презентации

Недавно прошёл наш первый онлайн митап Х5 Data Science Meetup. Мы говорили о том, чем занимается математик в ритейле, про адаптацию ML-моделей под изменение поведения пользователя на примере умной колонки, а также о том, как освободить сотрудников от классификации обращений на 1000+ классов. Выкладываем здесь запись презентаций наших спикеров.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Комментарии 0

Приглашаем на первый X5 Data Science Meetup

Время на прочтение 1 мин
Количество просмотров 305
Блог компании X5 Tech Тестирование IT-систем *Big Data *Конференции Презентации

26 апреля проводим первый X5 Data Science Meetup. На нём поговорим про Data-спецназ X5 Tech, о том, чем занимается математик в ритейле, про адаптацию ML-моделей под изменение поведения пользователя на примере умной колонки, а также о том, как освободить сотрудников от классификации обращений на 1000+ классов.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Приглашаем на наш второй X5 Data Science Meetup

Время на прочтение 2 мин
Количество просмотров 172
Блог компании X5 Tech Big Data *Конференции Презентации IT-компании

5 июля мы проводим X5 Data Science Meetup #2. В этот раз поговорим о том, как с помощью PySpark Pipeline писать читаемый, легко тестируемый и поддерживаемый код, про квази-эксперименты методом Propensity Score в кейсах, где нельзя провести стандартный A/B-тест, и про подходы распознавания жестового языка.

Читать далее
Рейтинг 0
Комментарии 0

Подкаст Данные Люди

Время на прочтение 1 мин
Количество просмотров 285
Блог компании МегаФон Big Data *Машинное обучение *Data Engineering *

Привет, Хабр!

Новый выпуск уже доступен к прослушиванию!

Новые тенденции, истории про "тазы" в Бауманке и советы по Work-life balance в новом выпуске с Виталием Щербаковым - директором по большим данным и развитию дата-продуктов МегаФона 💚💚💜

Присоединяйся к нашему сообществу @bigdatapeople В группе мы общаемся с интересными людьми из сферы анализа данных и искусственного интеллекта.

Приятного прослушивания!

Читать далее
Всего голосов 5: ↑3 и ↓2 +1
Комментарии 0

Как работать с нейросетями и создать свой ChatGPT: бесплатное занятие

Время на прочтение 1 мин
Количество просмотров 1.3K
Блог компании Нетология Учебный процесс в IT Карьера в IT-индустрии Искусственный интеллект

ChatGPT захватил мир! Школьники используют его для решения домашних заданий, разработчики — для написания программного кода, а копирайтеры — для избавления от страха чистого листа. 

Интерес к нейронным сетям растёт и со стороны работодателей. Лидеры спроса на специалистов этого направления в России — IТ и финансовый сектор, а также креативные индустрии.

Узнать больше о том, как устроен ChatGPT и как превратить создание нейросетей в свою профессию, вы можете 20 апреля в 19:00 (МСК) на бесплатном занятии «Как начать работать с нейросетями и создать свой ChatGPT». 

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Комментарии 0

Как ускорить вывод ML-моделей в 4 раза, или Как может выглядеть экосистема МLOps в банке

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 2.5K
Блог компании Альфа-Банк Big Data *Машинное обучение *Искусственный интеллект
Роадмэп

Привет, я Андрей Качетов, Head of ML Operations в Альфа-Банке. Отвечаю за опромышливание всех ML-моделей в банке, строю новую платформу MLOps, а также формирую единый подход для работы с модельными данными (Feature Store).

В статье, без картинок с «бесконечностями» Ops’ов, расскажу, как может выглядеть полноценный конвейер MLOps, что умеет и немного о том, как мы пришли к максимальной автоматизации процесса вывода моделей в промышленную эксплуатацию.

Читать далее
Всего голосов 24: ↑24 и ↓0 +24
Комментарии 4

Feature Engineering: Techniques and Best Practices for Data Scientists

Время на прочтение 8 мин
Количество просмотров 640
Big Data *Data Engineering *
Туториал

The most important stage in the data science process is feature engineering, which entails turning raw data into useful features that might enhance the performance of machine learning models. It calls for creativity, data-driven thinking, and domain expertise. Data scientists can improve the prediction capability of their models and find hidden patterns in the data by choosing, combining, and inventing relevant features. Handling missing data, scaling features, encoding categorical variables, constructing interaction terms, and other procedures are examples of feature engineering techniques. The best practises involve investigating the data, testing and improving features iteratively, and applying domain knowledge to draw out important information. The accuracy and effectiveness of machine learning models are significantly influenced by effective feature engineering.

Read more
Рейтинг 0
Комментарии 0

Как мы спасли от выгорания нанимающих аналитиков в X5 Tech

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 2.8K
Блог компании X5 Tech Управление разработкой *Карьера в IT-индустрии IT-компании
Кейс

Меня зовут Антон Денисов, я руководитель аналитиков больших данных в X5 Tech. В этой статье расскажу, с какими сложностями сталкиваются нанимающие менеджеры в сфере Data Science в условиях интенсивного процесса найма сотрудников, а также продемонстрирую, к какому виду мы привели процесс собеседований и найма аналитиков больших данных в X5 Tech.

Читать далее
Всего голосов 12: ↑9 и ↓3 +6
Комментарии 7

ML System Design: основные способы деплоя и тестирования моделей машинного обучения в продакшене

Время на прочтение 6 мин
Количество просмотров 2.1K
Тестирование IT-систем *Анализ и проектирование систем *Big Data *Машинное обучение *
Обзор
Перевод

Разберем популярные паттерны проектирования ML-систем для ответа на следующие вопросы:

1. Какой способ выбрать для деплоя модели в production?

2. Как затащить составной ML-пайплайн в real-time сервис?

3. Каким способом тестировать новую версию модели?

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 4

Быстро, точно, градиентно: как наш подход к градиентному бустингу повышает эффективность моделей

Время на прочтение 11 мин
Количество просмотров 2K
Блог компании Банк «Открытие» Python *Машинное обучение *Искусственный интеллект Финансы в IT
Туториал

Доброго времени суток, уважаемые читатели! Сегодня мы вновь рады приветствовать вас в увлекательном мире дата-сайентистов банка "Открытие". На связи Иван Кондраков, Константин Грушин и Станислав Арешин. Недавно мы поделились с вами нашим пайплайном разработки линейных моделей для решения задач бинарной классификации. Теперь же мы решили поведать о нашем опыте построения моделей градиентного бустинга. За последнее время команда проделала колоссальную работу: мы протестировали различные методы отбора факторов, нашли новые инсайты в данных, провели интересную (а, главное, полезную!) аналитическую работу и решили несколько Ad-hoc задач. Зовите всех к экранам, мы начинаем!

Го к туториалу
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 9

Детекция и классификация заданных предметов по изображениям с разделением модели и данных

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 1.3K
Python *Машинное обучение *Искусственный интеллект
Из песочницы

Целью данной статьи является описание моей квалификационной работы при получении профессии Data Scientist. Поскольку профессиональная деятельность до этого не была прямо связана с направлением ML, тема итоговой работы получилась несколько академической.

Как известно, для успешной работы системы детекции и классификации (СДК) с применением технологии компьютерного зрения необходим большой объем данных, в том числе разметка объектов на изображении. Такая предварительная подготовка трудоемка и длительна. До сих пор работа по разметке объектов для создания обучающей выборки проводится в ручном режиме, хотя уже применяется и определенная автоматизация. Один из возможных вариантов такой автоматизации и был рассмотрен в работе.

Читать далее
Рейтинг 0
Комментарии 0

Определение свободного парковочного места с помощью Computer Vision

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 8.6K
Python *Data Mining *Машинное обучение *Искусственный интеллект
Из песочницы

Всем привет! Это моя первая статья на Хабр (поэтому не судите строго).

Дело было так: смотрел я как-то в окно и увидел, как человек сидит в машине на парковке и ждет, когда освободится парковочное место. Бывает, что и я сижу в машине и жду, когда же можно будет припарковать своего верного коня. И тут я подумал, а почему бы не подключить Компьютерное Зрение для этого? Зачем я учился разработке нейросетей, если не могу заставить компьютер работать вместо меня?

Изначально идея заключалась в следующем: Модель на базе компьютерного зрения должна через веб-камеру, установленную дома, отслеживать освободившиеся места на парковке и информировать через telegram-бота если такое место появится. Работать будем на Python.

Итак, ТЗ для меня от меня сформулировано, теперь за дело!

Первое с чем необходимо было определиться, это решить, какую модель детектирования объектов использовать. Сначала мой выбор пал на Fast R-СNN. Модель показывала хорошее качество детектирования. Однако после нескольких дней прокрастинации обдумывания реализации я решил воспользоваться более современными и интересными методами и подключить детектор от YOLO (взял не самую новую 4 версию).

Читать далее
Всего голосов 28: ↑28 и ↓0 +28
Комментарии 30

Что такое исследование данных и почему оно необходимо — кейс rdl by red_mad_robot и «АгроТерры»

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 722
Блог компании red_mad_robot Data Mining *Data Engineering *
Кейс

Перед тем как проводить исследования на данных, нужно исследовать сами данные. Достаточно ли их для анализа, какие гипотезы и факторы влияют на результат, а какие — чистая рулетка? На эти вопросы отвечает исследование данных — Exploratory Data Analysis (EDA). Его rdl by red_mad_robot и проводил для «АгроТерры».​

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Ближайшие бесплатные мероприятия по разработке (6 июня — 8 июня 2023)

Уровень сложности Простой
Время на прочтение 1 мин
Количество просмотров 1.3K
Программирование *Учебный процесс в IT Карьера в IT-индустрии Конференции
Дайджест
Читать описание
Всего голосов 5: ↑3 и ↓2 +1
Комментарии 0

Академия Аналитиков Авито: новый набор

Время на прочтение 3 мин
Количество просмотров 1.6K
Блог компании AvitoTech Анализ и проектирование систем *Машинное обучение *
Recovery mode

Открыт приём заявок на новый поток Академии Аналитиков Авито. В этом году мы набираем студентов сразу на два направления: будем учить аналитиков данных и Data Science-инженеров. Обе программы бесплатные. 

Подать заявку можно до 13 июня. Занятия начнутся в сентябре, а вся программа продлится 13 месяцев — до конца сентября 2024 года. За это время студенты-аналитики освоят основные навыки от прикладной статистики и SQL до ML и теории экспериментов. Будущие DS-инженеры тоже разберутся с ML, а также алгоритмами и датасетами. 

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 0

А/Б тесты с метрикой отношения. Дельта-метод

Время на прочтение 8 мин
Количество просмотров 3.1K
Блог компании X5 Tech Python *Математика *Статистика в IT
Туториал

Привет, Хабр! В этой статье разберём, что такое метрики отношения. Узнаем, почему критерий Стьюдента не работает. Попробуем применить бутстреп к зависимым данным. Изучим дельта-метод — способ оценки А/Б тестов с метрикой отношения.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Комментарии 0
1