Как стать автором
Обновить
186.81
Рейтинг

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Матстат и опоздания на работу

Блог компании OTUS Математика *Машинное обучение *
Recovery mode

Привет, народ! В рамках курса Python для аналитики, хочу поделиться с вами небольшим шуточным исследованием, которое немного раскроет методику применения математической статистики и A/B тестирования в повседневной жизни. Данное исследование, как и статью в целом, подготовил мой коллега Роман Козлов.

В последнее время проблема с опозданиями не так уж остро стоит, ведь большинство работников, особенно в IT-сфере, работают на удалёнке. Однако, остались еще те последние из могикан, кто вынужден ходить на работу по старинке в офис.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 1.9K
Комментарии 0

Новости

Три подхода к ускорению обучения XGBoost-моделей

Блог компании Wunder Fund Python *Программирование *Машинное обучение *
Перевод

Фреймворк XGBoost (Extreme Gradient Boosting, экстремальный градиентный бустинг) — это эффективная опенсорсная реализация алгоритма градиентного бустинга. Этот фреймворк отличается высокой скоростью работы, а модели, построенные на его основе, обладают хорошей производительностью. Поэтому он пользуется популярностью при решении задач классификации и регрессии с использованием табличных наборов данных. Но процесс обучения XGBoost-моделей может занять много времени.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 447
Комментарии 1

Как и для чего мы построили ML Space

Блог компании SberCloud IT-инфраструктура *Облачные вычисления *Машинное обучение *Суперкомпьютеры

Речь пойдет о платформе для ML-разработки полного цикла. Работа над ней стартовала с запуска одной из наиболее производительных вычислительных систем в России — суперкомпьютера Christofari. Расскажем, как мы строили ML Space и что предлагает платформа.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 496
Комментарии 0

Сегментация экземпляров с помощью Mask R-CNN

Python *Программирование *Машинное обучение *

Задача сегментации изображений может решаться в нескольких постановках. Самая распространённая - semantic segmentation с одним классом и фоном, необходимо просто отделить объекты от фона, не различая их между собой. Но часто просто отделения от фона недостаточно, необходимо отделять отдельные образцы друг от друга, например, чтобы оценить размер или расположение каждого отдельного объекта. Как это можно сделать?

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 392
Комментарии 0

Как улучшить распознавание скелетов в MediaPipe

Блог компании Recognitor Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект
Tutorial

Я очень люблю скелетные детекторы из Mediapipe. Чтобы запустить их нужно всего несколько минут. Работает на разных платформах (мобильные, pc, embedded, и.т.д.). И выдает достаточное качество для многих применений. 

Но надо признать что не всюду его можно брать и использовать. Давайте я расскажу как небольшими силами можно его улучшить. Приведенная тут логика будет построена вокруг Mediapipe, но она им не ограничена. Применяя аналогичные подходы можно улучшить практически любой скелетный алгоритм.

Читать далее
Всего голосов 16: ↑15 и ↓1 +14
Просмотры 1.9K
Комментарии 14

Проведение совместных экспериментов c DVC

Open source *Big Data *Машинное обучение *Data Engineering *
Перевод

Вы можете использовать удаленные хранилища DVC для совместного использования экспериментов и их данных через машины.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 573
Комментарии 0

NNHelper – пакет на языке Go для создания и использования нейронной сети

Go *Машинное обучение *

Данная статья описывает работу пакета nnhelper, предназначенного для создания и использования нейронных сетей в программах на языке Go.

Если Вы уже знакомы с машинным обучением и используете его в своей работе, то эта статья и описанные в ней примеры могут показаться вам слишком простыми. Если Вы в начале пути и хотите познакомиться с этой темой или вам хотелось бы научиться использовать нейроматрицу в ваших программах на языке Go, то вы попали точно по адресу.

Go пакет nnhelper разработан для быстрого создания нейронной сети и использовании ее в приложениях, написанных на языке Go. Для использования nnhelper не потребуется ничего дополнительного, кроме Go. Пакет nnhelper является надстройкой над пакетом gonn. И это единственная внешняя зависимость.

Читать далее
Всего голосов 9: ↑6 и ↓3 +3
Просмотры 2.3K
Комментарии 7

Для чего нужно интервью по проектированию системы машинного обучения и как его провести

Машинное обучение *Управление проектами *Интервью IT-компании

Предлагаем детальный гайд по подготовке к интервью по проектированию системы ML

Что означает дизайн системы ML?

Такие навыки как машинное обучение, презентации, кодирование, статистика, вероятность, тематические исследования и прочие необходимы для успешного проведения интервью по машинному обучению. И одном из главных интервью по ML является интервью по проектированию системы.

Оно необходимо для оценки кандидата на его понимание общей картины разработки полной системы ML с учетом всех деталей. В основном кандидаты ML хорошо разбираются в технических тонкостях, но когда дело доходит до их компиляции, они не могут увидеть сложности и взаимозависимости проектирования всей системы от сбора данных до оценки и развёртывания модели и поэтому плохо справляются с интервью.

Важно в таком интервью – структурированный мыслительный процесс. Однако он требует подготовки. Заранее подготовленный гайд может очень пригодиться при ограниченном времени интервью. Гарантируем, что вы сконцентрируетесь на важном, не будете долго обсуждать одно или упускать важные темы.

Итак, гайд выглядит так:

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 1.8K
Комментарии 1

Как установить ботов для StarCraft II

Python *Разработка игр *Машинное обучение *Искусственный интеллект Игры и игровые консоли
Tutorial

(с) Blizzard Entertainment

В StarCraft II есть встроенные боты, и все с ними хорошо, за исключением того, что они немного тупые, но речь пойдет не о них. В 2017 году разработчик игры компания Blizzard Entertainment опубликовала API, позволяющий создавать внешних ботов. Однако, по какой-то странной причине Blizzard рассматривает этот API как сугубо исследовательский проект, где боты должны сражаться только друг с другом. Нормальной возможности поиграть человеку с ботами они почему-то не сделали, хотя многие геймеры рассматривают ботов как довольно неплохой инструмент тренировок.

Тем не менее все не так плохо. Раз штатной возможности нет, то будем использовать нештатную. Мы все же настроим ботов и повоюем против них. Потом мы с вами, движимые исследовательским порывом, разберемся как устроен АPI, и поднимем окружение разработки, в котором сможем сами писать подобных ботов.
Читать дальше →
Всего голосов 26: ↑25 и ↓1 +24
Просмотры 6.2K
Комментарии 3

Распределённое глубокое обучение: параллелизм моделей и данных в TensorFlow

Блог компании Wunder Fund Python *Машинное обучение *TensorFlow *
Перевод

Значительное количество задач, предусматривающих обучение глубоких нейронных сетей, можно решить на отдельном компьютере, обладающем единственным, сравнительно мощным и быстрым GPU. Но бывает так, что нужно что-то помощнее. Например — данные могут просто не поместиться в память, доступную на отдельной машине. Или окажется, что имеющееся «железо» просто не «потянет» некую задачу. В результате может возникнуть необходимость в горизонтальном масштабировании вычислительных мощностей.

«Горизонтальное масштабирование» — это когда в компьютер добавляют дополнительные GPU, или когда используют несколько машин, входящих в состав кластера. При таком подходе нужен какой-то способ эффективного распределения задач обучения моделей по имеющимся системам. В теории всё просто, но в реальной жизни это — задача нетривиальная. На самом деле — существует несколько стратегий организации распределённого обучения. Выбор конкретной стратегии сильно зависит от конкретной задачи, от данных и от модели.

В этом материале я попытаюсь описать существующие стратегии организации распределённого обучения, раскрыв детали необходимые для того, чтобы читатель смог бы получить общее представление о них. Нашей главной целью будет обретение возможности выбора наилучшей из стратегий для конкретной задачи. Тут я продемонстрирую некоторые примеры кода, основанные на библиотеке TensorFlow. Освоив их, вы разберётесь с тем, как именно устроена программная часть рассматриваемых здесь стратегий распределённого обучения. Но, в любом случае, затрагиваемые здесь концепции применимы не только к TensorFlow, но и к другим библиотекам и фреймворкам глубокого обучения.

Эта публикация входит в серию материалов о глубоком обучении. В предыдущих статьях шла речь о создании собственного цикла обучения для задачи по сегментации изображений с помощью U-net. Мы развернули модель в Google Cloud для того чтобы получить возможность удалённого запуска обучения. Здесь я буду использовать тот же код.

Читать далее
Всего голосов 10: ↑10 и ↓0 +10
Просмотры 1.2K
Комментарии 1

Как выжать из солнечной батареи максимум с помощью обучения с подкреплением

Блог компании SkillFactory Python *Машинное обучение *Разработка под Arduino *Энергия и элементы питания
Перевод

Под катом вас ждёт чертёж установки, блок-схемы агента, работающего методом проб и ошибок, а также визуализации, видеоролики и, конечно, код. Материалом делимся к старту нашего флагманского курса по Data Science.

Читать далее
Всего голосов 14: ↑11 и ↓3 +8
Просмотры 9.1K
Комментарии 13

Простой поиск дубликатов изображения

Python *Программирование *Машинное обучение *
Tutorial

Существует множество проверенных решений, основанных на разных алгоритмах. Этот пример использует элементы машинного обучения, текущий уровень развития инструментов, позволяет с минимальными усилиями решать "бытовые задачи". В качестве меры сходства - косинусное сходство. Сравнение многомерных массивов (изображение в цифровом пространстве), ресурсоемкий процесс, поэтому, применяем обученную свёрточную нейронную сеть для уменьшения размерности с учетом важных пространственных признаков. Библиотека keras содержит готовые модели под разные задачи, этот пример задействует архитектуру VGG16 обученную на данных imagenet. Вход в сеть (N, 224, 224, 3), выход (1, 512).

Читать далее
Всего голосов 7: ↑5 и ↓2 +3
Просмотры 2.6K
Комментарии 2

Как узнать принцессу среди 500 амурских тигров с помощью vision transformers

Обработка изображений *Хакатоны Машинное обучение *

Рассказываем, как мы, ML princesses [Napoleon IT] стали победителями кейса от Минприроды «Защита редких животных», и решили задачу по созданию сервиса, способного распознавать в дикой природе особо редкий вид хищников- амурского тигра. Десятый региональный хакатон проходил в рамках федерального проекта «Искусственный интеллект».

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 1.2K
Комментарии 9

Лингвистические особенности речи человека в диалогах с виртуальным ассистентом

Python *Машинное обучение *Искусственный интеллект

Зачастую, для создания виртуальных ассистентов используются подходы на основе машинного обучения и, конечно, подходы на основе правил. Оба (в большей степени машинное обучение) полагаются на исходные данные, которыми обычно являются человеческие диалоги. При этом, не учитывается фактор того, что пользователи диалоговых систем не будут общаться с ними так же как с реальными людьми.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 1.7K
Комментарии 7

Как избежать «подводных камней» машинного обучения: руководство для академических исследователей

Машинное обучение *Искусственный интеллект Data Engineering *
Из песочницы
Перевод

Этот лонг-рид является сильно переработанным и расширенным переводом статьи How to avoid machine learning pitfalls: a guide for academic researchers (Lones, 2021).

Статья является кратким описанием ряда распространенных ошибок, возникающих при использовании методов машинного обучения, и руководством к тому, как их избежать. Материал предназначен в первую очередь для студентов-исследователей и касается вопросов, регулярно возникающих в академических исследованиях, например, необходимости проводить строгие сравнения и делать обоснованные выводы. Однако материал применим к использованию ML и в других областях.

Читать далее
Всего голосов 20: ↑20 и ↓0 +20
Просмотры 6.5K
Комментарии 3

Развертывание моделей машинного обучения. Часть первая. Размещаем Web-приложение в облачной платформе Heroku

Облачные вычисления *Машинное обучение *Учебный процесс в IT DevOps *Искусственный интеллект
Tutorial

В этой серии статей мы рассмотрим, как на основе готовых моделей создавать приложения, использующие машинное обучение, и организовывать доступ пользователей к ним. Начнем с создания Web-приложения для классификации изображений на Streamlit и развертывания его на облачной платформе Heroku в бесплатном аккаунте. Этот подход подойдет для прототипов и персональных или учебных проектов.

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Просмотры 2.9K
Комментарии 4

MLOps меняет процесс разработки моделей машинного обучения

Машинное обучение *DevOps *
Перевод

Промышленные решения, основанные на машинном обучении — это гораздо больше, чем просто модель. Три ключевые концепции, охватывающие управление версиями, тестирование и конвейеры, являются основой для операций машинного обучения (MLOps), которые помогают группам по анализу данных быстрее и увереннее выпускать модели.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 1.8K
Комментарии 0

Глубокое обучение для моделирования свойств тонких структур в массовых распределениях продуктов ядерных реакций

Машинное обучение *Физика

Одно из информативных теоретических описаний ядерных реакций представляет эволюцию ядерной системы в виде траекторий в многомерном пространстве деформаций. Нахождение изображений таких траекторий в пространстве экспериментально наблюдаемых переменных было предложено как новый подход к анализу данных. Траектории выглядят как «тонкие структуры» в двумерных распределениях, например, в корреляционных массовых распределениях.

Перед математиками Лаборатории информационных технологий им. М.Г.Мещерякова ОИЯИ были поставлены задачи выявления линейной структуры на имеющемся экспериментальном материале и оценки уровня ее достоверности по отношению к альтернативной гипотезе о том, что фактически наблюдается только случайная последовательность точек. Сложная ромбо-спиральная форма наблюдаемой тонкой структуры, названной физиками «ядерной розой», и достаточное количество точек, ее составляющих, позволили выполнить детальный статистический анализ и установить ее свойства. Совокупность этих свойств дала возможность разработать числовую модель тонкой структуры, позволяющую создавать независимые изображения похожих структур с теми же статистическими свойствами.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 615
Комментарии 1

Введение в суррогатные модели. Часть 1: Актуальность и новизна

Блог компании ЦИТМ Экспонента Анализ и проектирование систем *Машинное обучение *Прототипирование *Искусственный интеллект
Перевод

Представьте, что кто-то создал для нас очень детальную имитационную модель сложнейшей системы (спасибо!). Теперь нам её эксплуатировать, мы же проектировщики, так что поищем оптимальную конфигурацию (миллион комбинаций параметров), прогнав для каждой из них по миллиону экспериментов (погода, реакция всяких агентов и просто для накопления статистики...). И тут нас настигает понимание того, что задача будет решаться несколько недель. Потратить время на упрощение модели вручную, или задействовать машинное обучение?

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 850
Комментарии 0

Взгляд физика: термодинамика машинного обучения

Блог компании SkillFactory Машинное обучение *Читальный зал Научно-популярное Физика
Перевод

Тим Лоу, кандидат наук в области физики, рассказывает о машинном обучении с точки зрения термодинамики. Материалом делимся к старту флагманского курса по Data Science.

Читать далее
Всего голосов 12: ↑8 и ↓4 +4
Просмотры 2.6K
Комментарии 1

Вклад авторов

Работа

Data Scientist
105 вакансий