Как стать автором
Обновить
258.16
Рейтинг

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

Знакомство с Panda Gym

Блог компании SkillFactoryPython*Программирование*Машинное обучение*Искусственный интеллект
Перевод
Tutorial

К старту курса о машинном и глубоком обучении знакомим читателей с panda-gym — это библиотека с открытым исходным кодом, предоставляющая среду обучения с подкреплением интегрированному с Gym роботу Franka Emika Panda. Поддерживаются среды игр Atari, настольных игр, физические симуляции в 2D и 3D и многое другое. Это позволяет обучать несколько агентов, сравнивать их или разрабатывать новые алгоритмы машинного обучения для задач обучения с подкреплением. Подробности, как всегда, под катом, а в конце вы найдёте ссылку на блокнот Google Colab.

Читать далее
Всего голосов 7: ↑6 и ↓1+5
Просмотры799
Комментарии 0

Новости

Показать еще

Жизненный цикл ML-модели

Блог компании СитимобилBig Data*Машинное обучение*

Всем привет! Меня зовут Максим, и в Ситимобил я занимаюсь машинным обучением. Сегодня я расскажу вам, как мы разрабатываем устойчивые ML-модели в суровых условиях изменчивого мира.

Врууум
Всего голосов 13: ↑13 и ↓0+13
Просмотры1.3K
Комментарии 0

Как ИИ пытались бороться против ковида (и почему у них не получилось)

Блог компании gms & g-mateМашинное обучение*Исследования и прогнозы в ITИскусственный интеллектЗдоровье
Перевод


Когда в марте 2020 года вирус поразил Европу, больницы погрузились в новый для себя кризис, не видя путей для выхода. Мы столкнулись с резкой нехваткой знаний. Врачи не понимали, как вести пациентов, фармкомпании думали, как разработать вакцину, государства — как ограничить распространение ковида нанести минимум вреда экономике.


Но существовали данные из Китая, который уже четыре месяца боролся с пандемией. Если бы алгоритмы машинного обучения можно было обучить на этих данных, возможно, врачи и чиновники смогут принимать более взвешенные решения. И это спасет тысячи жизней.


Тогда действительно появлялась масса проектов, стартапов и статей о них. Вот только за март-апрель на Хабре, самые многообещающие:



Больницы были готовы принять любую помощь. Рук не хватало, им нужна была автоматизация. Были разработаны сотни инструментов, от маленьких до гипер-амбициозных. Но ничего почему-то не произошло. Ни один алгоритм не помог.

Читать дальше →
Всего голосов 16: ↑15 и ↓1+14
Просмотры4K
Комментарии 14

Как три ML-разработчика из Белгорода покоряли зарубежный IT-рынок

Машинное обучение*Карьера в IT-индустрииIT-компании

Всем известно, что зарплаты программистов в США или Европе на порядок выше российских. Правда обычно из этого следует, что большую часть заработанного ты тратишь на налоги, жилье, питание, медицину. А как живут разработчики, которые получают зарплату по зарубежным меркам, но живут в СНГ — с нашими ценами и налогами?

Мы запускаем серию статей про разработчиков, у которых получилось найти удаленную работу за границей и комфортно жить на родине.

Читать далее
Всего голосов 10: ↑2 и ↓8-6
Просмотры2.5K
Комментарии 14

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

Python*Data Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

image


В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом.
Мне будет очень приятно, если вы поставите сразу звезду в репозитории:
GitHub stars

Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Просмотры888
Комментарии 3

NER для русского языка в Spacy 3: удобно и легко

Python*Программирование*Машинное обучение*Natural Language Processing*

Славянские языки, в том числе и русский, считаются довольно сложными для обработки. В основном, из-за богатой системы окончаний, свободного порядка слов и других морфологических и синтаксических явлений. Распознавание именованных сущностей (далее, NER) представляется трудной задачей для славянских языков, где синтаксические зависимости часто маркируются морфологическими чертами, нежели определенным порядком словоформ. Поэтому NER сложен для этих языков в сравнении с германскими или романскими языками.

Читать далее
Всего голосов 12: ↑12 и ↓0+12
Просмотры1.2K
Комментарии 0

Музыкальная машинная ярость: настоящий металл, созданный компьютером

Блог компании Cloud4YМашинное обучение*Научно-популярноеИскусственный интеллект
Перевод

Мы уже рассказывали про «Евровидение» для нейросетей. Сегодня поделимся историей о проекте ещё одного экспериментатора. Бернхард Мюллер создал автоматический генератор музыки в стиле «металл» и скрестил его с GPT-3. Что получилось в результате, вы узнаете далее.

Читать далее
Всего голосов 21: ↑21 и ↓0+21
Просмотры4.7K
Комментарии 38

Продвинутое компьютерное зрение. Введение в Прямое визуальное отслеживание

Программирование*Машинное обучение*Искусственный интеллект
Перевод

Задача отслеживания объектов на изображении - одна из самых горячих и востребованных областей ML. Однако уже сейчас мы имеем огромное разнообразие различных техник и инструментов. Данная статья поможет начать Ваш путь в мир компьютерного зрения!

Сперва, мы представим некоторые типы методов визуального отслеживания. После, мы объясним как классифицировать их. Мы также поговорим о фундаментальных аспектах прямого визуального отслеживания, уделяя особое внимание методам, основанным на регионах, и методам основанным на градиентах. В будущих статьях мы представим подробный математический вывод алгоритма Лукаса-Канаде с акцентом на выравнивание изображений. И наконец, мы представим, как реализовать эти методы в Python. Давайте начнем!

Читать далее
Всего голосов 14: ↑14 и ↓0+14
Просмотры4.3K
Комментарии 2

Обзор методов чистки данных

Блог компании МТСData Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

Приветствую! Меня зовут Игорь Буянов, я NLP-разработчик в команде MTS AI. В рамках рабочих проектов группы обработки естественного языка я провожу исследования в области активного обучения, редукции шума и, в целом, занимаюсь подготовкой и обработкой датасетов.

В этой статье будут рассмотрены методы чистки данных – noise reduction – и результаты тестирования алгоритмов.

Чистка данных – значение и применение

Чистка данных – это процесс удаления шума из датасетов, который появляется в результате неправильно размеченных примеров. Источники такого шума могут быть разными: случайные ошибки аннотатора – человека или машины, которые размечают данные в соответствии с задачей, – неслучайные ошибки из-за плохого понимания задачи или двусмысленного примера, ошибки автоматической разметки. 

Несмотря на то, что существует много способов разметки и контроля качества данных, подобный шум всегда будет присутствовать в датасетах. В задачах классификации одна из причин шума – невозможность однозначно провести границу между классами. Для большинства современных моделей наличие шума в данных объемом до 10% – несерьезная проблема. Поэтому, если датасет создан грамотно или найденный набор данных надежен, результат будет удовлетворительным. 

Но что делать, если нужно решить специфическую задачу, для которой доступен только один датасет сомнительного качества? Или вам недоступны средства для качественной разметки, вы вынуждены размечать данные вручную и хотите проверить себя? На помощь придут алгоритмы чистки данных.

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Просмотры2.9K
Комментарии 2

Почти доброе место: как интернет пытались сделать менее злым и что из этого вышло

Блог компании SelectelМашинное обучение*Научно-популярноеИскусственный интеллектСоциальные сети и сообщества
image

Люди, которые застали динозавров и пейджеры, могут помнить, что когда-то давно, диктуя сообщение девушке-оператору пейджинговой компании, можно было услышать в ответ «Это сообщение оскорбительно для получателя, отправлять его я не буду». И попробуй докажи, что это у вас с получателем такая внутренняя шутка.

С тех пор способов доставить получателю оскорбительное сообщение стало намного больше, а способов превентивно это остановить не так уж и много. Предлагаем вспомнить наиболее любопытные технологические попытки сделать интернет чуть более добрым местом.
Читать дальше →
Всего голосов 35: ↑33 и ↓2+31
Просмотры8K
Комментарии 44

7 способов получить качественные размеченные данные для машинного обучения

Data Mining*Обработка изображений*Big Data*Машинное обучение*Краудсорсинг
Перевод
Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

Любой data scientist знает, что необученная ML модель бесполезна. Без высококачественных размеченных данных для обучения контролируемое, обучение разваливается; при этом невозможно гарантировать, что модели смогут прогнозировать, классифицировать или каким-то иным образом анализировать интересующее нас явление с хоть какой-нибудь точностью.


При проведении контролируемого обучения (supervised learning) лучше не разрабатывать модель, если нет возможности найти подходящие данные для обучения. Даже если вы нашли подходящий набор обучающих данных, он не особо полезен, если его элементы не размечены, не снабжены метками и аннотациями для эффективного обучения алгоритма.
Читать дальше →
Всего голосов 5: ↑5 и ↓0+5
Просмотры2.1K
Комментарии 0

Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

Облачные вычисления*Big Data*Машинное обучение*Google Cloud Platform*Data Engineering*
Tutorial

Рассказываем как перестать переживать о том, что вы не знаете Hadoop и вывести работу с данными в компании на новый уровень, как быстро и без больших затрат создать в аналитическое хранилище, наладить процессы загрузки туда данных, дать возможность аналитикам строить отчеты в современных BI инструментах и применять машинное обучение.

Читать далее
Всего голосов 8: ↑6 и ↓2+4
Просмотры2.6K
Комментарии 20

DataScience Digest — 05.08.21

Python*Алгоритмы*Big Data*Машинное обучение*Искусственный интеллект

Приветствую всех!

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning подготовленный командой Data Phoenix и не забывайте подписываться на наш Telegram-канал.

Также хочу пригласить всех 17 августа на свой вебинар "The A-Z of Data: Introduction to MLOps". В его рамках мы рассмотрим, что такое MLOps, основные принципы и практики, лучшие инструменты и возможные архитектуры. Мы начнем с простого жизненного цикла разработки ML решений и закончим сложным, максимально автоматизированным, циклом, который нам позволяет реализовать MLOps. Детали и обязательная предварительная регистрация здесь.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Просмотры1.4K
Комментарии 1

Как кентавры обыгрывают ИИ: история про симбиоз компьютера и человека в логических играх

Блог компании Leader-IDМашинное обучение*Научно-популярноеИскусственный интеллектЛогические игры

В конце прошлого века компьютер шаг за шагом начал громить сначала чемпионов по шашкам, а затем и лучших гроссмейстеров, которые отдали шахматам всю свою жизнь. Но добравшись по исторической лестнице до го, компьютер вдруг перестал быть непобедимым, хотя поначалу казалось, что тут ему тоже не будет равных. Просто в тот момент против него выступили так называемые «цифровые кентавры».

Под катом краткая история победного шествия компьютера, рассказ про появление «цифровых кентавров» и почему они играют в го.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Просмотры2K
Комментарии 5

Спектральный анализ временных рядов с помощью python

Python*Программирование*Машинное обучение*

С развитием информационных технологий профессия DS стала чрезвычайно популярна. Сейчас почти каждый может имея ПК и установленный на нем стандартный пакет Python, анализировать данные и строить на их основе прогнозы.

Во многих случаях достаточно просто скачать библиотеку для анализа данных, и получить неплохие результаты. При этом процессы, происходящие внутри используемых пользователем библиотек, остаются за пределами понимания, что зачастую влечет за собой неспособности поверхностного пользователя правильно интерпретировать полученные данные, особенно если это нейросеть.

В статье представлен пример реализации спектрального анализа функции на примере реальных данных. Этот математический метод позволяет провести более глубокий анализ изменения функции переменной во времени, найти периодические составляющие. Его применение способно существенно повлиять на результат предсказания целевой переменной, поскольку позволяет учитывать сезонные и другие периодические колебания.

Предположим, перед аналитиком стоит задача исследовать информацию о количестве людей на сайте в определенное время в определенный день, имея выборку по посещению сайта за несколько месяцев каждые 30 минут. И сделать прогноз посещения на будущий период.

Данные по посещениям представлены на графике ниже

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Просмотры3K
Комментарии 11

Валидация моделей машинного обучения

Блог компании GlowByteМашинное обучение*

Всем привет!

На связи команда Advanced Analytics GlowByte и сегодня мы разберем валидацию моделей. 
Иногда термин «валидация» ассоциируется с вычислением одной точечной статистической метрики (например, ROC AUC) на отложенной выборке данных. Однако такой подход может привести к ряду ошибок.

В статье разберем, о каких ошибках идет речь, подробнее рассмотрим процесс валидации и дадим ответы на вопросы:

  1. на каком этапе жизненного цикла модели проводится валидация? Спойлер: это происходит больше одного раза;
  2. какие метрики обычно применяются при валидации и с какой целью?
  3. почему важно использовать не только количественные, но и качественные метрики?

Примеры в статье будут из финансового сектора. Финансовый сектор отличается от других областей (больше предписаний со стороны регулятора — Центрального банка), но в то же время в секторе большой опыт применения моделирования для решения бизнес-задач и есть широкий спектр опробованных на практике тестов по валидации моделей. Поэтому статья будет интересна как тем, кто работает в ритейле, телекоме, промышленности, так и специалистом любой другой сферы, где применяются модели машинного обучения.
Читать дальше →
Всего голосов 3: ↑2 и ↓1+1
Просмотры1.6K
Комментарии 0

Ансамблевые методы машинного обучения

Python*Машинное обучение*

Ансамблевые методы - это мощный инструмент для построения моделей машинного обучения. Команды, которые используют их в соревнованиях на kaggle, занимают победные места. Ансамбли позволяют увеличить точность модели до 90+, при этом они довольно просты в понимании.

Поэтому я решил осветить эту тему в данной статье и показать реализацию ансамблей с помощью scikit-learn.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Просмотры1.5K
Комментарии 0

Бесплатный вебинар: Основы ИИ (10 августа)

Блог компании MicrosoftMicrosoft AzureМашинное обучение*Облачные сервисыИскусственный интеллект

Подробности и регистрация.

Откройте для себя решения, которые можно создавать с помощью ИИ, и сервисы Azure, помогающие в разработке этих решений. Присоединяйтесь к нам на бесплатном мероприятии «Microsoft Azure Virtual Training Day: основы ИИ», чтобы получить общее представление о том, что такое ИИ, и узнать, как начать работу с ИИ в Azure.

Читать далее
Рейтинг0
Просмотры793
Комментарии 2

О квантовых компьютерах, биткоине и превосходстве. Лекция открытого курса qmlcourse

Блог компании Open Data ScienceМашинное обучение*Научно-популярноеКвантовые технологии

Это первая статья из планируемого цикла статей в рамках открытого курса по квантовому машинному обучению. В этой статье мы попытаемся ответить на самые частые вопросы, которые можно встретить в комментариях к статьям к хабе "Квантовые технологии". А именно, мы поговорим о том, что это за компьютеры вообще, какие задачи они могут решать и для чего все так хотят их создать. Дальше мы постараемся оценить тот размер квантовых компьютеров, который необходим для того, чтобы они стали практически полезными и сравним его с теми размерами, которые имеют самые топовые квантовые компьютеры сегодня. В конце немного обсудим тему квантового превосходства, а именно, что это такое ну и немного поговорим о том, сколько стоит сегодня запустить что-то на настоящем квантовом компьютере в облаке.

Поехали!
Всего голосов 28: ↑28 и ↓0+28
Просмотры4.3K
Комментарии 4

Оставят ли сервисы по разработке софта на основе ИИ без работы программистов

Программирование*Алгоритмы*Машинное обучение*Разработка робототехники*
Recovery mode

Новость о том, что Сбер обучил нейросеть написанию программы, заставила задуматься о перспективах взаимодействия человека и искусственного интеллекта. Участники рынка рассказали, какие риски могут возникнуть, если ИИ сам начнет создавать ПО, и станет ли нейросеть тем слугой, который обошел своего нерасторопного хозяина.

Читать далее
Всего голосов 6: ↑2 и ↓4-2
Просмотры2.8K
Комментарии 1

Вклад авторов