Машинное обучение *

Основа искусственного интеллекта

Статьи Авторы Компании

honyaki вчера в 17:06

Знакомство с Panda Gym

Блог компании SkillFactoryPython*Программирование*Машинное обучение*Искусственный интеллект

Перевод

Tutorial

К старту курса о машинном и глубоком обучении знакомим читателей с panda-gym — это библиотека с открытым исходным кодом, предоставляющая среду обучения с подкреплением интегрированному с Gym роботу Franka Emika Panda. Поддерживаются среды игр Atari, настольных игр, физические симуляции в 2D и 3D и многое другое. Это позволяет обучать несколько агентов, сравнивать их или разрабатывать новые алгоритмы машинного обучения для задач обучения с подкреплением. Подробности, как всегда, под катом, а в конце вы найдёте ссылку на блокнот Google Colab.

799

MaximML вчера в 12:01

Жизненный цикл ML-модели

Блог компании СитимобилBig Data*Машинное обучение*

Всем привет! Меня зовут Максим, и в Ситимобил я занимаюсь машинным обучением. Сегодня я расскажу вам, как мы разрабатываем устойчивые ML-модели в суровых условиях изменчивого мира.

Врууум

+13

1.3K

Arnak 10 августа в 12:36

Как ИИ пытались бороться против ковида (и почему у них не получилось)

Блог компании gms & g-mateМашинное обучение*Исследования и прогнозы в ITИскусственный интеллектЗдоровье

Перевод

Когда в марте 2020 года вирус поразил Европу, больницы погрузились в новый для себя кризис, не видя путей для выхода. Мы столкнулись с резкой нехваткой знаний. Врачи не понимали, как вести пациентов, фармкомпании думали, как разработать вакцину, государства — как ограничить распространение ковида нанести минимум вреда экономике.

Но существовали данные из Китая, который уже четыре месяца боролся с пандемией. Если бы алгоритмы машинного обучения можно было обучить на этих данных, возможно, врачи и чиновники смогут принимать более взвешенные решения. И это спасет тысячи жизней.

Тогда действительно появлялась масса проектов, стартапов и статей о них. Вот только за март-апрель на Хабре, самые многообещающие:

Больницы были готовы принять любую помощь. Рук не хватало, им нужна была автоматизация. Были разработаны сотни инструментов, от маленьких до гипер-амбициозных. Но ничего почему-то не произошло. Ни один алгоритм не помог.

Читать дальше →

+14

NapoleonIT 10 августа в 12:24

Как три ML-разработчика из Белгорода покоряли зарубежный IT-рынок

Машинное обучение*Карьера в IT-индустрииIT-компании

Всем известно, что зарплаты программистов в США или Европе на порядок выше российских. Правда обычно из этого следует, что большую часть заработанного ты тратишь на налоги, жилье, питание, медицину. А как живут разработчики, которые получают зарплату по зарубежным меркам, но живут в СНГ — с нашими ценами и налогами?

Мы запускаем серию статей про разработчиков, у которых получилось найти удаленную работу за границей и комфортно жить на родине.

-6

2.5K

AlekseyKorshuk 10 августа в 08:31

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

Python*Data Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом.
Мне будет очень приятно, если вы поставите сразу звезду в репозитории:

Читать дальше →

888

NewTechAudit 9 августа в 14:39

NER для русского языка в Spacy 3: удобно и легко

Python*Программирование*Машинное обучение*Natural Language Processing*

Славянские языки, в том числе и русский, считаются довольно сложными для обработки. В основном, из-за богатой системы окончаний, свободного порядка слов и других морфологических и синтаксических явлений. Распознавание именованных сущностей (далее, NER) представляется трудной задачей для славянских языков, где синтаксические зависимости часто маркируются морфологическими чертами, нежели определенным порядком словоформ. Поэтому NER сложен для этих языков в сравнении с германскими или романскими языками.

+12

1.2K

Cloud4Y 9 августа в 14:32

Музыкальная машинная ярость: настоящий металл, созданный компьютером

Блог компании Cloud4YМашинное обучение*Научно-популярноеИскусственный интеллект

Перевод

Мы уже рассказывали про «Евровидение» для нейросетей. Сегодня поделимся историей о проекте ещё одного экспериментатора. Бернхард Мюллер создал автоматический генератор музыки в стиле «металл» и скрестил его с GPT-3. Что получилось в результате, вы узнаете далее.

+21

4.7K

gingermuffin 7 августа в 22:11

Продвинутое компьютерное зрение. Введение в Прямое визуальное отслеживание

Программирование*Машинное обучение*Искусственный интеллект

Перевод

Задача отслеживания объектов на изображении - одна из самых горячих и востребованных областей ML. Однако уже сейчас мы имеем огромное разнообразие различных техник и инструментов. Данная статья поможет начать Ваш путь в мир компьютерного зрения!

Сперва, мы представим некоторые типы методов визуального отслеживания. После, мы объясним как классифицировать их. Мы также поговорим о фундаментальных аспектах прямого визуального отслеживания, уделяя особое внимание методам, основанным на регионах, и методам основанным на градиентах. В будущих статьях мы представим подробный математический вывод алгоритма Лукаса-Канаде с акцентом на выравнивание изображений. И наконец, мы представим, как реализовать эти методы в Python. Давайте начнем!

+14

4.3K

aarmaageedoon 6 августа в 16:11

Обзор методов чистки данных

Блог компании МТСData Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

Приветствую! Меня зовут Игорь Буянов, я NLP-разработчик в команде MTS AI. В рамках рабочих проектов группы обработки естественного языка я провожу исследования в области активного обучения, редукции шума и, в целом, занимаюсь подготовкой и обработкой датасетов.

В этой статье будут рассмотрены методы чистки данных – noise reduction – и результаты тестирования алгоритмов.

Чистка данных – значение и применение

Чистка данных – это процесс удаления шума из датасетов, который появляется в результате неправильно размеченных примеров. Источники такого шума могут быть разными: случайные ошибки аннотатора – человека или машины, которые размечают данные в соответствии с задачей, – неслучайные ошибки из-за плохого понимания задачи или двусмысленного примера, ошибки автоматической разметки.

Несмотря на то, что существует много способов разметки и контроля качества данных, подобный шум всегда будет присутствовать в датасетах. В задачах классификации одна из причин шума – невозможность однозначно провести границу между классами. Для большинства современных моделей наличие шума в данных объемом до 10% – несерьезная проблема. Поэтому, если датасет создан грамотно или найденный набор данных надежен, результат будет удовлетворительным.

Но что делать, если нужно решить специфическую задачу, для которой доступен только один датасет сомнительного качества? Или вам недоступны средства для качественной разметки, вы вынуждены размечать данные вручную и хотите проверить себя? На помощь придут алгоритмы чистки данных.

2.9K

softley 6 августа в 14:23

Почти доброе место: как интернет пытались сделать менее злым и что из этого вышло

Блог компании SelectelМашинное обучение*Научно-популярноеИскусственный интеллектСоциальные сети и сообщества

Люди, которые застали динозавров и пейджеры, могут помнить, что когда-то давно, диктуя сообщение девушке-оператору пейджинговой компании, можно было услышать в ответ «Это сообщение оскорбительно для получателя, отправлять его я не буду». И попробуй докажи, что это у вас с получателем такая внутренняя шутка.

С тех пор способов доставить получателю оскорбительное сообщение стало намного больше, а способов превентивно это остановить не так уж и много. Предлагаем вспомнить наиболее любопытные технологические попытки сделать интернет чуть более добрым местом.

Читать дальше →

+31

kucev 6 августа в 14:13

7 способов получить качественные размеченные данные для машинного обучения

Data Mining*Обработка изображений*Big Data*Машинное обучение*Краудсорсинг

Перевод

Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

Любой data scientist знает, что необученная ML модель бесполезна. Без высококачественных размеченных данных для обучения контролируемое, обучение разваливается; при этом невозможно гарантировать, что модели смогут прогнозировать, классифицировать или каким-то иным образом анализировать интересующее нас явление с хоть какой-нибудь точностью.

При проведении контролируемого обучения (supervised learning) лучше не разрабатывать модель, если нет возможности найти подходящие данные для обучения. Даже если вы нашли подходящий набор обучающих данных, он не особо полезен, если его элементы не размечены, не снабжены метками и аннотациями для эффективного обучения алгоритма.

Читать дальше →

2.1K

mongohtotech 5 августа в 20:25

Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

Облачные вычисления*Big Data*Машинное обучение*Google Cloud Platform*Data Engineering*

Tutorial

Рассказываем как перестать переживать о том, что вы не знаете Hadoop и вывести работу с данными в компании на новый уровень, как быстро и без больших затрат создать в аналитическое хранилище, наладить процессы загрузки туда данных, дать возможность аналитикам строить отчеты в современных BI инструментах и применять машинное обучение.

2.6K

m31 5 августа в 16:34

DataScience Digest — 05.08.21

Python*Алгоритмы*Big Data*Машинное обучение*Искусственный интеллект

Приветствую всех!

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning подготовленный командой Data Phoenix и не забывайте подписываться на наш Telegram-канал.

Также хочу пригласить всех 17 августа на свой вебинар "The A-Z of Data: Introduction to MLOps". В его рамках мы рассмотрим, что такое MLOps, основные принципы и практики, лучшие инструменты и возможные архитектуры. Мы начнем с простого жизненного цикла разработки ML решений и закончим сложным, максимально автоматизированным, циклом, который нам позволяет реализовать MLOps. Детали и обязательная предварительная регистрация здесь.

1.4K

SvetBolgova 5 августа в 11:03

Как кентавры обыгрывают ИИ: история про симбиоз компьютера и человека в логических играх

Блог компании Leader-IDМашинное обучение*Научно-популярноеИскусственный интеллектЛогические игры

В конце прошлого века компьютер шаг за шагом начал громить сначала чемпионов по шашкам, а затем и лучших гроссмейстеров, которые отдали шахматам всю свою жизнь. Но добравшись по исторической лестнице до го, компьютер вдруг перестал быть непобедимым, хотя поначалу казалось, что тут ему тоже не будет равных. Просто в тот момент против него выступили так называемые «цифровые кентавры».

Под катом краткая история победного шествия компьютера, рассказ про появление «цифровых кентавров» и почему они играют в го.

NewTechAudit 5 августа в 08:18

Спектральный анализ временных рядов с помощью python

Python*Программирование*Машинное обучение*

С развитием информационных технологий профессия DS стала чрезвычайно популярна. Сейчас почти каждый может имея ПК и установленный на нем стандартный пакет Python, анализировать данные и строить на их основе прогнозы.

Во многих случаях достаточно просто скачать библиотеку для анализа данных, и получить неплохие результаты. При этом процессы, происходящие внутри используемых пользователем библиотек, остаются за пределами понимания, что зачастую влечет за собой неспособности поверхностного пользователя правильно интерпретировать полученные данные, особенно если это нейросеть.

В статье представлен пример реализации спектрального анализа функции на примере реальных данных. Этот математический метод позволяет провести более глубокий анализ изменения функции переменной во времени, найти периодические составляющие. Его применение способно существенно повлиять на результат предсказания целевой переменной, поскольку позволяет учитывать сезонные и другие периодические колебания.

Предположим, перед аналитиком стоит задача исследовать информацию о количестве людей на сайте в определенное время в определенный день, имея выборку по посещению сайта за несколько месяцев каждые 30 минут. И сделать прогноз посещения на будущий период.

Данные по посещениям представлены на графике ниже

EienKotowaru 4 августа в 18:41

Валидация моделей машинного обучения

Блог компании GlowByteМашинное обучение*

Всем привет!

На связи команда Advanced Analytics GlowByte и сегодня мы разберем валидацию моделей.
Иногда термин «валидация» ассоциируется с вычислением одной точечной статистической метрики (например, ROC AUC) на отложенной выборке данных. Однако такой подход может привести к ряду ошибок.

В статье разберем, о каких ошибках идет речь, подробнее рассмотрим процесс валидации и дадим ответы на вопросы:

на каком этапе жизненного цикла модели проводится валидация? Спойлер: это происходит больше одного раза;
какие метрики обычно применяются при валидации и с какой целью?
почему важно использовать не только количественные, но и качественные метрики?

Примеры в статье будут из финансового сектора. Финансовый сектор отличается от других областей (больше предписаний со стороны регулятора — Центрального банка), но в то же время в секторе большой опыт применения моделирования для решения бизнес-задач и есть широкий спектр опробованных на практике тестов по валидации моделей. Поэтому статья будет интересна как тем, кто работает в ритейле, телекоме, промышленности, так и специалистом любой другой сферы, где применяются модели машинного обучения.

Читать дальше →

1.6K

ArtemBurenok 4 августа в 18:36

Ансамблевые методы машинного обучения

Python*Машинное обучение*

Ансамблевые методы - это мощный инструмент для построения моделей машинного обучения. Команды, которые используют их в соревнованиях на kaggle, занимают победные места. Ансамбли позволяют увеличить точность модели до 90+, при этом они довольно просты в понимании.

Поэтому я решил осветить эту тему в данной статье и показать реализацию ансамблей с помощью scikit-learn.

1.5K

sahsAGU 4 августа в 14:33

Бесплатный вебинар: Основы ИИ (10 августа)

Блог компании MicrosoftMicrosoft AzureМашинное обучение*Облачные сервисыИскусственный интеллект

Подробности и регистрация.

Откройте для себя решения, которые можно создавать с помощью ИИ, и сервисы Azure, помогающие в разработке этих решений. Присоединяйтесь к нам на бесплатном мероприятии «Microsoft Azure Virtual Training Day: основы ИИ», чтобы получить общее представление о том, что такое ИИ, и узнать, как начать работу с ИИ в Azure.

793

SemyonSinchenko 4 августа в 14:00

О квантовых компьютерах, биткоине и превосходстве. Лекция открытого курса qmlcourse

Блог компании Open Data ScienceМашинное обучение*Научно-популярноеКвантовые технологии

Это первая статья из планируемого цикла статей в рамках открытого курса по квантовому машинному обучению. В этой статье мы попытаемся ответить на самые частые вопросы, которые можно встретить в комментариях к статьям к хабе "Квантовые технологии". А именно, мы поговорим о том, что это за компьютеры вообще, какие задачи они могут решать и для чего все так хотят их создать. Дальше мы постараемся оценить тот размер квантовых компьютеров, который необходим для того, чтобы они стали практически полезными и сравним его с теми размерами, которые имеют самые топовые квантовые компьютеры сегодня. В конце немного обсудим тему квантового превосходства, а именно, что это такое ну и немного поговорим о том, сколько стоит сегодня запустить что-то на настоящем квантовом компьютере в облаке.

Поехали!

+28

4.3K

RSpectr 4 августа в 09:56

Оставят ли сервисы по разработке софта на основе ИИ без работы программистов

Программирование*Алгоритмы*Машинное обучение*Разработка робототехники*

Recovery mode

Новость о том, что Сбер обучил нейросеть написанию программы, заставила задуматься о перспективах взаимодействия человека и искусственного интеллекта. Участники рынка рассказали, какие риски могут возникнуть, если ИИ сам начнет создавать ПО, и станет ли нейросеть тем слугой, который обошел своего нерасторопного хозяина.

-2

2.8K

2 3 ...

49 50

Машинное обучение *

Знакомство с Panda Gym

Новости

Жизненный цикл ML-модели

Как ИИ пытались бороться против ковида (и почему у них не получилось)

Как три ML-разработчика из Белгорода покоряли зарубежный IT-рынок

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

NER для русского языка в Spacy 3: удобно и легко

Музыкальная машинная ярость: настоящий металл, созданный компьютером

Продвинутое компьютерное зрение. Введение в Прямое визуальное отслеживание

Обзор методов чистки данных

Почти доброе место: как интернет пытались сделать менее злым и что из этого вышло

7 способов получить качественные размеченные данные для машинного обучения

Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

DataScience Digest — 05.08.21

Как кентавры обыгрывают ИИ: история про симбиоз компьютера и человека в логических играх

Спектральный анализ временных рядов с помощью python

Валидация моделей машинного обучения

Ансамблевые методы машинного обучения

Бесплатный вебинар: Основы ИИ (10 августа)

О квантовых компьютерах, биткоине и превосходстве. Лекция открытого курса qmlcourse

Оставят ли сервисы по разработке софта на основе ИИ без работы программистов

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги