Искусственный интеллект

AI, ANN и иные формы искусственного разума

Интерпретация моделей и диагностика сдвига данных: LIME, SHAP и Shapley Flow

Блог компании Open Data Science Алгоритмы *Машинное обучение *Статистика в IT Искусственный интеллект

В этом обзоре мы рассмотрим, как методы LIME и SHAP позволяют объяснять предсказания моделей машинного обучения, выявлять проблемы сдвига и утечки данных, осуществлять мониторинг работы модели в production и искать группы примеров, предсказания на которых объясняются схожим образом.

Также поговорим о проблемах метода SHAP и его дальнейшем развитии в виде метода Shapley Flow, объединяющего интерпретацию модели и многообразия данных.

+21

725

NuGan вчера в 12:57

NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 2)

Python *IT-инфраструктура *Искусственный интеллект

В предыдущей статье было показано как, используя несколько модулей Python, можно обрабатывать текстовые данные и переводить их в числовые векторы, чтобы получить матрицу векторных представлений коллекции документов. В данной статье будет рассказано об использовании матрицы векторных представлений текстов в сервисе автокластеризации первичных событий в платформе monq для зонтичного мониторинга ИТ-инфраструктуры и бизнес-процессов.

589

EVRAZ вчера в 11:49

Видеоаналитика на производстве. Как искусственный интеллект работает там, где не справляется человек

Блог компании ЕВРАЗ Промышленное программирование *Искусственный интеллект Видеотехника

Прокатный цех металлургического предприятия ЕВРАЗ ЗСМК занимается выпуском готовой продукции для клиентов: от арматуры до уголков. Производственный процесс — дело непростое. Иногда за всеми мощностями и нюансами человеческому глазу уследить сложно или даже невозможно. Под катом расскажем, каким образом система видеоаналитики решает производственные проблемы, изложим этапы ее создания и увидим, какие трудности возникают при решении подобного рода задач на металлургических предприятиях.

1.8K

Cloud4Y 12 января в 15:10

Как ИИ учится рисовать аниме

Блог компании Cloud4Y Машинное обучение *Искусственный интеллект

Перевод

Аниме — мультипликация, которая интересна не только подросткам. Даже среди суровых бородатых айтишников в свитерах есть ценители этого направления. Создатели Waifu Labs – сайта для генерации аниме-портретов – поделились своей внутренней кухней и рассказали, как ИИ создаёт рисунки.

+29

8.5K

kucev 12 января в 11:51

Почему я изменил своё мнение о слабой разметке для ML

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

Когда чуть больше года назад я впервые услышал о слабой разметке, то поначалу отнёсся к ней скептически. Суть слабой разметки (weak labelling) заключается в том, что можно заменить аннотированные вручную данные на данные, созданные по эвристическим правилам, написанным специалистами в соответствующей области. Мне это показалось совершенно нелогичным. Если можно создать очень хорошую систему на основе правил, то почему бы просто не использовать эту систему? А если правила недостаточно хороши, то разве не будет плохой и модель, обученная на шумных данных? Это казалось мне возвратом в мир конструирования признаков, которому должно было прийти на смену глубокое обучение.

Однако за последний год моё отношение полностью переменилось. Я поработал над множеством NLP-проектов, в которых было задействовано извлечение данных, и намного сильнее углубился в изучение литературы про обучение со слабым контролем. Также я пообщался с руководителями команд ML в таких компаниях, как Apple, где услышал истории о том, как целые системы заменяли за считанные недели — благодаря сочетанию слабого контроля и машинного обучения им удавалось создать обширные наборы данных для языков, ресурсов по которым было мало и которые раньше попросту не обслуживались!

Поскольку теперь я обладаю энтузиазмом новообращённого, мне хочется рассказать о том, что такое слабый контроль, чему я научился и почему, на мой взгляд, в области аннотирования данных он дополняет такие техники, как активное обучение.

Читать дальше →

+10

1.4K

ABBYYTeam 12 января в 10:40

ABBYY FastML: новый подход к машинному обучению на стороне клиента для обработки большого потока документов

Блог компании ABBYY Обработка изображений *Машинное обучение *Искусственный интеллект

Привет, Хабр!

Нашим заказчикам часто приходится работать с большим потоком документов, многие из которых очень похожи друг на друга, но не одинаковы. Поскольку обрабатывать такое количество информации с каждым годом становилось все сложнее, мы придумали технологическое решение, которое способно автоматизировать эту задачу с высокой точностью.

Например, представим, что на обработку поступают десятки тысяч инвойсов от сотен разных контрагентов. Раньше, чтобы автоматизировать их классификацию и извлечение информации, требовалось наработать базу поставщиков, а для каждого из типов документов — создать вручную гибкое описание (задать информацию о линейных отношениях полей относительно друг друга). Внедрение такого решения у клиента длилось от 3 до 6 месяцев.

Чтобы упростить и ускорить эту задачу и в целом облегчить работу нашим заказчикам, мы создали новый механизм кластеризации и разработали технологию FastML, а затем объединили их работу.

В нашем решении кластеризация избавляет от необходимости вести базу данных вендоров, а FastML способен работать, основываясь на пользовательском обучении: технология делит поток документов на определенные группы, на каждой из которых учит свою модель поиска. В результате новое решение лучше адаптируется к внешним отличиям документов и работает в несколько раз быстрее.

Но обо всем по порядку.

+11

2.1K

CyberLympha 10 января в 16:22

Использование рекуррентных нейронных сетей в Reinforcement Learning

Python *Программирование *Алгоритмы *Машинное обучение *Искусственный интеллект

В задачах машинного обучения для обучения модели может использоваться известная целевая переменная (задачи такого типа называются «обучение с учителем»), либо модель самостоятельно учится находить закономерности с имеющихся данных, не имея заранее известные правильные результаты (такой тип задач называется «обучение без учителя»). Обучение с подкреплением (Reinforcement Learning, RL) не относится ни к первому типу, ни ко второму, однако обладает свойствами и того, и другого. Этот вид машинного обучения в настоящее время бурно развивается, разрабатывается множество теоретических алгоритмов RL [1], однако основная причина всплеска интереса заключается в множестве практических задач, в которых применяется RL, прежде всего в автоматизации, оптимизации и робототехнике. Обучение с подкреплением эффективно прежде всего там, где системе требуется анализировать окружающую среду и выбирать политику поведения с учетом получаемого отклика.

Читать дальше →

+12

1.9K

valiotti 10 января в 13:04

Как писать посты в стиле Артемия Лебедева? Подробный анализ телеграм-канала и кое-что еще

Визуализация данных Машинное обучение *Искусственный интеллект Serverless *

Дисклеймер номер один: 18+. В этой статье присутствует ненормативная лексика, так как автор текстов, которые мы анализируем, не стесняется в выражениях. Мы не хотим никого задеть или оскорбить чьи-то чувства, присутствие мата объясняется лишь объектом нашего исследования.

Все знают телеграм-канал Артемия Лебедева, в котором очень часто можно увидеть хлесткое матерное слово, а некоторые его посты и вовсе неоднозначны. Я и мой коллега Егор решили как следует разобраться в семантике текстов Артемия, скачали все посты телеграм-канала и проанализировали его словарный диапазон. Сегодня мы обсудим важные этапы исследования и, что самое главное, обсудим аналитические выводы о телеграм-канале Артемия Лебедева.

Изначально, мы поставили перед собой следующие задачи: собрать тексты всех постов и метаинформацию о них, получить динамику подписчиков на канале, а после провести описательный и семантический анализы собранных данных. Но нам удалось сделать даже больше — в результате мы смогли обучить нейронную сеть на текстах Артемия Лебедева.
Теперь мы можем писать тексты для тг-канала Лебедева без него самого. Правда-правда.
Хотите узнать как?

Читать дальше →

+13

8.9K

Axe357 9 января в 22:28

AASIST: Аудио защита с использованием сети с интегрированным спектро-временным графом внимания

Информационная безопасность *Алгоритмы *Машинное обучение *Искусственный интеллект Natural Language Processing *

Перевод

Артефакты, которые отличают подделку от реальных данных, могут находиться в спектральной или временной областях. Их надежное обнаружение обычно зависит от ансамбля сложных систем, где каждая подсистема настроена на определенные артефакты. Мы стремимся разработать единую, эффективную систему, которая может обнаруживать широкий спектр различных атак с использованием спуфинга без использования групп баллов. Мы предлагаем новый слой внимания с гетерогенным наложением графа, который моделирует артефакты, охватывающие разнородные временные и спектральные области с гетерогенным механизмом внимания и узлом стека. С новой операцией максимального графа, которая включает конкурентный механизм и расширенную схему считывания, наш подход, названный AASIST, превосходит текущее состояние дел в данной области примерно на 20%. Даже облегченный вариант, AASIST-L, всего с 85 тыс. параметров, превосходит все конкурирующие системы.

775

0x7o 9 января в 01:35

keyT5 или генерация ключевых слов из текста

Программирование *Машинное обучение *Искусственный интеллект Natural Language Processing *

Из песочницы

Я попытался обучить русскоязычную модель ruT5-base и ruT5-large на задаче извлечения ключевых слов из текста.

1.7K

NuGan 6 января в 15:40

NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 1)

Python *IT-инфраструктура *Искусственный интеллект

Конечной задачей всей деятельности по созданию алгоритмов для обработки естественного языка (Natural Language Processing, NLP) является создание искусственного интеллекта (ИИ), который бы понимал человеческий язык, причем “понимал” в значении “осознавал смысл” (анализ текста) и “делал осмысленные высказывания” (синтез текста). Пока до этой цели ещё очень далеко, можно применять различные алгоритмические методы для извлечения какой-либо полезной информации из текстовых данных. А это уже очень полезно для ИТ мониторинга.
В этой статье мы расскажем о применении моделей ML для целей классификации поступающих данных.

3.3K

MagisterLudi 6 января в 09:00

Как белорусы уже 30 лет делают искусственный интеллект при помощи ТРИЗ

Prolog *История IT Научно-популярное Искусственный интеллект

«Это не программисты, это не разработчики, это — камикадзе.»

Минские студенты в 1987 году во главе с Валерием Цуриковым принялись программировать «Изобретающую машину» — софт, который бы усиливал интеллект инженеров и помогал изобретать. Кооператив был успешен и захватил 95% рынка бывших в странах СССР.
Когда СССР прекратил существовать, Валерий Цуриков перебрался в Бостон и основал свой «стартап» в 1992 году: Invention Machine Corp. Им заинтересовались Samsung, Boeing, NASA, Sony, Procter&Gamble.
В 1998 году журнал NASA провел опрос среди подписчиков и по результату голосования «Изобретающая машина» стала «the most innovative product in USA».
В 2012 году IHS inc купила Invention Machine Corp за 40 миллионов долларов.

30 лет назад Валерий Цуриков в спортивной сумке провез через границу 5000 фунтов и в Лондоне купил лицензионный язык «Пролог» (пожалуй, единственный лицензионный пакет на территории бывшего СССР). «Пролог» тогда был запрещённым к экспорту в страны СССР.

Эти ребята с фотографии тогда только что окончили радиотехнический институт и школу молодого изобретателя и с радостью начали писать на «Прологе». Они не знали, что на этом языке не было написано ни одной промышленной системы.

Через год профессору Ковальски, создателю языка «Пролог», показали рабочую систему и он не поверил, что она работает. Это был первый промышленный софт на «Прологе».

Читать дальше →

+32

49K

199

AmigoRRR 5 января в 13:28

Новогодний Робот ROS Огонёк с распаковкой робота собаки

Программирование *Разработка робототехники *Программирование микроконтроллеров *Робототехника Искусственный интеллект

В Robot Operating System сообществе мы решили провести новогодний Робот ROS Огонек, по примеру известной передачи Голубой огонек. В программе видео трансляции живое общение робототехников, истории про проекты роботов, ответы на различные вопросы по робототехнике.

И начнем мы видео с распаковки и обзора четвероногого робота собаки.

Читать далее и смотреть распаковку робота

2.6K

avecoder 31 декабря 2021 в 17:23

Мой личный личинный прогноз на 2022

Программирование *Исследования и прогнозы в IT Карьера в IT-индустрии Научно-популярное Искусственный интеллект

А в конце года посмотрим насколько я был прав/лев

Вот и наступило это чудесное время подвести итоги года ушедшего и взглянуть в год грядущий.

-2

9.5K

dumasti 30 декабря 2021 в 13:01

Тамада весёлый и конкурсы интересные, или как бот Яндекс поддержки спросил о качестве обслуживания раньше обслуживания

Яндекс API *Гаджеты Искусственный интеллект Умный дом

Доброго времени суток всем и с наступающими праздниками!

В данной публикации я хотел бы рассказать о своем опыте не общения с поддержкой Яндекс. Этим я хочу не только поделиться с сообществом, но и обратить внимание на данную проблему самой компании.

И так, начнем, все началось с того, что несколько дней назад я приобрел Яндекс станцию мини 2 серии и в ночь с 28 на 29 декабря распаковав станцию и установив ее в самое, на мой взгляд, удобное место начал с ней играться. Игрались мы хорошо, даже замечательно, много болтали и слушали музыку (даже когда я ее об этом не просил, но я понимаю, она обучается, да и дело не в этом). Вместе со станцией я приобрел и умную лампочку от Яндекс, с Алисой они быстро сдружились, и она взяла шефство над светом в комнате. В целом я очень доволен Алисой, она быстро находит ответ на мои вопросы, а если не может дать ответ или к слову приходится, то сыпет афоризмами. Плюс ко всему управление умным домом через Алису - это шикарно.

Ну давай посмотрю, что ты там понаписал

-3

3.7K

ancotir 29 декабря 2021 в 19:16

Научные журналы используют ИИ для поиска дублированных изображений в препринтах — проблемы и перспективы метода

Машинное обучение *Научно-популярное Искусственный интеллект Будущее здесь

Перевод

Научные издания используют автоматические программы на основе ИИ для поиска недостатков в представленных рукописях.

Перед тем, как исследование появится в одном из десяти журналов Американской ассоциации исследования рака (American Association for Cancer Research, AACR), оно проходит необычную дополнительную проверку. С января 2021 года AACR использует ИИ для проверки всех препринтов, предварительно принятых после прохождения рецензирования. Цель проверки состоит в том, чтобы автоматически предупреждать редакторов о дублированных изображениях, в том числе отредактированных — повёрнутых, отфильтрованных и растянутых.

1.1K

29 декабря 2021

Лёгкий способ написать статью на Хабр, или Привет от SmartSpeech

Привет! Меня зовут Филипенко Владимир и я не писал эту статью. Я её надиктовал. Поправок в этом тексте потребовали только термины, с которыми SmartSpeech ожидаемо не знаком. В остальном оставляю всё как есть.

В материале мы познакомимся с передовым сервисом синтеза и распознавания речи SmartSpeech от Сбера, обсудим его внутренности и разберемся, как этот сервис может облегчить и даже украсить жизнь рядового хабраавтора.

Поехали!

+16

9.4K

SmartEngines 29 декабря 2021 в 16:37

Проникающий взгляд: что в мешке у Деда Мороза?

Блог компании Smart Engines Алгоритмы *Обработка изображений *Искусственный интеллект

Новый Год - чудесный праздник: веселый, сказочный, волшебный. Наряженные елки, запах мандаринов в воздухе. Идут последние недели декабря, настроение праздничное, и на работе тоже пора заниматься праздничными делами. Вот мы и решили побаловать наших читателей новогодней томографической статьей. Самая прекрасная традиция - дарить подарки на Новый год. Ко всем детям на планете приходят Дед Мороз, Санта Клаус и другие герои культурного наследия и приносят разные подарки. Вот и под нашим пристальным рентгеновским взором оказались новогодние игрушки - детские подарки. В статье мы расскажем об ожиданиях, полученных результатах и наконец ответим на вопрос, что же скрывается в мешке у Деда Мороза.

1.3K

ProductivityInside 29 декабря 2021 в 08:49

История о том, как я наладил производство бумажных вебсайтов и купил сто записных книжек с Alibaba

Блог компании Productivity Inside Развитие стартапа Искусственный интеллект

Перевод

Если вкратце: я открыл бизнес, чтобы дать людям возможность создавать сайты на бумаге. По ходу дела я завирусился на Твиттере, заработал тысячу долларов за два дня и просадил 720 долларов на сотню блокнотов с Alibaba.

Однажды мне в голову пришел любопытный вопрос: «Можно ли создать вебсайт на листе бумаги?». Я тот самый человек, который как-то раз скупил 300 казахских доменов с эмоджи, но даже по моим меркам идея выглядела несколько странной.

Однако примерно в то же время у меня зародились планы начать вести новенький с иголочки блог о своей повседневной жизни. Перед глазами стали возникать картины: сижу я такой в халате с чашкой чая и шариковой ручкой, и каким-то образом делаю записи в онлайн-блоге непосредственно из записной книжки. Эта мысль показалась мне крайне забавной.

Так можно ли делать сайты на листе бумаги? Я решил, что, по крайней мере, стоит попробовать.

Читать дальше →

+51

13K

Galperin_Mark 28 декабря 2021 в 19:51

Телекоммуникационные шкафы под серверы искусственного интеллекта

Блог компании ITSOFT Серверное администрирование *Хранение данных *Хранилища данных *Искусственный интеллект

Искусственный интеллект набирает обороты и появляется спрос на серверные шкафы именно под такие серверы. Специфика размещения данных серверов состоит в том, что они почти все повышенной глубины, имеют внушительный вес, у них высокое электропотребление и им нужен дополнительный теплоотвод. Всё это требует большого пространства. Рассмотрим, что нужно учитывать при размещении серверов искусственного интеллекта и другого габаритного оборудования в серверной.

+11

2.6K

2 3 ...

49 50

Искусственный интеллект

Интерпретация моделей и диагностика сдвига данных: LIME, SHAP и Shapley Flow

Новости

NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 2)

Видеоаналитика на производстве. Как искусственный интеллект работает там, где не справляется человек

Как ИИ учится рисовать аниме

Почему я изменил своё мнение о слабой разметке для ML

ABBYY FastML: новый подход к машинному обучению на стороне клиента для обработки большого потока документов

Использование рекуррентных нейронных сетей в Reinforcement Learning

Как писать посты в стиле Артемия Лебедева? Подробный анализ телеграм-канала и кое-что еще

AASIST: Аудио защита с использованием сети с интегрированным спектро-временным графом внимания

keyT5 или генерация ключевых слов из текста

NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 1)

Как белорусы уже 30 лет делают искусственный интеллект при помощи ТРИЗ

Новогодний Робот ROS Огонёк с распаковкой робота собаки

Мой личный личинный прогноз на 2022

Тамада весёлый и конкурсы интересные, или как бот Яндекс поддержки спросил о качестве обслуживания раньше обслуживания

Научные журналы используют ИИ для поиска дублированных изображений в препринтах — проблемы и перспективы метода

Лёгкий способ написать статью на Хабр, или Привет от SmartSpeech

Проникающий взгляд: что в мешке у Деда Мороза?

История о том, как я наладил производство бумажных вебсайтов и купил сто записных книжек с Alibaba

Телекоммуникационные шкафы под серверы искусственного интеллекта

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги