Как стать автором
Обновить
290.85
Рейтинг

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

Open source *Python *Машинное обучение *Искусственный интеллект Natural Language Processing *
Из песочницы

В последние годы соревнования GLUE и SuperGLUE на английском языке стали стандартным бенчмарком для определения возможностей универсальных языковых моделей, таких как BERT, RoBERTa в решении широкого круга задач обработки естественного языка, в том числе задач с недостаточным объемом обучающей выборки. Соревнования GLUE/SuperGLUE представляют из себя наборы задач NLP на основе ранее представленных датасетов. Академическое сообщество NLP довольно быстро расправилось с GLUE, отчасти вследствие того, что задачи были довольно однотипные, они сводились либо к парной текстовой классификации, либо к классификации единственной последовательности. Ответом на это был новый набор задач SuperGLUE, в состав которого вошли вопросно-ответные задачи, задачи кореференции и задачи семантического следования. На данный момент модели, обученные на базе ERNIE и DeBERT, превзошли качество разметки человеком.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 1.2K
Комментарии 4

Новости

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

Python *Обработка изображений *Машинное обучение *Графический дизайн *Искусственный интеллект

Привет! InvokeAI 2.2 теперь доступен для всех. В этом обновлении добавлены UI Outpainting, Embedding Management и другие функции. Ознакомьтесь с выделенными обновлениями ниже, а также с полным описанием всех функций, включенных в релиз.

Что нового?
Всего голосов 22: ↑22 и ↓0 +22
Просмотры 2.8K
Комментарии 14

Tensorflow: Используем трансферное обучение для классификации пневмонии и оптимизируем нашу модель

Блог компании OTUS Машинное обучение *
Recovery mode

Привет, Хабр! На связи Рустем, IBM Senior DevOps Engineer & Integration Architect.

Сегодня мы будем работать с открытым набором данных по рентгенографии грудной клетки которые, использовали для этого исследования, с предварительно обученной моделью MobileNet_v2 для классификации изображений TensorFlow и переносом обучения для создания классификатора пневмонии, который работает с рентгенограммами грудной клетки.

Целью этой статьи является не столько получение навыков классификации изображений, а сколько понимание того, насколько легко вы можете создать соответствующую модель.

Я надеюсь, вам понравится это!

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Просмотры 799
Комментарии 2

Нейронная сеть для распознавания образов с TensorFlow: как с ней работать

Блог компании Сбер Python *Big Data *Машинное обучение *Искусственный интеллект

Привет, Хабр! В сегодняшней статье хотим поделиться опытом, как можно начать использовать TensorFlow в целях распознавания образов. Напомним, что TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигающая качества человеческого восприятия.

Цель статьи — привлечь этот инструмент для распознавания боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для того чтобы этого достичь, нужно выполнить несколько важных этапов, о чём и поговорим под катом.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 1.4K
Комментарии 7

Нейронные сети, DeepFake и колени: как обмануть рентгенолога

Блог компании ua-hosting.company Машинное обучение *Искусственный интеллект Здоровье


В процессе приобретения какого-либо навыка существует два фундаментальных аспекта — теория и практика. Они тесно связаны, а отсутствие одного из них может привести к печальным последствиям. Особенно ярко это проявляется в медицине. Можно прочитать сотни книг, описывающих строение тела человека, но во время реальной операции растеряться и совершить ошибку. Либо можно учиться на практике, не уделяя внимание теории, и тем самым навредить массе подопытных пациентов. Обучение является важным процессом не только для человека, но и для машины, особенно глубокое обучение. Но этот процесс требует большого количества вводных данных, которые система смогла бы проанализировать и использовать как базу знаний. И тут возникает проблема — для глубокого обучения системы в рамках медицины необходимы данные реальных пациентов, которые являются конфиденциальной информацией во многих странах. Получается, что такой системе не на чем учиться. И тут ученые из университета Йювяскюля (Финляндия) предложили использовать технологию deepfake, с помощью которой они создали огромную базу МРТ снимков колена человека. Полученные снимки не только помогают глубокому обучению, но и оказались достаточно убедительными, что обманули ряд профессиональных медиков. Как создавался deepfake костей и насколько он все же реалистичен? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →
Всего голосов 13: ↑12 и ↓1 +11
Просмотры 2.5K
Комментарии 4

Выбросьте блокноты, или почему заниматься Data Science нужно так, будто вы разработчик

Блог компании VK Big Data *Машинное обучение *


Большинство дата-сайентистов использовали или до сих пор используют notebooks. В чем-то это здорово, но кажется, что дата-сайентисты должны действовать как разработчики. И поэтому с notebooks надо переходить на скрипты, разрабатываемые в IDE.
Читать дальше →
Всего голосов 11: ↑9 и ↓2 +7
Просмотры 6.8K
Комментарии 19

Сравнение производительности моделей обнаружения объектов YOLO v5, v6 и v7

Python *Data Mining *Машинное обучение *Искусственный интеллект
Перевод

Если вы выполняете проект по обнаружению объектов, высока вероятность того, что вы выберете одну из многих моделей YOLO. Учитывая количество моделей обнаружения объектов YOLO, сделать выбор в пользу лучшей из них непросто.

Читать далее
Всего голосов 4: ↑3 и ↓1 +2
Просмотры 963
Комментарии 1

Выявление незаконных построек по спутниковым снимкам с помощью CV

Python *Обработка изображений *Хакатоны Машинное обучение *

Привет, Хабр! Я Вова, Lead Data Scientist. Заметил, что вам очень нравится вместе с нами разбирать решения задач с хакатонов. Сегодня расскажу, как я занял 4 место в соревновании по выявлению незаконных построек по спутниковым снимкам и что мне не хватило, чтобы попасть в топ-3 на Цифровом прорыве

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 2.7K
Комментарии 18

Пушкин – это нейросеть? Учимся распознавать сгенерированный текст

Блог компании Amvera Семантика *Математика *Машинное обучение *Искусственный интеллект

С появлением в 2020 году нейронной сети GPT3 и других архитектур – трансформеров, генерируемые тексты стали невероятно правдоподобными. Такими правдоподобными, что отдельно взятый текст, не несущий большой смысловой нагрузки, стало сложно отличить от написанного человеком. В статье мы разберем подход к определению сгенерированных текстов. И заодно выясним, является ли, по мнению алгоритма, Пушкин (и другие деятели искусства) искусственной нейронной сетью.

Суть подхода

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 1.2K
Комментарии 2

Дорогие художники: вам не стоит бояться ИИ-генераторов изображений

Блог компании ISPsystem Обработка изображений *Машинное обучение *Искусственный интеллект
Перевод

В 1992 году поэтесса Энн Карсон опубликовала небольшую книжку под названием «Короткие беседы». Это серия микроэссе, каждое длиной от предложения до абзаца, на, казалось бы, несвязанные темы: орхидеи, дождь, мифическая андская викунья. Например, в ней есть «Краткое измышление об ощущениях при взлёте самолёта». И, вы удивитесь, повествует оно ровно о том, что написано в заголовке. А «Короткая беседа о форели» рассказывает нам главным образом о разновидностях форели, которые встречаются в японских хайку. В предисловии к книге Карсон пишет с присущей всем канадцам суховатой непосредственностью: «Я пойду на все, чтобы не поддаваться скуке. Это цель всей моей жизни».

С тех пор минуло уже 30 лет. Я тоже сознательно борюсь со скукой и праздностью. Вот, например, один из моих способов скрасить досуг: мне нравится засиживаться допоздна и возиться с генерацией изображений при помощи искусственного интеллекта. Таким инструментам, как DALL-E 2, Midjourney и Stable Diffusion, можно дать короткую текстовую инструкцию, а они в свою очередь изучат ее и произведут на свет безвкусную картину маслом в стиле Тициана, изображающую собак в милых шляпках.

Позволю себе еще одну небольшую ремарку: книга Карсон вышла в то время, когда Интернет только-только начал набирать обороты.

Читать далее
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 3K
Комментарии 20

Пора закончить холодную войну между DevOps и разработчиками ПО

Блог компании RUVDS.com Программирование *Машинное обучение *DevOps *
Перевод

Если бы нам довелось прочитать разговор в Slack между разработчиком ПО и инженерами DevOps, то он мог бы выглядеть примерно так:

Разработчик ПО: Это займёт кучу времени. «Мне нужно новое окружение для моего приложения».

Два часа спустя…

DevOps: Почему разработчики ПО думают, что я умею читать мысли!? «Ладно, а какие типы инстансов вам нужны?»

Час спустя (после обсуждения с командой…)

Разработчик ПО: «Мне нужен g3.8xlarge для тестирования новой функции визуализации».

На следующий день…

DevOps: «Хорошо, а в какой AZ он должен находиться? И ещё с какой группой безопасности он должен быть связан?»

Разработчик ПО: Они что, не знают всего этого сразу? «Любая AZ в us-west-1, группа sg-3164z279».
Читать дальше →
Всего голосов 35: ↑30 и ↓5 +25
Просмотры 3.9K
Комментарии 23

Каким должен быть Feature Store, чтобы оптимизировать работу с ML-моделями

Блог компании Selectel Высокая производительность *Машинное обучение *Искусственный интеллект

В работе с данными для обучения нейросетей много рутины: под каждую ML-модель нужно создать датасет, потом «вычеркнуть» лишние признаки (фичи) и протестировать точность предсказаний. Иногда при изменении датасета нужно собирать данные по новой. Это неудобно, если нужно переиспользовать уже собранные фичи для обучения новых моделей. Чтобы оптимизировать работу с данными, ML-инженеры объединили разные практики и сформировали парадигму Feature Store.

По мотивам выступления Артёма Глазкова (@Allront), ведущего эксперта MLOps в Polymatica, рассказываем о том, что нужно бизнесу от Feature Store сегодня, и разбираем архитектуру «эталонного» решения. Подробности под катом.
Читать дальше →
Всего голосов 36: ↑36 и ↓0 +36
Просмотры 1.4K
Комментарии 1

Игры искусственного разума: атаки на модели машинного обучения и их последствия

Блог компании Криптонит Машинное обучение *Исследования и прогнозы в IT *Искусственный интеллект

Насколько легко обмануть искусственный интеллект? Можно ли подстроить аварию с участием автопилота, или скрыться от «умных» камер, оставаясь у всех на виду? Специалисты компании «Криптонит» провели масштабное исследование, в котором сравнили 10 вариантов атак на модели машинного обучения (ML, от англ. Machine Learning). Их выводы помогут реалистичнее взглянуть на уязвимости систем компьютерного зрения, определить границы применимости различных атак на модели ML, оценить их вычислительную сложность и наиболее эффективные подходы к реализации.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 1.2K
Комментарии 0

Fast-dreambooth. Имба для тонкой настройки StableDiffusion

Машинное обучение *
Tutorial

DreamBooth очень простой способ дообучить StableDiffusion на вашем наборе изображений. В этой статье я расскажу как за 3 часа добавить в нейроную сеть ваши объекты стили или персонажей

Читать далее
Всего голосов 10: ↑10 и ↓0 +10
Просмотры 2.3K
Комментарии 3

Истории

Нейрофэнтези: сочиняем с ruGPT-3. Русский вариант AI Dungeon уже доступен пользователям ассистентов Салют

Блог компании SberDevices Машинное обучение *Искусственный интеллект
Из песочницы

Мы в SberDevices выпустили первый продукт в серии Нейроквестов — Нейрофэнтези. Квестами мы решили заняться по разным причинам. Например, в квестах можно испытать всю генеративную мощь семейства GPT-моделей. Квест также одновременно и литературный, и игровой формат взаимодействия с пользователем. В процессе игры фактически создается новая история. Среди решений на английском языке популярным стал проект AI Dungeon, мы захотели сделать нечто похожее на русском, попытавшись при этом превзойти оригинал, а также улучшить некоторые аспекты взаимодействия с пользователем. В этом посте расскажу, как мы разбирались с ходом сюжетных поворотов и с саджестами, и даже пришли к разработке инструмента для преобразования художественных текстов в обучающие данные в формате квеста.

Читать далее
Всего голосов 26: ↑25 и ↓1 +24
Просмотры 2.4K
Комментарии 4

Как наши преподаватели снимают с себя рутину, или история одного бота

Блог компании ИТМО Python *Программирование *Машинное обучение *Учебный процесс в IT

Работа преподавателя, кроме чтения лекций, включает довольно много рутины, в частности, проверку выполненных домашних заданий. И если вопросы в домашке не сводятся к простым однозначным ответам, а подразумевают выбор правильного подхода, реализацию алгоритма и написание кода, на это уходит значительное время.

Один из наших преподавателей магистерской программы "Разработка программного обеспечения" сделал инструмент для автоматизации этого процесса, чем-то напоминающий классическое юнит-тестирование. В  качестве интерфейса в этом инструменте используется бот в Telegram, а проверка выполняется Python скриптами с учетом особенностей задачи, что сильно отличает его от большинства аналогов в open source. Под катом расскажем, что в этом инструменте особенного и как студент может получить бан.

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Просмотры 2.7K
Комментарии 3

Ternaus: Chrome Extension

Обработка изображений *Расширения для браузеров Машинное обучение *Искусственный интеллект

Я добавил Chrome extension, которое позволяет по тексту и по картинкам в интернете искать похожие в базе данных на Ternaus.com.

* ссылка на Extension

* ссылка на GitHub

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 919
Комментарии 1

Мне нужна твоя поддержка: как запустить чат-бот на восьми языках быстро, без разметки и смс

Блог компании Garage Eight Анализ и проектирование систем *Data Mining *Машинное обучение *Natural Language Processing *

У нас было несколько сотен тысяч чатов в месяц, восемь языков разных групп, миллионы строк неразмеченных данных, тысячи тематик чатов из разных областей нашей экосистемы и команда из 7 человек. Не то, чтобы всё это было категорически необходимо, но если уж начал автоматизацию чатов, то к делу надо подходить серьёзно. Единственное, что нас беспокоило — это процент автоматизации. В мире нет ничего более непонятного, сложного и запутанного, чем естественный язык и поведение клиентов. И я знал, что довольно скоро мы в это окунёмся.

Читать далее
Всего голосов 7: ↑6 и ↓1 +5
Просмотры 912
Комментарии 4

FCOS- объяснение обнаружения объектов без привязки

Python *Data Mining *Машинное обучение *Искусственный интеллект
Перевод
Tutorial

FCOS: полностью сверточное одноступенчатое обнаружение объектов - это детектор объектов без привязки. Он решает проблемы обнаружения объектов с помощью метода прогнозирования по пикселям, аналогичного сегментации. Большинство последних детекторов объектов без привязки или без привязки на основе глубокого обучения используют FCOS в качестве основы.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 996
Комментарии 0

Как лучше обучать RNN для прогнозирования временных рядов?

Python *Машинное обучение *Искусственный интеллект Финансы в IT
Из песочницы

Привет, Хабр!

Два последних года я в рамках магистерской диссертации разбирался с тем, как лучше использовать рекуррентные нейронные сети для прогнозирования временных рядов, и теперь хочу поделиться моим опытом с сообществом.

Читать далее
Всего голосов 18: ↑18 и ↓0 +18
Просмотры 4.5K
Комментарии 30

Вклад авторов

Работа

Data Scientist
113 вакансий