Машинное обучение *

Основа искусственного интеллекта

Transformers for Dense Prediction

Обработка изображений *Машинное обучение *

Из песочницы

Трансформеры уже захватили мир машинного обучения, начав свой путь с обработки текстов, перешли в другие области как: аудио, работа с графами, работа видео . В этом посте хотел бы остановиться на теме dense prediction в компьютерном зрении (segmentation, monodepth estimation) и поделиться работами на эту тему.

236

AyratGil 23 февраля в 20:53

Простые модификации для улучшения табличных нейронных сетей

Машинное обучение *

Перевод

Simple Modifications to Improve Tabular Neural Networks

Растет интерес к архитектуре нейронных сетей для табличных данных. В последнее время появилось множество табличных моделей глубокого обучения общего назначения, вычислительная мощность которых иногда соперничает с возможностями деревьев решений с градиентным бустингом (GBDT - gradient boosted decision trees). Последние модели черпают вдохновение из различных источников, включая GBDT, машины факторизации и нейронные сети из других областей применения. Предыдущие табличные нейронные сети также используются, но, возможно, недостаточно учтены, особенно для моделей, связанных с конкретными табличными задачами. В данной статье основное внимание уделяется нескольким таким моделям и предлагаются модификации для повышения их производительности. Показано, что при модификации эти модели конкурируют с ведущими табличными моделями общего назначения, включая GBDT.

Введение

В последнее время многие архитектуры нейронных сетей были представлены в качестве табличных решений общего назначения. Некоторые примеры: Tabnet (Арик и Пфистер 2020), TabTransformer (Хуан и др. 2020), NODE (Попов, Морозов и Бабенко 2019), DNF-сеть (Абутбул и др. 2020). Внедрение этих и других моделей демонстрирует растущий интерес к применению глубокого обучения к табличным данным. Это не связано с отсутствием решений, выходящих за пределы возможностей глубокого обучения. Деревья решений с градиентным бустингом (GBDT) являются классом очень хороших моделей общего назначения и фактически часто используются табличными моделями глубокого обучения – как в качестве источника вдохновения, так и в качестве стандарта по производительности.

564

saipr 23 февраля в 15:29

Tcl/tk: интегрированная среда разработки TKproE-2.30

Python *Графические оболочки *Разработка под MacOS *Машинное обучение *Разработка под Linux *

Прошло без малого пять лет как я впервые столкнулся с интегрированной средой разработки программ на tcl/tk TKproE-2.20. И вот апреле 2021 года вышла новая версия этого продукта — TKproE-2.30 и я полностью погрузился в её мир. Он меня заворожил. Название TKproE является аббревиатурой от TCL/TK Programming Environment. TKproE — это интегрированная среда разработки программ для языка сценариев TCL/TK. Сам TKproE полностью написан на языке TCL/TK. В преамбуле к TKproE подчёркнуто, что он поддерживает быструю разработку сложных графических пользовательских интерфейсов.

Что же принципиально нового появилось в новой версии по сравнению с версией 2.20 помимо нового логотипа?

Читать дальше →

1.8K

ITSumma 23 февраля в 10:34

Научный прогресс ускорится, если ИИ начнёт анализировать данные в автономном режиме

Блог компании ITSumma Машинное обучение *Научно-популярное Искусственный интеллект Астрономия

Научно-технический прогресс — это магистраль, которая ведёт в фантастическое будущее с неизведанными возможностями. Но с какой скоростью мы помчимся по этой магистрали — зависит только от нас. Мы можем вообще развернуться и двинуть в обратном направлении, как сделала европейская цивилизация 1500 лет назад.

Что мы видим сейчас в традиционных социальных иерархиях? Борьба за статус, власть, деньги, карму — всё это побочные эффекты нашей биологической природы. К сожалению, личное эго и предубеждения присущи и самым рациональным людям: инженерам и исследователям. Иногда такое ЧСВ мешает научному прогрессу.

Читать дальше →

+19

3.5K

rikki_tikki 22 февраля в 18:32

Apache Spark

Блог компании OTUS Apache *Машинное обучение *

Рассмотрим подробно, что такое Spark ML и как с ним работать.

1.8K

AndreyKoceruba 22 февраля в 15:24

Искусство распознавания: как мы разрабатывали прототип AutoML для задачи Named Entity Recognition

Блог компании ВТБ Машинное обучение *

Процессы и продукты банка всё время совершенствуются, и в какой-то момент приходит понимание, что рутинные операции нужно автоматизировать. Так случилось и у нас: возникла необходимость в автоматизации обработки текстовой информации. Это не только банковская тенденция — во многих сферах бизнеса сейчас растёт спрос на подобные решения, поэтому мы подумали, что хабровчанам тоже могут быть интересны наши изыскания в этой сфере. Так что сегодня расскажем о том, как работает наш прототип AutoML для распознавания именованных сущностей (named entity recognition, NER). Ну и о том, какие результаты в итоге показала обученная модель.

760

tarrapid 22 февраля в 14:57

«Другие» рекомендации. Часть 1

Блог компании Инфосистемы Джет Программирование *Математика *Машинное обучение *Искусственный интеллект

Tutorial

Сейчас в различных источниках имеется огромное количество статей, материалов конференций, телеграм-каналов и открытых репозиториев в GitHub на любую тему из сферы Data Science. В статье хочется обратить ваше внимание на отдельный класс задач, которому, по нашему мнению, уделяют меньше внимания и который не так часто встречается в рамках Data Science кейсов, соревнований или хакатонов.

Речь пойдет о «Других» рекомендациях -- ML-системах, которые уже нельзя отнести к рекомендательным в популярном/классическим смысле. Давайте разберемся, что для нас классика, а что — нет.

817

NewTechAudit 22 февраля в 14:54

А ловко ты это придумал! Метод распараллеливания работы моделей на CPU и GPU

Программирование *Машинное обучение *

Если Вам приходится постоянно обучать модели, будь то Machine Learning, или задачи в области Computer Vision, искать и классифицировать какие-либо объекты, то Вы знаете, что ожидание результата и многочисленные итерации занимают безумно много времени. Хотите сократить время обучения и повысить эффективность работы?

-2

802

im01zhas 21 февраля в 21:05

Прогнозирование качества извлечения оксида железа из руды с помощью машинного обучения

Python *Машинное обучение *

Из песочницы

Ссылка на репозиторий GitHub.

Железные руды - это горные породы и минералы, из которых можно экономично извлечь металлическое железо. Кремнезем является основной примесью в железной руде. Высокое ее содержание может привести к большому объему шлака. Это, в свою очередь, приводит загрязнению окружающей среды. Прогнозируя содержание примеси в руде, мы можем помочь инженерам на заводе проводить необходимые расчеты на ранних стадиях производства.

Прогнозирование содержания кремнезема включает в себя множество химических анализов, которые отнимают много времени и требуют больших операционных затрат. Использование ML-моделей упростит наш процесс, решив все наши проблемы одним махом...

1.1K

alexwortega 21 февраля в 09:03

Учим гипермодальный трансформер предсказывать калорийность борща

Python *Машинное обучение *

Tutorial

Сегодня мы обучим мультимодальный трансформер предсказывать калорийность блюд

1.4K

0x7o 18 февраля в 16:50

gamio. Русскоязычное текстовое приключение с GPT2

Python *Программирование *Машинное обучение *Искусственный интеллект Natural Language Processing *

Моя попытка создать аналог aidungeon, novelai, holo AI для русского языка. Хоть я и пытался сделать всё с абсолютного нуля, получилось не плохо.

В данном посте я затрону технические проблемы и расскажу про самые ранние попытки создать gamio.ru

1.3K

Cloud4Y 18 февраля в 11:44

Машинное обучение помогает в расшифровке древних языков

Блог компании Cloud4Y Машинное обучение *Читальный зал Научно-популярное Изучение языков

Перевод

Термин «Гуглоперевод» постепенно престаёт быть синонимом кривого дословного перевода текстов. Порой сложно догадаться, кто выполнил работу: машина или человек – качество стало действительно высоким. Это наводит исследователей на мысль: а не сможет ли ИИ помочь в расшифровке древних языков? Рассказываем.

+17

3.1K

rsashka 18 февраля в 10:17

Новый язык программирования

Блог компании Timeweb Cloud Программирование *C++ *Компиляторы *Машинное обучение *

Более года назад я начал публикацию статей с описанием особенностей нового языка программирования. С тех пор утекло много воды, было протестировано множество идей, в итоге несколько раз все поменялось кардинальным образом и сейчас представляю на суд читателей описание предфинальной версии языка и его особенностей.

Данная статья предназначена в первую очередь для проверки основных концепций нового языка программирования, а также для получения обратной связи от читателей Хабра. Ведь согласно наблюдению «Хабр-ума палата», не замыленный взгляд со стороны очень сильно помогает в проработке новых идей.

Этот проект очень долго был без собственного названия и в публикациях назывался просто и абстрактно «новый язык». Но после нескольких статей, временное название «новый язык» постепенно превратилось в имя собственное NewLang, которое я и решил в конечном итоге оставить (что еще раз подтверждает поговорку, что нет ничего более постоянного, чем что-то временное).

Читать дальше →

+19

13K

honyaki 17 февраля в 23:39

Как и зачем измерять скорость судна при помощи ML

Блог компании SkillFactory Геоинформационные сервисы *Машинное обучение *Matlab *Искусственный интеллект

Перевод

Даже небольшие погрешности в измерениях скорости судна относительно воды могут привести к большим ошибкам в расчётах ходовых качеств судна и увеличению расхода топлива на десятки тонн в день. О том, как эту проблему решает машинное обучение, рассказываем к старту флагманского курса по Data Science.

1.5K

lenagibee 16 февраля в 18:12

Обработка временных рядов и байесовские модели для распознавания рукописного текста

Блог компании OTUS Машинное обучение *

Всем привет! Недавно я закончил курс "Machine Learning. Advanced" по продвинутым техникам машинного обучения.

Я работал над проектом по обработке временных рядов. Тема проекта: “Применение алгоритмов обработки временных рядов и байесовских моделей для задачи извлечения символов из темпоральной информации с цифровой ручки”. Я надеюсь применить методы, которые опробовал, в моей основной области — обычно я занимаюсь задачами компьютерного зрения, где использую нейронные сети для обработки изображений.

Читать дальше →

+11

1.9K

SashaOsh 16 февраля в 11:50

Как работает машинное обучение в финтехе на примере МКБ

Блог компании Московский кредитный банк Python *Big Data *Машинное обучение *

Данные — краеугольный камень любой большой компании, которая так или иначе работает с людьми. Чем больше компания, тем больше пользователей её услуг и сервисов, тем больше этих самых данных о клиентах можно собирать. Но мало просто их собрать — нужно их анализировать, нужно правильно их хранить и обрабатывать. То есть нужно активно применять возможности машинного обучения и привлекать специалистов по Data Science.

Меня зовут Александр Ошурков, и этот пост будет про машинное обучение внутри Московского кредитного банка (МКБ). Вы узнаете о том, как мы запустили новое для себя направление — практику машинного обучения.

Мой рассказ будет полезен тем, кто только задумывается над организацией такого подразделения у себя и не знает, с чего начать, или недавно ступил на этот путь.

+11

1.2K

alimbekovR 16 февраля в 11:16

Как мы меняем Anti-spoofing модель с вендорских решений на собственные

Блог компании Beeline Казахстан Информационная безопасность *Машинное обучение *Научно-популярное Искусственный интеллект

Привет! Меня зовут Ренат Алимбеков, я занимаюсь задачами, связанными с Computer Vision в Beeline Казахстан. Сейчас моя работа направлена на Anti-spoofing.

Моя основная задача сейчас — заменить вендорские решения в продуктах Beeline Казахстан на собственные. В этой статье расскажу про решение, которое будет использоваться в нашем цифровом мобильном операторе izi и необанке Simply.

В этих продуктах весь сервис предоставляется онлайн, и задача удаленной биометрии — позволить сделать все в одном приложении без визита в офис.

Еще одно применение решений — симкоматы. Мы поставили несколько симкоматов в офисах Beeline, и теперь перевыпуск сим-карты можно сделать самостоятельно, а мы можем быть уверены, что это не мошеннические действия.

Го отражать атаки

+10

1.2K

kucev 16 февраля в 11:00

ML и консенсус между людьми: берём от обоих подходов лучшее

Data Mining *Big Data *Машинное обучение *Искусственный интеллект

Перевод

Введение в категоризацию классификаций

У вас были когда-нибудь проблемы с поиском товара в продуктовом магазине? Например, вы могли искать замороженный картофель фри в отделе замороженных завтраков, но на самом деле он находился в отделе замороженных овощей. Или вы искали соевый соус в отделе азиатской еды, а он находился в отделе приправ.

Одна из самых больших трудностей для розничных магазинов и торговых площадок — создание каталога путём категоризации миллионов продуктов в сложную систему из тысяч категорий, также называемых классификациями (taxonomies). В реальных магазинах подробная категоризация нужна для логичного упорядочивания стеллажей. В эпоху электронной коммерции и цифровых торговых площадок правильная категоризация обеспечивает множество преимуществ, в том числе улучшенные поисковые рекомендации, более подходящие предложения товаров на замену, а также более строгое соблюдение региональных и федеральных требований.

Категоризация классификаций сложна не только из-за существования в мире бесчисленного количества продуктов, образующих глубоко вложенные иерархические категории, но и из-за постоянно меняющейся природы классификаций. Невозможно найти одного специалиста в предметной области, понимающего весь каталог достаточно хорошо для того, чтобы категоризировать каждый отдельный товар, а процесс обучения команды специалистов недостаточно быстр и масштабируем по современным стандартам. Более того, входные данные никогда не идеальны, и из-за отсутствия информации иногда невозможно понять, относится ли продукт к конкретной классификации.

Читать дальше →

440

efimkolodkin 16 февраля в 07:09

Как мы подняли сквозную конверсию с 20 до 33% с помощью алгоритмов AI?

Алгоритмы *Машинное обучение *Искусственный интеллект

Из песочницы

История Bash Today - сервиса бронирования площадок для мероприятий в Москве и Санкт-Петербурге , основанного в 2015 г.

Серьёзная проблема для сервиса бронирований — прямые платежи от клиентов площадкам по заявкам, пришедшим через маркетплейс. Из-за этого компания лишается своей комиссии. Стандартные инструменты выявления подобных схем, такие как опрос пользователей, сбор обратной связи после мероприятий и так далее, имеют ограниченную эффективность, так как осуществляются случайным образом. Поэтому нашей R&D-команде была поставлена задача повысить эффективность проверок с помощью алгоритмов AI.

1.2K

AyratGil 15 февраля в 10:53

К реальной реставрации смазанного сканированием лица

Python *Машинное обучение *

Перевод

Аннотация

Восстановление смазанного (тусклого) лица обычно опирается на лицевые приоры – предшествующие ориентиры геометрии лица или ссылки, для восстановления достоверных его деталей. Однако входные данные низкого качества не могут обеспечить точную геометрическую точность, а ссылки высокого качества часто недоступны, что ограничивает применимость в реальных сценариях. В этой работе мы предлагаем метод GFP-GAN, который использует богатые и разнообразные приоры, предоставляемые предварительно подготовленными GAN приорами для восстановления тусклого лица. Этот генерирующий предшествующие приоры лица (GFP) уровень включается в процесс восстановления лица с помощью послойного преобразования пространственных объектов, позволяя нашему методу достичь хорошего баланса реалистичности и точности. Благодаря мощному генерированию изображения лица (лицевого дизайна) и тонких его деталей, наш метод GFP-GAN может совместно восстанавливать детали лица и улучшать цвета всего за один прямой проход, в то время как методы инверсии GAN требуют специальной оптимизации изображения при выводе. Обширные эксперименты показывают, что наш метод обеспечивает превосходную производительность по сравнению с предыдущим уровнем развития техники, как для синтетических, так и для реальных наборов данных.