Трансформеры уже захватили мир машинного обучения, начав свой путь с обработки текстов, перешли в другие области как: аудио, работа с графами, работа видео . В этом посте хотел бы остановиться на теме dense prediction в компьютерном зрении (segmentation, monodepth estimation) и поделиться работами на эту тему.
![](http://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/hub/882/37a/b33/88237ab33b6f8acc090d443651c4f2f9.png)
Машинное обучение *
Основа искусственного интеллекта
Новости
Простые модификации для улучшения табличных нейронных сетей
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/1b9/7c3/d95/1b97c3d951be777ff236a63790dbe75f.png)
Simple Modifications to Improve Tabular Neural Networks
Растет интерес к архитектуре нейронных сетей для табличных данных. В последнее время появилось множество табличных моделей глубокого обучения общего назначения, вычислительная мощность которых иногда соперничает с возможностями деревьев решений с градиентным бустингом (GBDT - gradient boosted decision trees). Последние модели черпают вдохновение из различных источников, включая GBDT, машины факторизации и нейронные сети из других областей применения. Предыдущие табличные нейронные сети также используются, но, возможно, недостаточно учтены, особенно для моделей, связанных с конкретными табличными задачами. В данной статье основное внимание уделяется нескольким таким моделям и предлагаются модификации для повышения их производительности. Показано, что при модификации эти модели конкурируют с ведущими табличными моделями общего назначения, включая GBDT.
Введение
В последнее время многие архитектуры нейронных сетей были представлены в качестве табличных решений общего назначения. Некоторые примеры: Tabnet (Арик и Пфистер 2020), TabTransformer (Хуан и др. 2020), NODE (Попов, Морозов и Бабенко 2019), DNF-сеть (Абутбул и др. 2020). Внедрение этих и других моделей демонстрирует растущий интерес к применению глубокого обучения к табличным данным. Это не связано с отсутствием решений, выходящих за пределы возможностей глубокого обучения. Деревья решений с градиентным бустингом (GBDT) являются классом очень хороших моделей общего назначения и фактически часто используются табличными моделями глубокого обучения – как в качестве источника вдохновения, так и в качестве стандарта по производительности.
Tcl/tk: интегрированная среда разработки TKproE-2.30
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/webt/4h/if/sc/4hifscnfyn2nm1_y4qw2pjft8xo.png)
Что же принципиально нового появилось в новой версии по сравнению с версией 2.20 помимо нового логотипа?
Научный прогресс ускорится, если ИИ начнёт анализировать данные в автономном режиме
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/webt/pa/ft/lh/paftlhlvdpkuyudut4kxmpooix8.jpeg)
Научно-технический прогресс — это магистраль, которая ведёт в фантастическое будущее с неизведанными возможностями. Но с какой скоростью мы помчимся по этой магистрали — зависит только от нас. Мы можем вообще развернуться и двинуть в обратном направлении, как сделала европейская цивилизация 1500 лет назад.
Что мы видим сейчас в традиционных социальных иерархиях? Борьба за статус, власть, деньги, карму — всё это побочные эффекты нашей биологической природы. К сожалению, личное эго и предубеждения присущи и самым рациональным людям: инженерам и исследователям. Иногда такое ЧСВ мешает научному прогрессу.
Искусство распознавания: как мы разрабатывали прототип AutoML для задачи Named Entity Recognition
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/b39/83d/927/b3983d92718f8fb4686aa679866513ef.jpeg)
Процессы и продукты банка всё время совершенствуются, и в какой-то момент приходит понимание, что рутинные операции нужно автоматизировать. Так случилось и у нас: возникла необходимость в автоматизации обработки текстовой информации. Это не только банковская тенденция — во многих сферах бизнеса сейчас растёт спрос на подобные решения, поэтому мы подумали, что хабровчанам тоже могут быть интересны наши изыскания в этой сфере. Так что сегодня расскажем о том, как работает наш прототип AutoML для распознавания именованных сущностей (named entity recognition, NER). Ну и о том, какие результаты в итоге показала обученная модель.
«Другие» рекомендации. Часть 1
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/61b/5f4/2f9/61b5f42f9fdfadaab29591ba71579fc9.png)
Сейчас в различных источниках имеется огромное количество статей, материалов конференций, телеграм-каналов и открытых репозиториев в GitHub на любую тему из сферы Data Science. В статье хочется обратить ваше внимание на отдельный класс задач, которому, по нашему мнению, уделяют меньше внимания и который не так часто встречается в рамках Data Science кейсов, соревнований или хакатонов.
Речь пойдет о «Других» рекомендациях -- ML-системах, которые уже нельзя отнести к рекомендательным в популярном/классическим смысле. Давайте разберемся, что для нас классика, а что — нет.
А ловко ты это придумал! Метод распараллеливания работы моделей на CPU и GPU
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/b01/06d/705/b0106d70548b914f68cb0f581ee3d92d.png)
Если Вам приходится постоянно обучать модели, будь то Machine Learning, или задачи в области Computer Vision, искать и классифицировать какие-либо объекты, то Вы знаете, что ожидание результата и многочисленные итерации занимают безумно много времени. Хотите сократить время обучения и повысить эффективность работы?
Прогнозирование качества извлечения оксида железа из руды с помощью машинного обучения
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/92f/6de/da1/92f6deda13cae3326280ea518368c302.png)
Ссылка на репозиторий GitHub.
Железные руды - это горные породы и минералы, из которых можно экономично извлечь металлическое железо. Кремнезем является основной примесью в железной руде. Высокое ее содержание может привести к большому объему шлака. Это, в свою очередь, приводит загрязнению окружающей среды. Прогнозируя содержание примеси в руде, мы можем помочь инженерам на заводе проводить необходимые расчеты на ранних стадиях производства.
Прогнозирование содержания кремнезема включает в себя множество химических анализов, которые отнимают много времени и требуют больших операционных затрат. Использование ML-моделей упростит наш процесс, решив все наши проблемы одним махом...
gamio. Русскоязычное текстовое приключение с GPT2
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/635/101/e5d/635101e5d1ba65ff20c695d4bda268ec.jpg)
Моя попытка создать аналог aidungeon, novelai, holo AI для русского языка. Хоть я и пытался сделать всё с абсолютного нуля, получилось не плохо.
В данном посте я затрону технические проблемы и расскажу про самые ранние попытки создать gamio.ru
Машинное обучение помогает в расшифровке древних языков
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/4fb/030/d71/4fb030d710e2ee47618e49fa74065c75.jpg)
Термин «Гуглоперевод» постепенно престаёт быть синонимом кривого дословного перевода текстов. Порой сложно догадаться, кто выполнил работу: машина или человек – качество стало действительно высоким. Это наводит исследователей на мысль: а не сможет ли ИИ помочь в расшифровке древних языков? Рассказываем.
Новый язык программирования
![image](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/r/w1560/webt/pl/j2/ho/plj2ho0lszvbxr2p1rtgz3ojocc.jpeg)
Более года назад я начал публикацию статей с описанием особенностей нового языка программирования. С тех пор утекло много воды, было протестировано множество идей, в итоге несколько раз все поменялось кардинальным образом и сейчас представляю на суд читателей описание предфинальной версии языка и его особенностей.
Данная статья предназначена в первую очередь для проверки основных концепций нового языка программирования, а также для получения обратной связи от читателей Хабра. Ведь согласно наблюдению «Хабр-ума палата», не замыленный взгляд со стороны очень сильно помогает в проработке новых идей.
Этот проект очень долго был без собственного названия и в публикациях назывался просто и абстрактно «новый язык». Но после нескольких статей, временное название «новый язык» постепенно превратилось в имя собственное NewLang, которое я и решил в конечном итоге оставить (что еще раз подтверждает поговорку, что нет ничего более постоянного, чем что-то временное).
Как и зачем измерять скорость судна при помощи ML
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/2c6/e71/ff6/2c6e71ff6ced73390ae42b04cab91dce.jpeg)
Даже небольшие погрешности в измерениях скорости судна относительно воды могут привести к большим ошибкам в расчётах ходовых качеств судна и увеличению расхода топлива на десятки тонн в день. О том, как эту проблему решает машинное обучение, рассказываем к старту флагманского курса по Data Science.
Обработка временных рядов и байесовские модели для распознавания рукописного текста
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/webt/qd/ix/8s/qdix8sg2jsoab6wn1d-qgoexbem.png)
Всем привет! Недавно я закончил курс "Machine Learning. Advanced" по продвинутым техникам машинного обучения.
Я работал над проектом по обработке временных рядов. Тема проекта: “Применение алгоритмов обработки временных рядов и байесовских моделей для задачи извлечения символов из темпоральной информации с цифровой ручки”. Я надеюсь применить методы, которые опробовал, в моей основной области — обычно я занимаюсь задачами компьютерного зрения, где использую нейронные сети для обработки изображений.
Как работает машинное обучение в финтехе на примере МКБ
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/791/1b5/d27/7911b5d2703d4c808be8cbd6f785b893.jpg)
Данные — краеугольный камень любой большой компании, которая так или иначе работает с людьми. Чем больше компания, тем больше пользователей её услуг и сервисов, тем больше этих самых данных о клиентах можно собирать. Но мало просто их собрать — нужно их анализировать, нужно правильно их хранить и обрабатывать. То есть нужно активно применять возможности машинного обучения и привлекать специалистов по Data Science.
Меня зовут Александр Ошурков, и этот пост будет про машинное обучение внутри Московского кредитного банка (МКБ). Вы узнаете о том, как мы запустили новое для себя направление — практику машинного обучения.
Мой рассказ будет полезен тем, кто только задумывается над организацией такого подразделения у себя и не знает, с чего начать, или недавно ступил на этот путь.
Как мы меняем Anti-spoofing модель с вендорских решений на собственные
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/f1a/a20/b5f/f1aa20b5ff518f3d4524d6cd8b72ca7c.png)
Привет! Меня зовут Ренат Алимбеков, я занимаюсь задачами, связанными с Computer Vision в Beeline Казахстан. Сейчас моя работа направлена на Anti-spoofing.
Моя основная задача сейчас — заменить вендорские решения в продуктах Beeline Казахстан на собственные. В этой статье расскажу про решение, которое будет использоваться в нашем цифровом мобильном операторе izi и необанке Simply.
В этих продуктах весь сервис предоставляется онлайн, и задача удаленной биометрии — позволить сделать все в одном приложении без визита в офис.
Еще одно применение решений — симкоматы. Мы поставили несколько симкоматов в офисах Beeline, и теперь перевыпуск сим-карты можно сделать самостоятельно, а мы можем быть уверены, что это не мошеннические действия.
ML и консенсус между людьми: берём от обоих подходов лучшее
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/webt/jm/ho/5i/jmho5i38r3mqw67kaghzihuim0o.png)
Введение в категоризацию классификаций
У вас были когда-нибудь проблемы с поиском товара в продуктовом магазине? Например, вы могли искать замороженный картофель фри в отделе замороженных завтраков, но на самом деле он находился в отделе замороженных овощей. Или вы искали соевый соус в отделе азиатской еды, а он находился в отделе приправ.
Одна из самых больших трудностей для розничных магазинов и торговых площадок — создание каталога путём категоризации миллионов продуктов в сложную систему из тысяч категорий, также называемых классификациями (taxonomies). В реальных магазинах подробная категоризация нужна для логичного упорядочивания стеллажей. В эпоху электронной коммерции и цифровых торговых площадок правильная категоризация обеспечивает множество преимуществ, в том числе улучшенные поисковые рекомендации, более подходящие предложения товаров на замену, а также более строгое соблюдение региональных и федеральных требований.
Категоризация классификаций сложна не только из-за существования в мире бесчисленного количества продуктов, образующих глубоко вложенные иерархические категории, но и из-за постоянно меняющейся природы классификаций. Невозможно найти одного специалиста в предметной области, понимающего весь каталог достаточно хорошо для того, чтобы категоризировать каждый отдельный товар, а процесс обучения команды специалистов недостаточно быстр и масштабируем по современным стандартам. Более того, входные данные никогда не идеальны, и из-за отсутствия информации иногда невозможно понять, относится ли продукт к конкретной классификации.
Как мы подняли сквозную конверсию с 20 до 33% с помощью алгоритмов AI?
![](https://webcf.waybackmachine.org/web/20220224211120im_/https://habrastorage.org/getpro/habr/upload_files/3cf/e33/cb4/3cfe33cb494a72f4bde916ee94ffb45b.png)
История Bash Today - сервиса бронирования площадок для мероприятий в Москве и Санкт-Петербурге , основанного в 2015 г.
Серьёзная проблема для сервиса бронирований — прямые платежи от клиентов площадкам по заявкам, пришедшим через маркетплейс. Из-за этого компания лишается своей комиссии. Стандартные инструменты выявления подобных схем, такие как опрос пользователей, сбор обратной связи после мероприятий и так далее, имеют ограниченную эффективность, так как осуществляются случайным образом. Поэтому нашей R&D-команде была поставлена задача повысить эффективность проверок с помощью алгоритмов AI.
К реальной реставрации смазанного сканированием лица
Аннотация
Восстановление смазанного (тусклого) лица обычно опирается на лицевые приоры – предшествующие ориентиры геометрии лица или ссылки, для восстановления достоверных его деталей. Однако входные данные низкого качества не могут обеспечить точную геометрическую точность, а ссылки высокого качества часто недоступны, что ограничивает применимость в реальных сценариях. В этой работе мы предлагаем метод GFP-GAN, который использует богатые и разнообразные приоры, предоставляемые предварительно подготовленными GAN приорами для восстановления тусклого лица. Этот генерирующий предшествующие приоры лица (GFP) уровень включается в процесс восстановления лица с помощью послойного преобразования пространственных объектов, позволяя нашему методу достичь хорошего баланса реалистичности и точности. Благодаря мощному генерированию изображения лица (лицевого дизайна) и тонких его деталей, наш метод GFP-GAN может совместно восстанавливать детали лица и улучшать цвета всего за один прямой проход, в то время как методы инверсии GAN требуют специальной оптимизации изображения при выводе. Обширные эксперименты показывают, что наш метод обеспечивает превосходную производительность по сравнению с предыдущим уровнем развития техники, как для синтетических, так и для реальных наборов данных.
Вклад авторов
-
ZlodeiBaal 1507.0 -
Leono 1346.8 -
BarakAdama 1224.0 -
snakers4 945.0 -
3Dvideo 747.0 -
m1rko 694.0 -
alizar 674.2 -
mephistopheies 629.0 -
sim0nsays 568.0 -
yorko 544.0