Обработка изображений *

Работаем с фото и видео

SAUNet: Shape Attentive U-Net for Interpretable Medical Image Segmentation

Обработка изображений *Машинное обучение *

Все чаще для сегментации изображений используется глубокое обучение и сверточные нейронные сети. В случае медицинских картинок достаточно сильно проявляются основные проблемы этого метода: не хватает робастности и интерпретируемости. Происходит это в основном из-за того, что CNN обучаются на текстуре изображения, а не на форме, или требуются дополнительные вычисления post hoc, которые, как было показано, ненадежны с точки зрения интерпретируемости.

В статье SAUNet: Shape Attentive U-Net for Interpretable Medical Image Segmentation авторы предлагают добавить к модели U-Net второй поток данных о форме, а также использовать dual-attention декодер. Такой метод позволил получить очень хорошие результаты на датасетах изображений МРТ сердца SUN09 и AC17, обеспечивая высокую интерпретируемость при различных разрешениях.

Работа опирается на последние достижения в области моделей channel-attention с использованием модулей сжатия и возбуждения, предложенных Hu и др., и spatial attention c оценкой внимания, предложенных Jetley и др..

468

MagisterLudi 17 мая в 15:16

Инструменты OSINT для геолокации: моря, горы, улицы

Блог компании Timeweb Cloud Информационная безопасность *Обработка изображений *Геоинформационные сервисы *Машинное обучение *

Помимо доступа к спутниковому OSINT в один клик, появляется всё больше и больше инструментов для выяснения точного местоположения, откуда был сделан фото- или видео-снимок. Любая деталь — дорожный знак, вывеска, линии электропередач, рельеф гор на заднем плане и даже длина тени от столба может быть подсказкой для исследователей. Предлагаем вашему вниманию подборку инструментов по геолокации от ведущих OSINT-исследователей.

Geolocation Estimaton

Платформа, которая оценивает местоположение изображения с помощью глубокого обучения/ИИ.

Тут можно смотреть на чужие фотки и вручную вбивать их местоположение, учить систему, а можно загружать свою фотку и просить систему «угадать» местоположение.

На тепловой карте указываются области, которые максимально повлияли на принятие решения.

Загрузил свою фотку из исторического района Стамбула — система не смогла определить.

Читать дальше →

+24

4.1K

FirstJohn 17 мая в 11:00

Развитие отечественных технологий фоторобота. От создания до наших дней

Блог компании FirstVDS Обработка изображений *Читальный зал

В наше время технологии в криминалистике развиваются интенсивными темпами: уже не в новинку анализ ДНК, распознавание лиц, микробиологическая идентификация человека и еще множество революционных методов установления личности подозреваемого. Однако не менее интересна и история становления их предшественника, метода, который, наравне с внедрением дактилоскопии, стал одним из главных помощников криминалистов в XX веке. Речь идёт о фотороботе, или субъективном портрете.

+10

2.2K

Unidata 13 мая в 21:06

Применение подхода eXtreme Multi-Label Classification для классификации записей материально-технических ресурсов

Блог компании Юнидата Обработка изображений *Хранение данных *Машинное обучение *Хранилища данных *

Данная работа является пересказом статьи Jingzhou Liu, Wei-Cheng Chang, Yuexin Wu, and Yiming Yang. 2017. Deep Learning for Extreme Multi-label Text Classification. In Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '17). Association for Computing Machinery, New York, NY, USA, 115–124. https://doi.org/10.1145/3077136.3080834

Одно из направлений работ в нашей лаборатории Unidata Labs – классификация записей материально-технических ресурсов (МТР) с применением машинного обучения. В этой статье мы бы хотели кратко разобрать нашу постановку задачи как таковую, и после чего предложить разбор одного из методов, которым эта задача могла бы решаться.

Вкратце, продукт Юнидата МТР работает с данными, относящимися к материально-техническим ресурсам клиентов, которые представлены в Юнидата как реестр — т.е., коллекция записей. Записи МТР, как правило, содержат очень большое количество полей, но нас интересует только одно — полное наименование. Оно может выглядеть примерно так...

1.3K

PatientZero 11 мая в 18:24

Сколько цветов может выдержать Windows Terminal?

Клиентская оптимизация *Обработка изображений *Разработка под Windows *

Перевод

Группа пользователей хотела реализовать простую видеоигру в терминале, но оказалось, что её производительность в Windows Terminal совершенно не подходит для такой задачи. Проблему с производительностью можно воспроизвести, многократно отрисовывая «радугу» и замеряя количество кадров в секунду (FPS). Показанная на рисунке радуга, состоящая из 20 цветов, на моём Surface Book с Intel i7-6700HQ отрисовывается с частотой 30 FPS. Однако если отрисовывать ту же радугу из 21 или более цветов, то частота упадёт ниже 10 FPS. Такое падение стабильно и ситуация не ухудшается даже при тысячах разных цветов.

Читать дальше →

+34

11K

ZlodeiBaal 10 мая в 14:23

Как улучшить распознавание скелетов в MediaPipe

Блог компании Recognitor Алгоритмы *Обработка изображений *Машинное обучение *Искусственный интеллект

Tutorial

Я очень люблю скелетные детекторы из Mediapipe. Чтобы запустить их нужно всего несколько минут. Работает на разных платформах (мобильные, pc, embedded, и.т.д.). И выдает достаточное качество для многих применений.

Но надо признать что не всюду его можно брать и использовать. Давайте я расскажу как небольшими силами можно его улучшить. Приведенная тут логика будет построена вокруг Mediapipe, но она им не ограничена. Применяя аналогичные подходы можно улучшить практически любой скелетный алгоритм.

+14

2.3K

Bright_Translate 6 мая в 12:00

Как спрятать фото в другом фото

Блог компании RUVDS.com Информационная безопасность *Обработка изображений *

Перевод

Сокрытие сообщения в другом сообщении относится к области стеганографии. В этой статье мы будем прятать одну фотографию внутри другой. В результате при передаче такое фото будет выглядеть как обычный снимок, но по факту содержать два. Второй при этом можно будет извлечь при помощи внешнего инструмента.

Читать дальше →

+42

16K

engine9 5 мая в 12:00

Любительская фотосъёмка Луны

Блог компании RUVDS.com Обработка изображений *Фототехника Астрономия

Tutorial

Яркое впечатление из детства. Ясный морозный вечер. В небе зажигаются первые звёзды, и одна из них переливается радужным игривым бриллиантом. Из-за горизонта величественно и грозно выплывает сплюснутая Луна тёмно-вишнёвого оттенка.

Всякий раз лунные восходы производили чарующее, магическое впечатление, заставляли остановиться и любоваться ими. Спустя много лет я научился фиксировать этот волшебный миг при помощи фотокамеры и специализированной оптики. О своём опыте я хочу поведать тебе, дорогой читатель.

Много фотографий и особенности фотосъёмки

+108

12K

NapoleonIT 4 мая в 08:24

Как узнать принцессу среди 500 амурских тигров с помощью vision transformers

Обработка изображений *Хакатоны Машинное обучение *

Рассказываем, как мы, ML princesses [Napoleon IT] стали победителями кейса от Минприроды «Защита редких животных», и решили задачу по созданию сервиса, способного распознавать в дикой природе особо редкий вид хищников- амурского тигра. Десятый региональный хакатон проходил в рамках федерального проекта «Искусственный интеллект».

1.3K

spmbt 29 апреля в 14:14

Эксперимент длиной 12 лет: из 45 сервисов бесплатного хранения картинок рабочих осталось 6

Хостинг Habr Обработка изображений *Хранилища данных *

В марте 2010 года были популярны в том числе и на Хабре, бесплатные хостинги картинок: собственного сервиса habrastorage.org у сайта ещё не было, а по форумам была довольно популярной услуга — опубликовать картинку на стороннем сервисе и показать её в статье или в комментарии.

Возник вопрос — много ли таких сервисов в природе, чтобы бесплатно и главное — без регистрации, позволяли бы достаточно надёжно публиковать картинки, в основном, не требуя рекламы? (Только при просмотре картинки на отдельной странице реклама могла быть и могла окупить расходы на хостинг при такой модели пользования.)

Хабр вскоре, года через 2-3, избавился от зависимости от сторонних сервисов, и большинство других сайтов стремятся так делать. Потому что срок жизни таких картинок на хостинге по разным причинам хостеры гарантировали недолгим — 0.5-3 года и часто — в зависимости от частоты показа картинки (долго неиспользуемые — удаляются).

Читать дальше →

+15

2.2K

PatientZero 27 апреля в 09:14

Почему свет и темнота на фотографии — это сложно

Обработка изображений *Фототехника

Перевод

В этом посте будут описаны некоторые из решений, задействованных в воссоздании оттенков на фотографиях, то есть степени яркости или тёмности каждой части фото.

Мы привыкли считать, что фотографии просто объективно фиксируют освещение и отображают его, однако это не так. Оттенок фотографии отражает множество решений, сделанных фотографом и производителем камеры. Сегодня фотографии, снимаемыми нашими мобильными телефонами, становятся всё лучше и лучше, реализуя всё более сложные (но сокрытые от нас) эстетические решения.

Эта статья, наряду с моим предыдущим постом о перспективе, является частью более обширной темы зависимости картин и фотографий от художественных и технических решений. Фотографии — это не объективная фиксация реальности, как и картины — не точные отображения воспринимаемого художником. Подробнее я расскажу об этом в своём следующем посте.

Читать дальше →

+30

13K

Tehnologika 25 апреля в 12:29

Как мы распознавали птиц при помощи камер и искусственного интеллекта (часть 1)

Анализ и проектирование систем *Обработка изображений *Машинное обучение *Искусственный интеллект

Нейронные сети используются для множества задач, но слышали ли вы когда-нибудь про распознавание птиц? Мы – нет, поэтому возможность поработать над этим проектом очень нас захватила, а опыт по итогу оказался крайне интересным.

Птицы миллионы лет эволюционировали в сторону незаметности и слияния с окружающей средой, чтобы избежать хищников. Поэтому ученым и любителям птичек достаточно сложно искать птиц среди деревьев и кустарников. Но вот наблюдать за ними с помощью видеокамеры, не выходя из дома, — прекрасный способ, который сильно экономит время. Особенно если искусственный интеллект избавит пользователя от необходимости просматривать часы видеозаписей в поисках птиц, просто отправив уведомление на телефон, когда птица попала в поле зрения камеры. Более того, искусственный интеллект еще и автоматически определит её вид.

1.3K

kucev 19 апреля в 11:31

Датацентрический и моделецентрический подходы в машинном обучении

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

Код и данные — фундамент ИИ-системы. Оба эти компонента играют важную роль в разработке надёжной модели, но на каком из них следует сосредоточиться больше? В этой статье мы сравним методики, ставящие в центр данные, либо модель, и посмотрим, какая из них лучше; также мы поговорим о том, как внедрять датацентрическую инфраструктуру.

Читать дальше →

2.7K

wadik69 18 апреля в 22:17

Сравнение алгоритмов детекции лиц

Python *Обработка изображений *Машинное обучение *

Привет, Хабр! Очень часто я на просторах интернета натыкаюсь на такой вопрос: «А какое готовое решение по детекции лиц лучше всего использовать?» Так вот, я отобрал 5 решений с Github, которые показались мне хорошими, относительно новыми и лёгкими в использовании, и хотел бы сравнить их между собой. Всем, кому интересно, что из этого вышло, добро пожаловать под кат!

+17

11K

Bright_Translate 15 апреля в 12:00

Немного о 35 мм кинопленке и цифровом аудио

Блог компании RUVDS.com Работа с видео *Обработка изображений *Видеотехника Звук

Перевод

Вспомним, что это была за 35 мм киноплёнка, и какими способами на ней кодировались аудиоданные. В частности, обратим внимание на технологию Dolby Digital и попутно заглянем в патент, который поможет прояснить некоторые детали.

Читать дальше →

+54

6.2K

azTotMD 13 апреля в 10:00

Перенос нейронной сети из PyTorch на Google Coral

Блог компании Криптонит Обработка изображений *Машинное обучение *Искусственный интеллект TensorFlow *

Всем привет! Меня зовут Антон Расковалов и мы с командой отдела перспективных исследований «Криптонит» решили проверить, можно ли использовать Google Coral в решении наших задач. Приобретённым опытом делюсь в статье ниже.

Санкции вынуждают пересматривать подходы к организации ИТ-инфраструктуры, в том числе — искать альтернативу облачным ИИ-платформам. Одним из вариантов является использование специализированных ускорителей с нейропроцессорами, которые физически находятся на стороне клиента. Даже на фоне санкционного давления их можно купить на AliExpress и оплатить банковской картой, выпущенной на территории России.

Данная статья посвящена переносу нейронных сетей написанных на одном из самых популярных фрэймворков, PyTorch, на Google.Coral, один из самых "производительных ускорителей"

+10

1.5K

Cloud4Y 1 апреля в 10:17

Как ИИ сделает вас стройнее. Часть 2

Блог компании Cloud4Y Обработка изображений *Машинное обучение *Графический дизайн *

Перевод

Недавно мы писали о том, как ИИ помогает корректировать фигуру на фото. Тогда речь шла о проекте от Alibaba, который в целом неплохо справлялся с задачей, но имел ощутимый недостаток: если тело становилось стройнее, фон по краям мог “поехать”.

Новый проект от китайских исследователей предлагает альтернативный метод изменения формы человеческого тела, который "вылечил" эту проблему.

2.5K

kucev 31 марта в 11:44

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

На саммите iMerit ML Data Ops глава отдела искусственного интеллекта Cruise Хуссейн Мехенна провёл с Рагаваном Сринивасаном из Facebook AI беседу, озаглавленную Emerging AI Companies are Driving a Paradigm Shift.

В беседе они обсудили важность объединения цикла обработки данных ИИ с циклом обработки данных людьми, а также поговорили о том, что люди играют критическую роль в выявлении и разрешении пограничных случаев. Сочетание лучших практик human-in-the-loop, бесперебойного сотрудничества в цикле обработки данных и образ мышления, ставящий на первое место безопасность, в конечном итоге позволят достичь высочайшей степени успеха в сфере ИИ и ML.

Важность Humans-in-the-Loop

Успех таких ИИ-продуктов, как беспилотные автомобили, зависит от усложнения цикла обработки данных, на которых они построены. Надёжные циклы работы с данными одновременно генерируют, аннотируют и непрерывно применяют новые данные в продакшене. Однако для улучшения циклов работы с данными, например, в компании Cruise, интегрируется участие человека.

Благодаря участию человека в циклах обработки данных гарантируется безопасное и эффективное выполнение высокоуровневых действий в ИИ-системах. Humans-in-the-loop непрерывно оценивают характеристики автомобиля, и обеспечивают выполнение всех связанных с автомобилем действий так, как это делал бы человек.

Читать дальше →

631

kucev 29 марта в 12:51

Ускорение семантической сегментации при помощи машинного обучения

Data Mining *Обработка изображений *Big Data *Машинное обучение *Искусственный интеллект

Перевод

Зачем создавать процесс разметки данных на основе ML?

Быстрое создание высококачественной разметки данных — сложная задача. Парсинг и правильное аннотирование изображений и видео, обычно используемых в сфере беспилотного транспорта или робототехники, могут быть композиционно сложны даже для людей. Наша компания использует машинное обучение, чтобы дополнить реализуемые людьми рабочие процессы, позволяя повысить и качество, и скорость разметки. Так как модели глубокого обучения могут испытывать трудности с устойчивой производительностью в предметных областях с большим разнообразием данных, например, в сценах с участием беспилотных автомобилей, для обеспечения стабильно высокого качества необходимо найти оптимальный баланс между ML-автоматизацией и человеческим контролем.

Читать дальше →

970

MichaelDichenko 25 марта в 18:08

Привлекательность изображения: человек vs алгоритм (обзор результатов анкетирования 2282 человек)

Блог компании JUG Ru Group Обработка изображений *

Я страдаю частичным дальтонизмом (не различаю некоторые оттенки) и всегда затруднялся в магазине выбрать галстук к рубашке и пиджаку, а потом каждое утро составлять комбинацию из многих вариантов. В результате жена делала мне комплекты, и я просто выбирал «комплект 1» или «комплект 9».

В моём случае, как и во многих других, пригодился бы автоматический способ определять, что выглядит привлекательнее для большинства людей. В итоге я создал такой способ и хочу рассказать Хабру об этом.

+16

2 3 ...

49 50

Обработка изображений *

SAUNet: Shape Attentive U-Net for Interpretable Medical Image Segmentation

Новости

Инструменты OSINT для геолокации: моря, горы, улицы

Geolocation Estimaton

Развитие отечественных технологий фоторобота. От создания до наших дней

Применение подхода eXtreme Multi-Label Classification для классификации записей материально-технических ресурсов

Сколько цветов может выдержать Windows Terminal?

Как улучшить распознавание скелетов в MediaPipe

Как спрятать фото в другом фото

Любительская фотосъёмка Луны

Как узнать принцессу среди 500 амурских тигров с помощью vision transformers

Эксперимент длиной 12 лет: из 45 сервисов бесплатного хранения картинок рабочих осталось 6

Почему свет и темнота на фотографии — это сложно

Как мы распознавали птиц при помощи камер и искусственного интеллекта (часть 1)

Датацентрический и моделецентрический подходы в машинном обучении

Сравнение алгоритмов детекции лиц

Немного о 35 мм кинопленке и цифровом аудио

Перенос нейронной сети из PyTorch на Google Coral

Как ИИ сделает вас стройнее. Часть 2

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей

Важность Humans-in-the-Loop

Ускорение семантической сегментации при помощи машинного обучения

Зачем создавать процесс разметки данных на основе ML?

Привлекательность изображения: человек vs алгоритм (обзор результатов анкетирования 2282 человек)

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги