Комментарии 16
Планируете размечать классы волос и очков?
Не лучше ли сделать маттинг датасет для замены фона в джазе?
Переход от классической сегментации к матингу не так-то прост:
Задача матирования в принципе сложнее обычной сегментации,
Разметить качественно данные под задачу матинга нетривиально, а обучить толокеров рисовать маски намного проще. Мы пробовали получать pixel-perfect, но это все равно не матинг,
Сетки для сегментации проще и быстрее, их можно вытащить в реал-тайм, а с матингом такого сходу не получится (несмотря на готовые решения типа RVM).
Сегментация позволяет сразу решать несколько задач - вырезание фона, бьютификация и т.п., через матирование придется декомпозировать обработку (что опять же усложнит и замедлит финальное решение).
Как бороться с такими неявными правилами разметки как разметка бороды?
Тут стоит отталкиваться от цели: если очень важно настолько неявную задачу сделать максимально точно, как, например, у нас (область с едва заметной щетиной нужно было разметить именно как кожу, иначе этот кусок выделялся бы при сглаживании кожи) - без эксперта, который сможет все провалидировать будет сложно добиться хорошего качества. Если высокая точность не так важна, то тут можно обойтись менее строгой валидацией или только агрегацией разметки. Однако, все это работать не будет без объемной инструкции с большим количеством различных примеров, помимо которых все же стоит написать и наводящий вопрос - например "Если Вам (разметчику) кажется, что часть кожи с щетиной при сглаживании будет выглядеть естественно - можно оставить ее как <кожу>".
А почему так мало горизонтально ориентированных изображений? ИМХО)) ВКС сервисами обычно пользуются с ноутбуков.
Почему вы решили делать разметку полигонами с перекрытием? Если сделать перекрытие 1, но ужесточить валлидацию, не будет ли это более выгодно с точки зрения скорости разметки и стоимости? Мы обычно применяем именно такой подход с перекрытием 1.
Тут дело в том, что сначала думали всю разметку организовать в Толоке, где найти сильно мотивированного модератора сложно. После, когда почти все было размечено на Толоке, попробовали размечать на Элементари с участием модератора и решили смержить 2 варианта в один: от 3 до 5 разметки с Толоки с весом X + 1 разметка с Элементари с весом Y (Y > X).
Сейчас уже выбрали бы вариант с одной краудсорсинг платформой на разметке: Элементари с перекрытием 1 и модератором, но там это все, конечно, занимает больше времени, так как намного меньше разметчиков.
Пробовали ли вы применять интерактивную сегментацию (Segment Anything, либо HRnet) для простых классов? Думаю губы, брови, глаза она бы хорошо выделяла
Пробовали Segment Anything, не получилось (пример). В планах попробовать дообучить SA на EasyPortrait.
Привет! Роман, отличный вопрос. Выделение простых (то есть, контрастных) классов ускорить получается. Из минусов SAM на примере обсуждения - ожидаемо плохая работа с классами "кожа" и "волосы".
Также мы уже полностью подняли Segment Anything на своей инфраструктуре и встроили его в АБК Элементари. Приглашаю к экспериментам, пример прикладываю.
хорошее приложение
EasyPortrait — портретная сегментация и анализ лиц