![](http://webcf.waybackmachine.org/web/20201028180742im_/https://habrastorage.org/getpro/habr/avatars/c3a/d1e/43d/c3ad1e43d500046c3228c9494b510912.jpg)
Синтетические данные: улучшение алгоритмов восприятия и оптимизация поиска границ
- Блог компании НПП ИТЭЛМА,
- Обработка изображений,
- Машинное обучение,
- Искусственный интеллект,
- Транспорт
- Перевод
![image](https://webcf.waybackmachine.org/web/20201028180742im_/https://habrastorage.org/getpro/habr/post_images/037/a54/2a9/037a542a976f6d5f35548d951fb1c590.png)
Для того, чтобы охватить все краевые случаи, встречающиеся в реальном мире, критические системы восприятия нуждаются в огромных массивах данных. Один из распространенных подходов к обучению алгоритмов для беспилотных автомобилей – подбор и разметка данных о реальном вождении. На CVPR 2020 Андрей Карпатый рассказывал, что Tesla тоже использует этот подход – их автомобили адаптируют метки объектов в режиме онлайн. «Вариация и контроль» очень важны, поскольку инженеры постоянно адаптируют онтологию и методику маркировки данных, так как беспилотные автомобили постоянно сталкиваются с новыми сценариями, которые необходимо анализировать.
Впрочем, этот подход, основанный на использовании данных, имеет различные ограничения – они обусловлены масштабируемостью, стоимостью сбора данных и множеством усилией, необходимых для точной маркировки датасетов. В этом тексте команда Applied расскажет о подходе, основанном на синтетических размеченных данных. Этот подход обеспечивает ускорение и экономичность обучения и разработки критических алгоритмов для беспилотного транспорта.
![image](https://webcf.waybackmachine.org/web/20201028180742im_/https://habrastorage.org/getpro/habr/post_images/7ea/1e4/75e/7ea1e475eaba40579173a4108d966450.png)
Пример синтетических данных для изображений с камер с эталонной разметкой. Оригинальное RGB изображение (вверху слева), 2D-рамки (вверху справа), семантическая разметка (внизу слева) и 3D-рамки (внизу справа).