Илон Маск против лидаров: Псевдолидар

Автор оригинала: Brad Templeton
  • Перевод
Tesla давно мечтает сделать камеры, работающие не хуже лидара. Если ее мечта осуществится, это сильно поможет конкурентам.

image

Всем хорошо известно, что думает Илон Маск о применении лидара (технологии трехмерного изображения) в беспилотных автомобилях. Он не планирует использовать ее в Tesla и считает костылем. Это очень спорная точка зрения, только время покажет прав ли он.

Tesla продвигает технологию, называемую псевдо-лидаром или виртуальным лидаром. Эта технология заключается в построении инструментов для создания снимков с камеры (стерео или обычных). Нужно выяснить насколько далеко находится каждый пиксель на снимке. Лидар вычисляет расстояние до каждого пикселя. Он определяет сколько времени требуется световому импульсу, чтобы попасть в пиксель и вернуться обратно со скоростью света. Люди оценивают расстояние, используя мозг. Мы знаем насколько большие те или иные предметы и как они движутся. Это дает нам представление о том насколько далеко они находятся. Мы также используем стереозрение, потому что у нас два глаза. Однако стереозрение работает только на относительно близком расстоянии. Еще есть параллакс движения — вы наблюдаете за тем как движутся предметы на фоне и используете некоторые другие подсказки, чтобы определить расстояние до объекта.

Это удивительные явления. Человеческий мозг легко с ними справляется. Вы можете делать это даже с одним закрытым глазом пока ведете автомобиль. Люди пытаются создать методы машинного обучения, которые тоже смогут определять расстояние по изображению, используя нейронные сети. Это и есть виртуальный лидар. Вот результат одного интересного исследования.

image

Обучить виртуальный лидар гораздо проще, чем обучить обычные нейронные сети. Для этого обычно требуется множество изображений, для которых люди кропотливо вычисляют расстояния. Поскольку на тестовой машине может быть установлен действительно дорогой лидар, вы можете прокатиться на ней и получить не только тестовые данные, но и показатели с лидара. Вы показываете нейронной сети кучу изображений с реальным расстоянием, вычисленным лидаром, и сеть учится определять расстояние самостоятельно. Этот метод — своеобразный вид «обучения без учителя» (unsupervised learning). Вам не нужны люди, определяющие расстояние вручную. Обучение без учителя значительно дешевле чем «с учителем». Что нейронные сети могут делать действительно хорошо, так это обучаться. Их можно также обучать на данных симулятора, чтобы улучшить свои модели.

image

Можно также полагаться на то, что объекты реального мира меняют расстояние определенным образом. Эти изменения можно предсказать. Когда вы видите объект, движущийся по всем законам физики, ваша оценка расстояния, скорее всего, будет правильной. Если вы увидите, как объект прыгает в космосе каким-то невообразимым образом, вы будете знать, что ваши расчеты вероятно ошибочны.

Нейронные сети с этим справляются. Их единственная проблема в том, что они смотрят на отдельные кадры, а не на движущиеся изображения, как люди. Мы часто ошибаемся, когда речь идет о статичных изображениях. Со временем методы машинного обучения смогут превзойти нас в этом. Проблема в том, что мы должны убедиться, что эти методы чрезвычайно надежны. Вы также должны обучать нейронные сети на вещах, которые вы сами никогда не видели. Это будет для них своеобразным вызовом. Например, что-то необычное замаячило впереди на тропинке вашего переулка. Вам нужно узнать насколько далеко эта штука находится, причем узнать наверняка и в ближайшее время. Если это машина, вы знаете размер машины, поэтому понимаете как далеко она находится. Также можно показать нейронной сети поворачивающую машину. Для человека это нормальное явление, но нейронная сеть может быть такого никогда не видела. Когда вы видите какой-то объект, то задаетесь вопросом: это большой объект вдали или маленький объект вблизи? Единственный способ узнать это — увидеть связь объекта с геометрией дороги. Это сложнее.

image

Если кто-то справится с этой задачей, у него будет инструмент, который сможет делать снимки с камеры и создавать трехмерное «облако точек» благодаря лидару. Поскольку камеры дешевле, на создание этого инструмента уйдет гораздо меньше денег. Также этот инструмент сможет справляться с очень большими расстояниями. Многие лидары ограничены расстоянием в 120 метров. Дорогие лидары могут распознавать объекты на расстоянии 240 метров. Люди же способны понять, что находится на расстоянии мили.

Ирония в том, что разработчики лидара сделали эту технологию, зависящей от облака точек и потратили много времени на ее улучшение. Если идея с псевдо-лидаром внезапно выгорит, то создаст качественные облака точек, которые можно будет сразу же использовать. Те, кто надеется на псевдо-лидар, получат другой опыт использования данных в этой форме. Им придется придумать как объединить другие элементы своей системы зрения с оценкой расстояния. К таким элементам относится сегментация изображения на разные объекты и их классификация. Tesla может быть совсем не готова использовать тот прорыв, на который так надеялась.

image

Компании, использующие лидар, наоборот окажутся в выигрыше. “Отлично, мы можем заменить дорогой лидар чем-то подешевле”, — скажут они. Если они еще и производят лидар (как Ford, Cruise, Waymo и Aurora), то осознают как много денег потратили впустую.

Ясно одно — нужно определять расстояние до любых объектов на дороге и делать это быстро и качественно. Мы уже видели, как беспилотный автомобиль Tesla несколько раз врезался в грузовики, шлагбаумы и заглохшие транспортные средства, которые были скрыты автомобилем, внезапно выехавшим на дорогу. Когда датчики обнаруживают препятствие на дороге, вам нужно знать наверняка, насколько далеко это препятствие находится. Это необходимо для экстренного торможения. Лидар почти всегда дает эту информацию, а компьютерное зрение нет. Псевдо-лидар это попытка решить проблему. На данный момент большинство других компаний планируют решить ее с помощью лидара. Они знают как он работает и ожидают, что он станет дешевле.

Конечно, если Tesla решит эту проблему внутри компании, она не поделится решением с другими. Однако демонстрация решения может побудить другие компании сделать то же самое. Команда распознавания объектов может также разработать инструмент, который просто попытается сопоставить оценку расстояния с классификацией, а не создавать облако точек подобно лидару.

Перевод: Диана Шеремьёва



image

О компании ИТЭЛМА
Мы большая компания-разработчик automotive компонентов. В компании трудится около 2500 сотрудников, в том числе 650 инженеров.

Мы, пожалуй, самый сильный в России центр компетенций по разработке автомобильной электроники. Сейчас активно растем и открыли много вакансий (порядка 30, в том числе в регионах), таких как инженер-программист, инженер-конструктор, ведущий инженер-разработчик (DSP-программист) и др.

У нас много интересных задач от автопроизводителей и концернов, двигающих индустрию. Если хотите расти, как специалист, и учиться у лучших, будем рады видеть вас в нашей команде. Также мы готовы делиться экспертизой, самым важным что происходит в automotive. Задавайте нам любые вопросы, ответим, пообсуждаем.

Читать еще полезные статьи:

НПП ИТЭЛМА
Компоненты для роботизированного транспорта

Комментарии 20

    +6
    Т-800, ты бы хоть глянул на заголовок перед публикацией. Ладно в теле проглядеть ляпы, но такое вообще за гранью.
      0
      Высылаем отряд терминаторов.
      +4
      Вы показываете нейронной сети кучу изображений с реальным расстоянием, вычисленным лидаром, и сеть учится определять расстояние самостоятельно. Этот метод — своеобразный вид «обучения без учителя» (unsupervised learning).

      Серьезно? Обучение нейронки, когда на вход несколько потоков видео, а на выход, — карта глубин это unsupervised learning?
        0
        Какие это «несколько потоков видео»? Потоки видео и расстояние с лидара. Нейросеть предполагает расстояние и узнаёт его из данных с лидара, надсмотрщик не нужен.
          +1

          "Надсмотрщик" тут — лидар.

          0
          это self-supervised learning.
            0
            как круто получить -1 от анонима, который не разбирается в теме. Аноним, в след. раз хоть в гугле вбей, если чего-то не знаешь.
            0
            Да, с виду вполне обычное обучение с учителем — обучают на картинке по данным глубины, потом показывают картинку и просят восстановить глубину.
              0
              это self-supervised learning, система сама себе генерит ответы
            +1
            2 камеры разве не справятся с определением дальности объекта? Там же не сантиметровая точность нужна и чем ближе тем точнее будет то по идее должно сработать. Хотя может нужна камера много мегапиксельная чтоб обьекты хотябы на расстоянии 100 метров уметь определить не как очень далеко, а потом уже слишком близко :D
              +3
              Показалось.
                +2
                Всем хорошо известно, что думает Илон Маск о применении лидара (технологии трехмерного изображения) в беспилотных автомобилях.
                Никто не знает, что думает Маск, кроме самого Маска. А то, что он говорит — не обязательно то, что думает. Более того, до всех, да еще и хорошо знать, то что говорит Маск — это выдумки.
                  +2
                  Интересно. Когда давно (лет 12 назад) на одном маленьким форуме придумывали боевую технику будущего. Одной из тем были роботы. Тогда я предположил что для них нужны камеры, которые будут иметь ограничения по дальности видимости и видеть более близкие объекты четче, работая примерно как автофокусировка на фотокамерах. Мысль была не сколько заменить лидар, сколько дать обзор там, куда лучи лидаров не достанут — прямо под колесами\гусеницами техники. Плюс такой штуки в том, что это пассивных датчик, который ничего не излучает. Проблема у такого решения такая же, как и у лидара — не будет адекватно работать в дыму, тумане и прочих оптических помехах. Тут и человеку-то будет не просто, но может везти машину «на ощупь» или по памяти, используя опыт и воображение. Получалось в итоге, что роботу нужна гирлянда разных датчиков, включая радар для сложных ситуаций. Ну и обмен данными с другими машинами.

                  Все это я к чему. Вряд ли получится в ближайшее время создать автопилот, который полностью заменит водителя. Но можно отдать руль в самых рутинных и долгих ситуациях — езда по автотрассам и тупление в пробках. Для этого, в первую очередь, чтобы регуляторы пошли навстречу разработчикам — нарезали дорожное полотно на разные зоны. Въезжаешь на магистраль — сообщение, что можно отдать управление автопилоту. Съезжаешь с неё — предупреждение, что надо брать управление на себя. А в некоторых местах использование автопилота просто исключается (вокруг школ, к примеру) и допускаются только системы предотвращения наездов и прочих ДТП. И автомобиль должен сам понимать, куда он попал. Для этого мало спутниковой навигации, надежнее встраивать радиометки в дорожное полотно и объекты около них.

                  Короче говоря, сейчас все это похоже на попытки решить задачу в общем виде. И вряд ли такое получится быстро. Если же откусывать от этого пирога по частям, то есть, выделить отдельную ситуацию, которую можно будет удовлетворительно решить, то это позволит затем транслировать опыт на другие ситуации, плюс, приучать водителей к езде с автопилотом постепенно, вырабатывая соответствующую культуру пользования. Автопилот не снимает ответственности с водителя, так машина принадлежит ему, но это не снимает ответственности и с разработчика, сколько бы он не напирал на то, что руки предписано держать на руле. И уж тем более, не может стоять в сторонке регуляторы, прикрывающих свои известно что бумажками. Они-то как раз таки и обязаны возглавить движение. Они же его регуляторы, в конце концов
                    +2
                    Вряд ли получится в ближайшее время создать автопилот, который полностью заменит водителя.
                    Знаете, я в последнее время слышу эту фразу настолько часто… что похоже таксистам уже пора искать другую работу.

                    P.S. Что я имею в виду. Если посмотреть на известную кривульку то видно, что мы уже близки к моменту, когда все-все-все разочаруются в автономных автомобилях… и они как раз начнут, наконец, внедряться…
                      0
                      в 2019 году на кривой Гартнера для автономного вождения 5 уровня был заявлен срок «более 10 лет», так что некоторые таксисты успеют даже уйти на пенсию.
                        0
                        Некоторые — да. Кому за 50 — можно даже особо не париться, всех сразу не заменят. Но есть и более молодые.

                        10 лет — это как раз время, чтобы не спеша, посмотрев и послушав — выбрать другую работу и обучиться ей.
                        0
                        Так и автопилотами уже все уши прожужжали. У меня скепсис многоплановый, расписывать что-то лень :) Отмечу одно: по ссылке сказано про разработки автономных аэротакси, и это при том, что уже существуют малые вертолеты легче легковушек. Но вертолетных такси что-то не наблюдается, хотя можно к ним прикрутить самоуправляемость, для летающих машин это проще. Ответ сему банален — вертолетики дорогие. Квадрокоптеры соответствующих габаритов тоже не будут дешевыми. А значит мы на них не полетаем. С робомобилями ценовой вопрос может будет не столь критичен, но, имхо, тоже найдутся свои рифы
                          0
                          Так и автопилотами уже все уши прожужжали.
                          Вот когда все говорили «вот-вот будет» можно было особо не суетиться. Было понятно, что ещё народ должен будет разочароваться, вытащить оттуда деньги, решить что вот всё — не срослось… это годы и годы.

                          А вот после того, как всё это произойдёт (а уже близко, похоже) — вот тогда оно и начнёт реально внедряться.
                      0
                      А ночью то как быть с псевдолидаром? Включать нормальный лидар?
                        0
                        А ночью машины сейчас не ездят? Если уж человек справляется со своими несовершенными органами, то камерам будет куда проще.

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое