Приглашаем на очередной митап от команды VK! Вечером 20 января наши разработчики расскажут о распознавании и расшифровке речи в голосовых сообщениях и видео.
- Это онлайн-мероприятие, трансляция пройдёт в сообществе VK Team.
- Чтобы получить приглашение в чат, заполните анкету регистрации здесь, на сайте.
Героями вечера станут:
Иван Самсонов, продакт-менеджер из команды прикладных исследований искусственного интеллекта ВКонтакте
Эволюция в расшифровке речи ВКонтакте: зачем, а главное, почему?
Не всегда удобно посмотреть видео со звуком — иногда проще прочитать субтитры и понять смысл происходящего. У нас есть технология ASR, которая прекрасно расшифровывает аудиосообщения, но просто взять и применить её для видео не получится. Иван расскажет, какие технологические и продуктовые сложности преодолевали разработчики:
- как решали, что субтитры в видео необходимы;
- как меняли ASR ВКонтакте;
- что такое «речевой домен».
Виталий Шутов, программист-разработчик из VK Видео
Распознавание речи для субтитров в VK Видео
Вы узнаете, как работает ASR внутри ВКонтакте и с какими проблемами столкнулись разработчики, адаптируя её для создания автосубтитров к записям любой длины.
Филипп Мальковский, разработчик из VK Видео
Инфраструктура для автоматической генерации субтитров в VK Видео
Филипп расскажет, как мы адаптировали существующий пайплайн по распознаванию речи ВКонтакте для работы в инфраструктуре VK Видео, внедряли новые компоненты и оптимизировали получившееся решение.