Кинофестиваль сгенерированных фильмов и звонок искусственному интеллекту: нейроновости

Теперь можно позвонить искусственному интеллекту и посмотреть кино, сгенерированное нейросетью. Все самые любопытные новости из мира ИИ — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.ru.

Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека.

Виртуальный техноблогер Mr.Metapreneur
Виртуальный техноблогер Mr.MetapreneurИсточник: Mr.Metapreneur

Большие языковые модели можно контролировать

Исследователи из компании Anthropic, специализирующейся на искусственном интеллекте, объявили о значительном прорыве в понимании работы языковых моделей ИИ.

Они исследовали свою ИИ-модель Claude 3 Sonne с помощью метода «изучение словаря». Ученые обнаружили около 10 миллионов шаблонов активации комбинаций нейронов (математических единиц) модели. Такие комбинации нейронов исследователи назвали «функциями». Обнаруженные шаблоны указывают на закономерности в поведении модели при обсуждении различных тем.

Исследователи выяснили, что определённая функция активируется каждый раз, когда Claude получает запрос о Сан-Франциско. Другие функции запускаются при упоминании тем, связанных с иммунологией или научными терминами, такими, как литий. Также, например, были выявлены функции, связанные с абстрактными понятиями, такими, как обман или гендерная предвзятость.

Пример активации функции
Пример активации функции Источник: Anthropic

Кроме того, ученые обнаружили, что ручное управление этими функциями может изменить поведение ИИ-модели, вплоть до нарушения ею собственных правил.

Крис Ола, глава исследовательской группы, заявил, что результаты их работы помогут компаниям искусственного интеллекта лучше контролировать свои модели.

Умное шумоподавление на основе искусственного интеллекта

Ученые из Вашингтонского университета создали систему искусственного интеллекта для наушников под названием «Target Speech Hearing». Она позволяет выделять голос конкретного человека в шумной среде. В ходе разработки исследователи интегрировали свою систему в гарнитуру Sony.

Как это работает? Звуковые волны, исходящие от голоса говорящего, достигают микрофонов, установленных с обеих сторон гарнитуры, практически одновременно. Эти микрофоны отправляют полученный сигнал на встроенный компьютер, где программное обеспечение машинного обучения анализирует и запоминает уникальные голосовые паттерны говорящего. Система улавливает голос человека и воспроизводит его в наушниках, даже если пара перемещается или слушатель больше не смотрит на собеседника. По мере продолжения разговора система получает больше данных для обучения, что позволяет ей всё точнее фокусироваться на голосе говорящего.

Для активации системы достаточно направить голову в сторону говорящего. В течение трех-пяти секунд система «записывает» голос собеседника. После этого она устраняет посторонние шумы, воспроизводя только голос зарегистрированного говорящего в реальном времени.

Иллюстрация работы системы «Target Speech Hearing»
Иллюстрация работы системы «Target Speech Hearing»Источник: ACM Digital Library

Научная группа провела эксперимент с участием 21 добровольца, которые оценивали качество звука в наушниках. Результаты показали, что средняя оценка чистоты звука после обработки системой была почти в два раза выше по сравнению с необработанным звуком.

Звонок искусственному интеллекту

В Arc Search (браузер для iPhone с искусственным интеллектом) появилась функция Call Arc, которая позволяет пользователям «звонить» искусственному интеллекту для получения информации.

Человек и робот
Источник: DALL-E

Для доступа к новой функции нужно открыть приложение, поднести телефон к уху и задать свой вопрос. После этого приложение сразу предоставит голосовой ответ. Во время прослушивания ответа пользователи видят на экране анимированный смайлик с подвижным ртом, который озвучивает ответы на вопросы.

Браузерная компания утверждает, что Call Arc предлагает инновационный подход к голосовому поиску. Функция отличается быстрыми ответами и простотой. Использование Call Arc сопоставимо с телефонным звонком другу.

Фестиваль ИИ-кино

В Лос-Анджелесе прошел второй международный кинофестиваль ИИ AIFF, организованный ИИ-видеостартапом Runway.

Кадр из фильма «Get Me Out»
Кадр из фильма «Get Me Out»Источник: Runway

Подать заявку на участие мог любой желающий. Фильмы должны были иметь продолжительность не более 10 минут. Использование продуктов Runway и полная генерация фильма с помощью ИИ не были обязательными условиями, но участники должны были соблюдать авторские права. В прошлом году было подано 300 заявок, а в этом году их число достигло 2500.

Фильмы оценивались по нескольким критериям: качество композиции фильма, согласованность повествования и художественного послания, оригинальность и использование ИИ.

Каждый фильм оценивался судьями по шкале от 1 до 10. Победителем стал фильм, получивший самый высокий средний балл.

Гран-при фестиваля получил сюрреалистичный фильм «Get Me Out», рассказывающий историю японского иммигранта в США.