Компании в сфере искусственного интеллекта вновь оказались в центре скандала, касающегося интеллектуальной собственности. Аналитики Proof News обнаружили, что разработчики ИИ-сервисов, а именно Apple, Nvidia, Anthropic и Salesforce, использовали субтитры к тысячам YouTube-видео для обучения своих моделей искусственного интеллекта без разрешения авторов.
Согласно расследованию Proof News, субтитры к 172,5 тыс. видеороликов с более чем 48 тыс. каналов вошли в датасет под названием The Pile. Среди каналов, перечисленных Proof News, фигурируют довольно крупные и известные: MKBHD (19 млн подписчиков), MrBeast (289 млн), Jacksepticeye (31 млн), PewDiePie (111 млн), каналы ток-шоу Стивена Колберта, Джона Оливера и Джимми Киммела, а также каналы образовательных учреждений, таких как Массачусетский технологический институт и Гарвардский университет.