Компания Microsoft выпустила инструмент искусственного интеллекта VALL-E, который может воспроизводить голоса людей. Нейросеть была обучена на 60 000 часах данных английской речи и использует 3-секундные клипы конкретных голосов для создания контента.
В отличие от других нейросетей, VALL-E может воспроизводить эмоции и тон говорящего даже при создании записи слов, которые оригинальный человек никогда не произносил.
В работе, опубликованной в Корнельском университете, VALL-E использовался для синтеза нескольких голосов. Некоторые примеры работы нейросети также доступны на GitHub.
Образцы голоса, которыми поделилась компания Microsoft, отличаются по качеству. Некоторые из них звучат естественно, другие явно сгенерированы компьютером и кажутся роботизированными. Конечно, со временем искусственный интеллект становится лучше, поэтому в будущем сгенерированные записи, вероятно, будут более убедительными.
На данный момент VALL-E не является общедоступной, что, возможно, и хорошо, поскольку сгенерированные копии голосов людей могут быть использованы злоумышленниками.
Поскольку искусственный интеллект становится все более мощным, голоса, генерируемые VALL-E и подобными технологиями, будут становиться все более убедительными. Это даст толчок появлению реалистичных спам-звонков, воспроизводящих голоса реальных людей, знакомых потенциальной жертве.
Также злоумышленники смогут выдавать себя за политиков и других общественных деятелей. Учитывая скорость распространения информации в социальных сетях и полярность политических дискуссий, вряд ли многие остановятся, чтобы спросить, является ли скандальная запись подлинной, если она хотя бы в некоторой степени звучит правдиво.
Также есть шанс, что в какой-то момент из-за VALL-E и подобных ей технологий потеряют работу актеры озвучки. Если VALL-E достигнет того уровня, когда она сможет заменить актеров озвучивания для аудиокниг или другого контента, компании будут использовать эту нейросеть. Это просто реальность развития технологий.
У Microsoft есть этическое заявление об использовании VALL-E, но будущее использования этой нейросети все еще туманно. Президент Microsoft Брэд Смит в прошлом обсуждал вопрос о регулировании ИИ — остается лишь догадываться, что нас ждет впереди.