Компания Microsoft выпустила инструмент искусственного интеллекта VALL-E, который может воспроизводить голоса людей. Нейросеть была обучена на 60 000 часах данных английской речи и использует 3-секундные клипы конкретных голосов для создания контента.
В отличие от других нейросетей, VALL-E может воспроизводить эмоции и тон говорящего даже при создании записи слов, которые оригинальный человек никогда не произносил.
В работе, опубликованной в Корнельском университете, VALL-E использовался для синтеза нескольких голосов. Некоторые примеры работы нейросети также доступны на GitHub.
![](https://surface-pro.ru/wp-content/uploads/2023/01/Screenshot-2023-01-09-at-22.36.33.jpg)
Образцы голоса, которыми поделилась компания Microsoft, отличаются по качеству. Некоторые из них звучат естественно, другие явно сгенерированы компьютером и кажутся роботизированными. Конечно, со временем искусственный интеллект становится лучше, поэтому в будущем сгенерированные записи, вероятно, будут более убедительными.
На данный момент VALL-E не является общедоступной, что, возможно, и хорошо, поскольку сгенерированные копии голосов людей могут быть использованы злоумышленниками.
Поскольку искусственный интеллект становится все более мощным, голоса, генерируемые VALL-E и подобными технологиями, будут становиться все более убедительными. Это даст толчок появлению реалистичных спам-звонков, воспроизводящих голоса реальных людей, знакомых потенциальной жертве.
Также злоумышленники смогут выдавать себя за политиков и других общественных деятелей. Учитывая скорость распространения информации в социальных сетях и полярность политических дискуссий, вряд ли многие остановятся, чтобы спросить, является ли скандальная запись подлинной, если она хотя бы в некоторой степени звучит правдиво.
Также есть шанс, что в какой-то момент из-за VALL-E и подобных ей технологий потеряют работу актеры озвучки. Если VALL-E достигнет того уровня, когда она сможет заменить актеров озвучивания для аудиокниг или другого контента, компании будут использовать эту нейросеть. Это просто реальность развития технологий.
У Microsoft есть этическое заявление об использовании VALL-E, но будущее использования этой нейросети все еще туманно. Президент Microsoft Брэд Смит в прошлом обсуждал вопрос о регулировании ИИ — остается лишь догадываться, что нас ждет впереди.