Microsoft показали ИИ, который скопирует ваш голос за 3 секунды

Microsoft, а может не надо? Звучит крипово, да и пруфы слишком уж убедительны ?

Опубликовано 10.01.2023

Да, заголовок — не кликбейт.

В Microsoft показли искусственный интеллект VALL-E, который может имитировать любой голос. Для этого ему достаточно послушать живой пример всего 3 секунды.При этом он сохранит и тембр, и эмоциональный окрас сказанного.

Microsoft описывает VALL-E как «языковую модель нейронного кодека».

Расшифровывается это так: есть технология EnCodec, которая в отличие от аналогов, анализирует речь, разбивает её на отдельные «токены» и потом сопоставляет это с тут же смоделированной инфой о том, как этот голос будет звучать, если программа придумает ему другие фразы.

Аналоги работают более топорными методами.

Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды

Эта схема работает за счёт 60 000 часов записанной англоязычной речи от более чем 7 000 носителей языка.

На сайте проекта можно посмотреть примеры синтезированной речи.

? Не очень хочется представлять, что из этого может выйти, поэтому предлагаю вместе с нами спрятаться от ужасов мира в подборке самых бесполезных гаджетов.

Источник и картинки: vall-e, ixbt

гаджеты