Microsoft представила штучний інтелект, який може імітувати будь-який голос
Компанія Microsoft представила штучний інтелект VALL-E, який здатний імітувати будь-який людський голос на основі прикладу тривалістю всього три секунди. При цьому голос імітується достовірно, зі збереженням як тембру, так і емоційного забарвлення оригіналу.
Підпишіться на канал Gloss.ua у Telegram.
Сама Microsoft називає VALL-E «мовною моделлю нейронного кодека». Розробка спирається на технології EnCodec.
На відміну від інших методів перетворення тексту, які часто синтезують мову, маніпулюючи формами сигналів, розробка Microsoft в основному аналізує, як саме звучить людина, розбиває цю інформацію на окремі «токени» та використовує навчальні дані, щоб зіставити свої «знання» про те, як цей голос звучатиме, якщо ІІ вимовить інші фрази.
Навчання VALL-E проходило на бібліотеці LibriLight, що містить 60 000 годин англомовної мови від 7000 людей.
Публікувати вихідний код VALL-E Microsoft не наважилися - технологію можуть використовувати з лихою метою. У компанії також повідомили, що майбутні проекти, якщо вони несуть потенційну загрозу зловживань, у відкритий доступ не потраплятимуть.
Теги: світові новини , технології , штучний інтелект , Microsoft , голос