Microsoft представила штучний інтелект, який може імітувати будь-який голос
Microsoft
Компанія Microsoft представила штучний інтелект VALL-E, який здатний імітувати будь-який людський голос на основі прикладу тривалістю всього три секунди. При цьому голос імітується достовірно, зі збереженням як тембру, так і емоційного забарвлення оригіналу.
Підпишіться на канал Gloss.ua у Telegram.
Сама Microsoft називає VALL-E «мовною моделлю нейронного кодека». Розробка спирається на технології EnCodec.
На відміну від інших методів перетворення тексту, які часто синтезують мову, маніпулюючи формами сигналів, розробка Microsoft в основному аналізує, як саме звучить людина, розбиває цю інформацію на окремі «токени» та використовує навчальні дані, щоб зіставити свої «знання» про те, як цей голос звучатиме, якщо ІІ вимовить інші фрази.
Навчання VALL-E проходило на бібліотеці LibriLight, що містить 60 000 годин англомовної мови від 7000 людей.
Публікувати вихідний код VALL-E Microsoft не наважилися - технологію можуть використовувати з лихою метою. У компанії також повідомили, що майбутні проекти, якщо вони несуть потенційну загрозу зловживань, у відкритий доступ не потраплятимуть.
Читай також
Резиденцію Дональда Трампа охороняють роботи-собаки: що про них відомо (відео)
ЗСУ використовують схожих роботів
Штучний інтелект Google Gemini порадив користувачеві «померти» та назвав його «непотрібним»
Втомився відповідати на питання
Ракета SpaceX відправила в космос науковий проект школярів зі Львівської області
Переможці Всеукраїнського конкурсу
Apple представила новий Mac mini – свій найменший комп'ютер в історії
Новий дизайн вперше за 14 років
Найдосконаліший у світі робот-гуманоїд може імітувати людську міміку – відео
Короткий діалог двох людиноподібних роботів