Microsoft представила штучний інтелект, який може імітувати будь-який голос
Microsoft
Компанія Microsoft представила штучний інтелект VALL-E, який здатний імітувати будь-який людський голос на основі прикладу тривалістю всього три секунди. При цьому голос імітується достовірно, зі збереженням як тембру, так і емоційного забарвлення оригіналу.
Підпишіться на канал Gloss.ua у Telegram.
Сама Microsoft називає VALL-E «мовною моделлю нейронного кодека». Розробка спирається на технології EnCodec.
На відміну від інших методів перетворення тексту, які часто синтезують мову, маніпулюючи формами сигналів, розробка Microsoft в основному аналізує, як саме звучить людина, розбиває цю інформацію на окремі «токени» та використовує навчальні дані, щоб зіставити свої «знання» про те, як цей голос звучатиме, якщо ІІ вимовить інші фрази.
Навчання VALL-E проходило на бібліотеці LibriLight, що містить 60 000 годин англомовної мови від 7000 людей.
Публікувати вихідний код VALL-E Microsoft не наважилися - технологію можуть використовувати з лихою метою. У компанії також повідомили, що майбутні проекти, якщо вони несуть потенційну загрозу зловживань, у відкритий доступ не потраплятимуть.
Читай також
Neuralink створить роботизовану руку, якою можна керувати силою думки
Крок до повернення фізичної свободи
Українці збільшили витрати на нові авто: які марки стали найбільш продаваними
На першому місці німецький преміум-клас
З 2025 року ChatGPT стане платником податків в Україні: що зміниться для користувачів
Скільки коштуватиме підписка
У швейцарській церкві тепер можна сповідатися ШІ-Ісусу Христу
Як працює «божественний» штучний інтелект
Резиденцію Дональда Трампа охороняють роботи-собаки: що про них відомо (відео)
ЗСУ використовують схожих роботів