Microsoft представила штучний інтелект, який може імітувати будь-який голос
Microsoft
Компанія Microsoft представила штучний інтелект VALL-E, який здатний імітувати будь-який людський голос на основі прикладу тривалістю всього три секунди. При цьому голос імітується достовірно, зі збереженням як тембру, так і емоційного забарвлення оригіналу.
Підпишіться на канал Gloss.ua у Telegram.
Сама Microsoft називає VALL-E «мовною моделлю нейронного кодека». Розробка спирається на технології EnCodec.
На відміну від інших методів перетворення тексту, які часто синтезують мову, маніпулюючи формами сигналів, розробка Microsoft в основному аналізує, як саме звучить людина, розбиває цю інформацію на окремі «токени» та використовує навчальні дані, щоб зіставити свої «знання» про те, як цей голос звучатиме, якщо ІІ вимовить інші фрази.
Навчання VALL-E проходило на бібліотеці LibriLight, що містить 60 000 годин англомовної мови від 7000 людей.
Публікувати вихідний код VALL-E Microsoft не наважилися - технологію можуть використовувати з лихою метою. У компанії також повідомили, що майбутні проекти, якщо вони несуть потенційну загрозу зловживань, у відкритий доступ не потраплятимуть.
Читай також
Російський "Орєшнік" не дістає до Києва з Білорусі, незважаючи на дальність 5500 км
Експерти пояснюють чому
У ChatGPT виявлено депресію, а у Gemini — тривожність і аутизм: дослідження
ШІ не пройшли психіатричні тести
Google випустила нейромережу Nano Banana Pro: згенеровані зображення не відрізняються від фото
Реалістичність вражає
Кінець епохи: Ford Focus зняли з виробництва після 27 років на ринку (фото)
Популярна в Україні модель
Експерти підрахували справжню собівартість iPhone 17 Pro Max, який продають за 1200 доларів
В Україні ціна сягає 100 тисяч гривень
Вміє мити посуд та прибирати: у США стартували продажі домашнього робота NEO (відео)
Помічник по дому з безліччю функцій
Водій згорів живцем в електрокарі Xiaomi: розумна система заблокувала двері (відео)
Акції компанії обвалилися на 8,7%