Microsoft представила штучний інтелект, який може імітувати будь-який голос

Microsoft

Компанія Microsoft представила штучний інтелект VALL-E, який здатний імітувати будь-який людський голос на основі прикладу тривалістю всього три секунди. При цьому голос імітується достовірно, зі збереженням як тембру, так і емоційного забарвлення оригіналу.

Підпишіться на канал Gloss.ua у Telegram.

Сама Microsoft називає VALL-E «мовною моделлю нейронного кодека». Розробка спирається на технології EnCodec.

На відміну від інших методів перетворення тексту, які часто синтезують мову, маніпулюючи формами сигналів, розробка Microsoft в основному аналізує, як саме звучить людина, розбиває цю інформацію на окремі «токени» та використовує навчальні дані, щоб зіставити свої «знання» про те, як цей голос звучатиме, якщо ІІ вимовить інші фрази.

Навчання VALL-E проходило на бібліотеці LibriLight, що містить 60 000 годин англомовної мови від 7000 людей.

Публікувати вихідний код VALL-E Microsoft не наважилися - технологію можуть використовувати з лихою метою. У компанії також повідомили, що майбутні проекти, якщо вони несуть потенційну загрозу зловживань, у відкритий доступ не потраплятимуть.

Читай також

Google випустила нейромережу Nano Banana Pro: згенеровані зображення не відрізняються від фото

Реалістичність вражає

Кінець епохи: Ford Focus зняли з виробництва після 27 років на ринку (фото)

Популярна в Україні модель

Експерти підрахували справжню собівартість iPhone 17 Pro Max, який продають за 1200 доларів

В Україні ціна сягає 100 тисяч гривень

Вміє мити посуд та прибирати: у США стартували продажі домашнього робота NEO (відео)

Помічник по дому з безліччю функцій

Понад 1 мільйон користувачів щотижня діляться з ChatGPT думками про суїцид

Моторошна статистика

Водій згорів живцем в електрокарі Xiaomi: розумна система заблокувала двері (відео)

Акції компанії обвалилися на 8,7%

Meta представила розумні окуляри Ray-Ban Display: ШІ-функції, екран у лінзі і сенсорний браслет (відео)

Вражаючі характеристики

Презентація Apple 2025: які оновлення та характеристики отримали iPhone 17, Apple Watch та AirPods Pro 3 (фото)

Всі головні новинки Apple 2025 та ціни на них

OpenAI почне передавати листування з ChatGPT до поліції, якщо виявить загрозу

Які теми можуть закінчитися дзвінком із поліції

У мережі показали кадри пусків української крилатої ракети "Фламінго": що відомо (відео)

«Це найуспішніша ракета, яка в нас є»