Microsoft представила искусственный интеллект, который может имитировать любой голос

Microsoft

Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала. 

Подпишитесь на канал Gloss.ua в Telegram.

Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec.

В отличие от других методов преобразования текста, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить свои «знания» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.

Обучение VALL-E проходило на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от 7000 человек.

Публиковать исходный код VALL-E Microsoft не решились — технологию могут использовать в злых целях. В компании также сообщили, что будущие проекты, если они несут потенциальную угрозу злоупотреблений, в открытый доступ попадать не будут.

Читай также

Google выпустила нейросеть Nano Banana Pro: сгенерированные изображения не отличаются от фото

Реалистичность поражает

Конец эпохи: Ford Focus сняли с производства после 27 лет на рынке (фото)

Популярная в Украине модель

Эксперты подсчитали настоящую себестоимость iPhone 17 Pro Max, который продают за 1200 долларов

В Украине цена достигает 100 тысяч гривен

Умеет мыть посуду и убирать: в США стартовали продажи домашнего робота NEO (видео)

Помощник по дому с множеством функций 

Более 1 миллиона пользователей еженедельно делятся с ChatGPT мыслями о суициде

Жуткая статистика

Водитель сгорел заживо в электрокаре Xiaomi: умная система заблокировала двери (видео)

Акции компании обрушились на 8,7 %

Meta представила умные очки Ray-Ban Display: ИИ-функции, экран в линзе и сенсорный браслет (видео)

Впечатляющие характеристики 

Презентация Apple 2025: какие обновления и характеристики получили iPhone 17, Apple Watch и AirPods Pro 3 (фото)

Все главные новинки Apple 2025 и цены на них

OpenAI начнет передавать переписки с ChatGPT в полицию, если обнаружит угрозу

Какие темы могут закончиться звонком из полиции

В сети показали кадры пусков украинской крылатой ракеты «Фламинго»: что известно (видео)

«Это самая успешная ракета, которая у нас есть»