Microsoft представила искусственный интеллект, который может имитировать любой голос

Microsoft
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.
Подпишитесь на канал Gloss.ua в Telegram.
Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec.
В отличие от других методов преобразования текста, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить свои «знания» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.
Обучение VALL-E проходило на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от 7000 человек.
Публиковать исходный код VALL-E Microsoft не решились — технологию могут использовать в злых целях. В компании также сообщили, что будущие проекты, если они несут потенциальную угрозу злоупотреблений, в открытый доступ попадать не будут.
Читай также
Дом на колесах будущего: Chery показали фургон для длительных путешествий (фото, видео)
Впечатляющий функционал
Лучшие автомобили года по версии Consumer Reports: топ-10 моделей
Subaru и Toyota доминируют в списке
Meta создала устройство, которое читает мысли: Brain2Qwerty превращает мысли в текст (фото)
Почему технология не станет доступной для продажи
В Украине запустят онлайн-магазин, где военные с помощью "е-баллов" смогут купить БПЛА
Беспилотники, средства связи, запчасти и другое
Tesla отзывает более 375 тысяч автомобилей, выпущенных в 2023 году: причина
Компания-лидер по числу машин с дефектами
Маск может в любой момент отключить "Старлинк" для ВСУ: чем это грозит фронту
Военным нужно быть готовыми
Apple представила iPhone 16E — самый доступный смартфон в линейке компании (видео)
Основные функции нового «SE»