OpenAI представила инструмент, полноценно клонирующий голос: Voice Engine достаточно 15-секундного семпла
OpenAI объявила о запуске нового инструмента под названием Voice Engine. Это технология клонирования голоса, которая позволяет имитировать речь любого человека после анализа 15-секундного аудиосэмпла. Компания заявляет, что Voice Engine генерирует «естественно звучащую речь» с «эмоциональными и реалистичными голосами».
Источник: Andrew Neel / UnsplashОсновой для этой технологии послужило уже существующее API преобразования текста в речь, которое OpenAI разрабатывает с 2022 года. Компания уже использует этот инструмент для поддержки голосов, доступных в текущей версии API преобразования текста в речь, а также для функции чтения вслух. В официальном блоге компании можно найти множество примеров, которые звучат очень близко к реальным голосам.
OpenAI считает, что Voice Engine может быть полезным инструментом для чтения, языкового перевода и помощи людям с речевыми нарушениями. В рамках пилотного проекта совместно с Браунским Университетом компания использовала Voice Engine для помощи …