مدل جدید هوش مصنوعی تبدیل متن به گفتار
مهر: یک مدل هوش مصنوعی ابداع شده که با کلیپ چندثانیهای از صدای فرد آن را شبیهسازی میکند. به نقل از رجیستر، یک استارتآپ آمریکایی به نام Zyphra از یک مدل هوش مصنوعی متن به گفتار (TTS) رونمایی کرده که میتواند با دریافت نمونه صوتی ۵ثانیهای از فرد، صدای او را شبیهسازی کند.

دنی مارتینلی و کریتیک پوتالات این استارتآپ را در ۲۰۲۱ میلادی با هدف ساخت یک سیستمعامل چند حالتی به نام MaiaOS راهاندازی کردند. نتیجه این تلاشها به شکل عرضه خانواده مدلهای زبانی کوچک Zamba و اکنون عرضه مدلهای متن به گفتار Zonos نمایش داده شده است. هر یک از این مدلها ۱.۶میلیارد پارامتر دارند و براساس ۲۰۰ هزار ساعت داده گفتاری شامل حرف زدن با لحن صدای خنثی مانند خوانش کتاب صوتی و همچنین گفتار با لحن احساسی آموزش دیدند.