策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 5 篇
TTS
熱度
排序
𝕏🔥
AI 語音應用 SUN 正式對外開放,宣告音訊內容從「搜尋」轉向「生成」的新時代。 SUN 應用程式正式對外開放,該專案在 a16z 的 Speedrun 加速器計畫中孵化,旨在徹底改變使用者獲取音訊內容的方式。 核心變革 音...
@ArtinBogdanov♥213🔁 22
𝕏🔥
OpenBMB 發布 VoxCPM2:無需 token 的多語言語音生成模型。 OpenBMB 推出的 VoxCPM2 是一款具備 20 億參數的無 token 擴散自回歸語音生成模型,支援 30 種語言並提供 48kHz 的高品質音...
@AdinaYakup♥247🔁 35
𝕏🔥
微軟發布三款 MAI 模型,以高效能與高性價比搶攻開發者市場。 微軟於 2026 年 4 月 2 日宣布推出三款全新的「MAI」系列模型,並同步開放於「Microsoft Foundry」與「MAI Playground」供開發者使用...
@satyanadella♥1.8k🔁 275
𝕏🔥
OmniVoice 是由「Kaldi」之父 Daniel Povey 團隊推出的零樣本多語言 TTS 模型。 這款由小米團隊開發的「OmniVoice」模型,採用創新的擴散語言模型架構,支援超過 600 種語言,並透過單階段架構實現了...
@FeitengLi♥310🔁 58
𝕏🔥
開發者公開了一個 macOS 語音輸入應用的完整源碼及構建過程,並明確強調可重現性,反駁了外界對該專案「玩抽象」的質疑。 應用功能概述 「VoiceInput」是一款 macOS 選單列應用程式,運用 Apple 內建的語音識別框架實現即時...
@yetone♥218🔁 15