策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。5

TTS
熱度
排序
𝕏🔥

AI 語音應用 SUN 正式對外開放,宣告音訊內容從「搜尋」轉向「生成」的新時代。 SUN 應用程式正式對外開放,該專案在 a16z 的 Speedrun 加速器計畫中孵化,旨在徹底改變使用者獲取音訊內容的方式。 核心變革 音...

Artin Bogdanov@ArtinBogdanov
213🔁 22
𝕏🔥

OpenBMB 發布 VoxCPM2:無需 token 的多語言語音生成模型。 OpenBMB 推出的 VoxCPM2 是一款具備 20 億參數的無 token 擴散自回歸語音生成模型,支援 30 種語言並提供 48kHz 的高品質音...

Adina Yakup@AdinaYakup
247🔁 35
𝕏🔥

微軟發布三款 MAI 模型,以高效能與高性價比搶攻開發者市場。 微軟於 2026 年 4 月 2 日宣布推出三款全新的「MAI」系列模型,並同步開放於「Microsoft Foundry」與「MAI Playground」供開發者使用...

Satya Nadella@satyanadella
1.8k🔁 275
𝕏🔥

OmniVoice 是由「Kaldi」之父 Daniel Povey 團隊推出的零樣本多語言 TTS 模型。 這款由小米團隊開發的「OmniVoice」模型,採用創新的擴散語言模型架構,支援超過 600 種語言,並透過單階段架構實現了...

Feiteng@FeitengLi
310🔁 58
𝕏🔥

開發者公開了一個 macOS 語音輸入應用的完整源碼及構建過程,並明確強調可重現性,反駁了外界對該專案「玩抽象」的質疑。 應用功能概述 「VoiceInput」是一款 macOS 選單列應用程式,運用 Apple 內建的語音識別框架實現即時...

yetone@yetone
218🔁 15