RunAnywhere 推出的 RCLI 是一套完整的本地AI語音解決方案,在 macOS 上運行
RunAnywhere 推出的 RCLI 是一套完整的本地AI語音解決方案,在 macOS 上運行,聲稱為語音 AI 的未來。該專案採用端到端的語音加檢索增強生成(RAG)流程,聲稱延遲約 131 毫秒,主要特色是完全本地化、開源免費,並承諾使用者資料永久隱私保護。
完整語音流程 方面,RCLI 採用語音轉文字、大型語言模型與文字轉語音的完整 pipeline,在 Apple Silicon 的 Metal GPU 上原生運行。系統支援 38 個 macOS 動作,可透過聲音或文字控制,包括:
- 生產力工具
- 通訊
- 媒體播放
- 系統設定
- 網頁搜尋
軟體無需雲端服務或 API 金鑰,所有運算都在裝置上完成。
MetalRT 引擎 是核心優勢,這是 RunAnywhere 開發的專有 GPU 推論引擎,針對 Apple Silicon 最佳化。根據基準測試,MetalRT 的解碼速度比 llama.cpp 和 Apple MLX 更快。聲音活動偵測使用 Silero,語音轉文字支援 Zipformer 流式與 Whisper 或 Parakeet 離線模式,大型語言模型支援 Qwen3、LFM2 等,文字轉語音則提供多款選擇,包括 Kokoro 提供 28 種聲音。
RAG 本地文件 功能允許使用者索引本地文件,透過語音提問,使用混合向量與 BM25 檢索方式,延遲約 4 毫秒,支援 PDF、DOCX 及純文本格式。安裝則相當簡化,透過單一指令或 Homebrew 即可完成,首次設定需下載約 1GB 的預設模型。
硬體限制 方面,MetalRT 引擎需要 M3 或更新的 Apple Silicon 晶片。M1 與 M2 Mac 會自動回退到開源的 llama.cpp 引擎,這限制了適用範圍。軟體提供互動式終端介面,支援推放式通話、即時硬體監控、模型管理及動作瀏覽器功能。
授權與社群 方面,安裝相當直接,可透過 curl 指令或 Homebrew 進行。軟體本身採 MIT 授權開源,但 MetalRT 引擎採專有授權,由 RunAnywhere 公司所有。文件強調這是實時螢幕錄製展示,未經編輯或 cloud 處理,試圖驗證其本地運行的聲稱。專案允許社群貢獻,支援新增動作、模型或聲音。整體而言,RCLI 針對希望完全本地化、隱私優先的語音 AI 使用者,提供了具體的技術方案,雖然硬體要求與 MetalRT 的專有性質可能限制其採用範圍。
We built the future of voice AI on your Mac. RCLI is here @RunAnywhereAI!
— Sanchit monga (@sanchitmonga22) March 7, 2026
Our optimized end-to-end voice + RAG pipeline: talk → instant control + doc answers, ~131ms latency,
- all LOCAL
- all OPEN SOURCE
- all FREE.
43 actions, no cloud, your data forever private.
Siri:… https://t.co/EdIXfjN8YB pic.twitter.com/HfyospgmR5
— Sanchit monga (@sanchitmonga22) March 7, 2026
