策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 83 篇
Mistral 推出 Voxtral TTS,一款輕量化的多語言文字轉語音模型,聲稱在零樣本語音適應測試中超越 ElevenLabs v2.5 Flash,同時維持低延遲性能,主要瞄準企業級語音代理應用。 核心功能與設計特點 Voxtral...
@MistralAIGoogle DeepMind 團隊針對大型語言模型(LLM)存在的知識斷層問題發布了 Gemini API developer skill。LLM 在特定時間點進行訓練後知識就固定了,而軟體工程領域變化迅速——新程式庫每天都在推出,最佳實...
@_philschmidGoogle 推出「Vibe Coding XR」,一套快速原型製作工作流程,將 Gemini Canvas 與開源的「XR Blocks」框架相結合,讓使用者透過自然語言提示直接生成功能完整、具物理感知能力的 WebXR 應用程式。這套系...
@GoogleResearchGoogle Research 推出 TurboQuant,一種新型向量量化壓縮演算法,可將大型語言模型的 Key-Value cache 記憶縮減至少 6 倍,同時實現高達 8 倍的速度提升,且不損失任何精度。這項技術將於 ICLR 20...
@GoogleResearch隨著人工智慧採用速度加快,開發人員正將 LLM 模型集成到 Agent、內部工具、CI 管道和自動化工作流中,卻往往透過傳遞 LLM 供應商的 API 金鑰來實現。Tailscale 推出的 Aperture 正是為解決由此引發的「金鑰蔓延...
@TailscaleGPT-5.4 在前端開發上的能力顯著提升,但如何向模型提出正確的問題,直接決定了輸出品質。泛型卡片網格和平庸設計並非模型的技術限制,而是缺乏明確指引導致的結果。 模型的預設傾向 GPT-5.4 在訓練資料中見過最常見的模式時會自動採用。這...
@emanueledptTogether AI 發布了 Open Deep Research「開源深度研究」App的 v2 版本,這是一個能夠利用開源大語言模型生成任何主題詳細報告的工具,完全免費且開源。 研究範式轉變 開源深度研究代表了人工智慧與資訊檢索方式的根...
@togethercomputeAviro 推出了 Ebla-1,一個用於企業環境的接地推理模型,並同時發佈了 C⁴ 基準測試。C⁴ 是與 HUD 合作開發的長期任務評估工具,針對企業文件集合設計,評估四個維度:正確性、完整性、組合能力和引用準確度。 基準測試成績 在現有...
@hud_evalsLLMock 是一個開源的確定性模擬大語言模型伺服器,專門用於測試人工智慧應用程式。它解決了開發者在測試時面臨的核心問題:減少真實 API 呼叫的成本,以及避免在持續整合環境中因非確定性輸出導致的測試不穩定。 實用功能 涵蓋多個面向: 真實...
@CopilotKitModular 團隊最近展示了使用 Cursor 和 Claude 協助開發 GPU kernel 的實際案例。他們在單次工作階段中,將 NVIDIA 的 CUTLASS Blackwell conv2d 移植到 Mojo 語言,成果令人矚...
@ModularNvidia推出Nemotron 3 Super,這是一款專為Agent應用設計的開源混合型大語言模型。該模型擁有1200億參數(其中120億為活躍參數),採用Mamba-Transformer混合架構搭配混合專家模組,具備原生百萬toke...
@NVIDIAAIDev