策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 700 篇
HermesOS公開路圖,打造無基礎設施AI Agent託管平台。 HermesOS是受管理的AI Agent託管平台,讓使用者在5分鐘內部署持久自主Agent,無需Docker、VPS或配置檔案。平台基於Nous Research的...
@Wayland_SixKohakuTerrarium 1.0.0 發布,提供通用 Agent 框架,避免重複重建底層架構。 KohakuTerrarium 是專為建構 Agent 而設計的框架,而非另一個 Agent 產品,它解決 LLM/Agent 領域...
@KBlueleaf克服 TRL 中訓練器與生成器之間的精度不匹配問題 數值精度差異導致的「幻影 PPO 裁剪」阻礙了 RL 收斂。 簡短總結:我們發現當訓練的前向傳遞(FP32)與 vLLM 推論伺服器(BF16)使用不同的數值精度時,非同步 G...
@DirhousssiAmineLiteParse快速竄紅並正式加入LlamaIndex生態。 「LiteParse」僅數週內GitHub星數突破4.3K,現正式融入LlamaIndex生態,並擁有專屬頁面(http://www.llamaindex.ai/lite...
@llama_indexParcae透過穩定循環架構實現參數效率提升,達到兩倍Transformer品質。 Parcae是新型穩定循環語言模型,透過層循環增加FLOPs而不擴大參數,解決傳統Transformer在邊緣裝置上記憶體開銷暴增的問題。研究發現,在...
@hayden_prairie一篇新論文揭露ChatGPT使用者普遍犯下的「LLM Fallacy」認知錯誤,使用者誤將LLM輔助產出視為自身獨立能力證明。 這篇論文《The LLM Fallacy: Misattribution in AI-Assisted C...
@ihtesham2005Anthropic「Claude Opus 4.7」系統提示更新,強化工具整合與安全防護,減少冗長回應。 Anthropic 是唯一公開使用者端聊天系統提示詞的主要人工智慧實驗室,其系統提示檔案自 2024 年 7 月「Claude ...
@simonwClaude Code 駭客松「Built with Opus 4.7」重啟,總獎金10萬美元API點數。 活動總覽 「Built with Opus 4.7」是Claude Code虛擬駭客松,由Cerebral Valley...
@claudeai深度層通訊從累加升級為檢索,MoDA透過硬體優化實現高效深度注意力。 過去十年,人工智慧模型架構的第一階段專注擴大層內運算規模,但層間通訊機制幾乎停滯於2015年ResNet的「x + F(x)」殘差連接,導致訊號稀釋與許多層「學會沉...
@lianghui_zhu50個企業已部署的AI自動化清單,涵蓋銷售到財務,提供具體功能與實測影響。 這份清單彙整50項真實企業已上線運行的AI自動化,非理論構想,而是實際部署案例,按部門分類,每項詳述功能、運作方式及企業回報的量化影響。若你經營企業,可依痛點...
@eng_khairallah1LLM工程師必讀12篇論文精選。 這份清單彙整人工智慧領域12篇奠基性論文,涵蓋從Transformer架構到模型對齊的關鍵進展,每篇皆由作者解讀其核心洞見,強調對現代大型語言模型(LLM)的實務影響。 Transformer革...
@amitiitbhu別再懶惰了,快用 Routines 自動化你的工作 大多數人認為 Claude 是一個讓你與之對話的工具,但現在它已經進化成一個你可以部署的對象。 Anthropic 悄悄推出了一項徹底改變你對 AI 看法的功能,它叫做 Rou...
@defileo