AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 1 篇
Newton-Muon優化器揭示Muon隱含牛頓法本質,並透過修正輸入資料幾何實現更高效LLM訓練。 Weijie Su團隊發布論文「The Newton-Muon Optimizer」(arXiv:2604.01472),證明熱門的...