策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 9 篇
AC/DC透過共同演化小規模專家LLM群體,超越單一大型模型如GPT-4o。 AC/DC核心概念 Assessment Coevolving w/ Diverse Capabilities (AC/DC) 是一種持續共同演化的方...
@BorisMeinardusOpenAI推出「GPT-Rosalind」,專為生物學、藥物發現與轉譯醫學優化的前沿推理模型。 OpenAI於2026年4月16日發布「GPT-Rosalind」,這是其生命科學模型系列首發,針對科學工作流程優化,強化化學、蛋白質工...
@OpenAIEvoForge:擴展演化式 Harness 優化 為什麼只優化一個 harness,而不試著同時優化多個呢?這就是 EvoForge:一個演化式 harness 優化器。 在 TerminalBench 2.0 測試中...
@leonardtang_OpenAI擴大「Trusted Access for Cyber (TAC)」計畫至數千名驗證防禦者與數百團隊,並推出專為網路防禦微調的GPT-5.4-Cyber模型。 OpenAI於2026年4月14日宣布擴大「Trusted A...
@thsottiauxGPT 5.4 Pro 的競爭力顯示 OpenAI 下一代旗艦模型將超越 Mythos。 儘管市場焦點多集中於 Mythos 的強勢表現,但數據顯示 GPT 5.4 Pro 在現有評測基準上已展現出極高的競爭力,這預示著 OpenAI...
@chatgpt21Hearth AI 創辦人 Ashe 分享 Agentic 工作流與開發哲學。 Hearth AI 創辦人 Ashe Magalhaes 在訪談中分享了她從 ML 工程師轉型為創業者的歷程,強調在 AI 時代,開發者應將 Agent ...
@OpenAIDevsOpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文,展示其內部模型成功解決了五項數學界的「Erdős 問題」,證明 AI 在處理複雜數學推論上的進展。 研究成果與亮點 這篇論文(編號...
@mehtaab_sawhneyOpenAI 負責模型行為與 GPT-4o 及 4.5 個性設計的 Joanne Jang 宣布離職。 OpenAI 負責打造模型行為及設計 GPT-4o 與 4.5 個性的關鍵人物 Joanne Jang,近日透過 Slack 宣布...
@etnshowGPT-5.4 在前端開發上的能力顯著提升,但如何向模型提出正確的問題,直接決定了輸出品質。泛型卡片網格和平庸設計並非模型的技術限制,而是缺乏明確指引導致的結果。 模型的預設傾向 GPT-5.4 在訓練資料中見過最常見的模式時會自動採用。這...
@emanueledpt