GPT-4.5在SimpleQA測試中，於事實性回答的準確率和幻覺率表現如何？

Answer

GPT-4.5 在 SimpleQA 測試中的事實性回答準確率和幻覺率表現

根據 OpenAI 的 SimpleQA 測試，GPT-4.5 在事實性回答上的準確率為 62.5%，高於 GPT-4o、o1 和 o3-mini。同時，GPT-4.5 的幻覺率為 37.1%，低於 GPT-4o、o1 和 o3-mini。這表示 GPT-4.5 在此測試中是 OpenAI 目前最精準、最少幻覺的模型。這項數據顯示，透過擴展無監督學習，GPT-4.5 在降低幻覺和提升準確性方面有所進步。

GPT-4.5 的技術特性與定位

GPT-4.5 並非推理模型，而是透過無監督學習提升模式識別與內容生成能力。無監督學習使其能夠從原始數據中自行找出規則，提高模型的準確性和直覺，擴大知識範圍並加深對世界的理解，從而降低幻覺。OpenAI 強調，無監督學習與推理能力是 AI 能力發展的兩個互補軸線，而 GPT-4.5 屬於無監督學習的擴展範疇。

GPT-4.5 的市場影響與未來發展

GPT-4.5 被視為 OpenAI 未來更強大 AI 模型（如 GPT-5）的過渡版本，旨在為後續技術鋪路。OpenAI 預計將在未來的 GPT-5 中結合最新的 o3 推理技術，打造整合兩大軸線的 AI 模型。GPT-4.5 的推出也面臨 GPU 短缺的問題，導致其採取分階段釋出模式。為了解決算力需求，OpenAI 正在規劃開發自家 AI 晶片並投資更大規模的數據中心。

觀看原始文章