GPT-4.5在SimpleQA測試中,於事實性回答的準確率和幻覺率表現如何?
Answer
GPT-4.5 在 SimpleQA 測試中的事實性回答準確率和幻覺率表現
根據 OpenAI 的 SimpleQA 測試,GPT-4.5 在事實性回答上的準確率為 62.5%,高於 GPT-4o、o1 和 o3-mini。同時,GPT-4.5 的幻覺率為 37.1%,低於 GPT-4o、o1 和 o3-mini。這表示 GPT-4.5 在此測試中是 OpenAI 目前最精準、最少幻覺的模型。這項數據顯示,透過擴展無監督學習,GPT-4.5 在降低幻覺和提升準確性方面有所進步。
GPT-4.5 的技術特性與定位
GPT-4.5 並非推理模型,而是透過無監督學習提升模式識別與內容生成能力。無監督學習使其能夠從原始數據中自行找出規則,提高模型的準確性和直覺,擴大知識範圍並加深對世界的理解,從而降低幻覺。OpenAI 強調,無監督學習與推理能力是 AI 能力發展的兩個互補軸線,而 GPT-4.5 屬於無監督學習的擴展範疇。
GPT-4.5 的市場影響與未來發展
GPT-4.5 被視為 OpenAI 未來更強大 AI 模型(如 GPT-5)的過渡版本,旨在為後續技術鋪路。OpenAI 預計將在未來的 GPT-5 中結合最新的 o3 推理技術,打造整合兩大軸線的 AI 模型。GPT-4.5 的推出也面臨 GPU 短缺的問題,導致其採取分階段釋出模式。為了解決算力需求,OpenAI 正在規劃開發自家 AI 晶片並投資更大規模的數據中心。