閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

GPT-4.5在SimpleQA測試中,於事實性回答的準確率和幻覺率表現如何?

Answer

GPT-4.5 在 SimpleQA 測試中的事實性回答準確率和幻覺率表現

根據 OpenAI 的 SimpleQA 測試,GPT-4.5 在事實性回答上的準確率為 62.5%,高於 GPT-4o、o1 和 o3-mini。同時,GPT-4.5 的幻覺率為 37.1%,低於 GPT-4o、o1 和 o3-mini。這表示 GPT-4.5 在此測試中是 OpenAI 目前最精準、最少幻覺的模型。這項數據顯示,透過擴展無監督學習,GPT-4.5 在降低幻覺和提升準確性方面有所進步。

GPT-4.5 的技術特性與定位

GPT-4.5 並非推理模型,而是透過無監督學習提升模式識別與內容生成能力。無監督學習使其能夠從原始數據中自行找出規則,提高模型的準確性和直覺,擴大知識範圍並加深對世界的理解,從而降低幻覺。OpenAI 強調,無監督學習與推理能力是 AI 能力發展的兩個互補軸線,而 GPT-4.5 屬於無監督學習的擴展範疇。

GPT-4.5 的市場影響與未來發展

GPT-4.5 被視為 OpenAI 未來更強大 AI 模型(如 GPT-5)的過渡版本,旨在為後續技術鋪路。OpenAI 預計將在未來的 GPT-5 中結合最新的 o3 推理技術,打造整合兩大軸線的 AI 模型。GPT-4.5 的推出也面臨 GPU 短缺的問題,導致其採取分階段釋出模式。為了解決算力需求,OpenAI 正在規劃開發自家 AI 晶片並投資更大規模的數據中心。

你想知道哪些?AI來解答

GPT-4.5 相較於 GPT-4o,在 SimpleQA 測試中的幻覺率降低了多少百分比?

more

GPT-4.5 如何透過無監督學習來提升模式識別與內容生成能力?

more

OpenAI 認為無監督學習與哪種能力是 AI 能力發展的兩個互補軸線?

more

GPT-4.5 的分階段釋出模式主要受到什麼因素的影響?

more

OpenAI 為了解決算力需求,除了開發自家 AI 晶片外,還採取了哪些措施?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
1
like
0
unlike
0
分享給好友
line facebook link