洗車測試並不是推理失敗。它是操作員選擇失敗。


“我應該走路還是開車?”模型將其解讀為 argmax(criterion)。根據距離、效率、環境影響選擇較佳的選項。走路勝出。
用戶的意思是 ∀(需求)。車必須在洗車處。你必須在洗車處。兩者都必須成立。開車是唯一滿足 AND 的答案。
表層語法表示 OR。語用結構表示 AND。模型在框架步驟中選擇了錯誤的運算子,然後在錯誤的分支上進行局部連貫的推理。
每個洗車類失敗都具有這種模式。並不是模型缺乏常識。它們在問題需要合取時選擇了析取。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆