AI 味從哪來？LLM 為何逃不出資料的影子

趁熱打鐵，再來寫一篇對於 LLM 的能力局限討論長文（其實是筆者要出的論文構想被做去了不爽中X）

曾經有人說，現在的 LLM 感覺是人類的影子，也有人說，LLM 輸出的東西，好像沒有特別調整過的話，都有一股 AI 味。另外，探索新的研究主題，好像也有一些局限？

從早期數位工具的脈絡開始

讓我們從比較早期數位工具一些脈絡開始。其實很多方便的應用，看上去有智慧，都要先從機率、統計、關聯、預測做起。比如說輸入法以及候選字，即是預測使用者輸入的下一個字詞。

另外 Spotify 的歌單、Youtube 的影片頻道的推薦、社群網站的貼文，則是收集了許多特徵量化，輸入模型後進行關聯性的機率預測，並透過使用者自身的反饋不斷地強化訓練，所以會越趨同使用者的喜好。

但是這樣的脈絡，會引來一些潛在的問題。有沒有想過為什麼同溫層這麼容易出現？因為這種透過預測關聯的模式，傾向強化比較表層的可見模式，機率較低、數值上較不可能的，會被這一套脈絡推得更遠。再映射至現實一點，那就是更難接觸到與你特質相異、表面偏好不同的群體了——除非你更主動去探索。

但是 LLM 不會主動跟你提示，在現有資料中表層關聯性薄弱差異巨大的新奇主題，這件事情目前是人類本身必須自己主動去想。所以也才有人說，更會問問題的人，更能夠使用 AI 工具。

筆者認為，這本質上就是不停探索看似無關聯無提示的不同主題的能力。甚至筆者認為，這一步，是人工智慧研究如何進行高階決策甚至通用人工智慧的關鍵之一，否則相關性詛咒，還是會繼續存在。

即將展開

為你挑選相似主題

2026/3/17

2026/3/18

趁熱打鐵，再來寫一篇對於 LLM 的能力局限討論長文（其實是筆者要出的論文構想被做去了不爽中X）

2026/3/17