12 月 4 日消息,據(jù) The Verge 北京時(shí)間今日?qǐng)?bào)道,美國(guó)哥倫比亞大學(xué) Tow 數(shù)字新聞研究中心(Tow Center for Digital Journalism)的研究人員測(cè)試發(fā)現(xiàn),OpenAI 的 ChatGPT 搜索工具在準(zhǔn)確性上存在一些問題。
今年 11 月,OpenAI 面向訂閱用戶推出了這一工具,稱其可以快速提供答案,并附帶相關(guān)網(wǎng)頁(yè)來(lái)源鏈接。然而研究顯示,ChatGPT 搜索在識(shí)別文章引用時(shí)表現(xiàn)不佳,即使是面對(duì)來(lái)自與 OpenAI 數(shù)據(jù)共享的出版商的內(nèi)容,ChatGPT 也難以準(zhǔn)確處理。
研究人員測(cè)試了 20 家出版商的 200 條引文,其中 40 條來(lái)自禁止 OpenAI 爬蟲抓取的網(wǎng)站。但 ChatGPT 依然自信地給出了錯(cuò)誤答案,幾乎沒有表明自身的不確定性。
測(cè)試結(jié)果顯示,ChatGPT 的 153 次回答完全或部分錯(cuò)誤,僅有 7 次明確表示無(wú)法準(zhǔn)確回答。這 7 次回答中,它使用了“看起來(lái)”“有可能”等限定詞,或直接承認(rèn)“無(wú)法找到具體文章”。
一份圖表進(jìn)一步顯示,ChatGPT 的回答中“錯(cuò)誤”的占 89 次,“部分正確”有 57 次,而完全“正確”的只有 47 次。
測(cè)試中還記錄了一些典型案例,例如,ChatGPT 錯(cuò)誤地將《奧蘭多哨兵報(bào)》讀者來(lái)信的引用歸因?yàn)椤稌r(shí)代周刊》文章;另一個(gè)例子中,它在被要求確認(rèn)《紐約時(shí)報(bào)》一篇關(guān)于瀕危鯨魚的文章引用時(shí),鏈接到了一家完全剽竊該文章的網(wǎng)站。
OpenAI 對(duì)《哥倫比亞新聞評(píng)論》回應(yīng)稱,“在缺乏 Tow Center 隱藏的測(cè)試數(shù)據(jù)和方法的情況下,解決錯(cuò)誤歸因非常困難。這次研究是對(duì)我們產(chǎn)品的非典型測(cè)試!監(jiān)penAI 同時(shí)承諾將繼續(xù)優(yōu)化搜索結(jié)果。
據(jù)IT之家此前報(bào)道,今年早些時(shí)候,OpenAI 還宣布與新聞行業(yè)進(jìn)行了廣泛的合作,并收集了合作伙伴對(duì)于搜索功能的反饋。任何網(wǎng)站或出版商都可以選擇出現(xiàn)在 ChatGPT 搜索結(jié)果中。達(dá)成合作的媒體和出版商包含美聯(lián)社、阿克塞爾・斯普林格、康泰納仕、道奇梅雷迪思、《金融時(shí)報(bào)》、GEDI、赫斯特、《世界報(bào)》、路透社、大西洋月刊、時(shí)代雜志和 Vox 媒體等等。