每經(jīng)編輯 杜宇
當(dāng)?shù)貢r間周二(8月15日),人工智能研究公司OpenAI在官網(wǎng)稱,其開發(fā)了一種使用GPT-4進(jìn)行內(nèi)容審核的解決方案,有望減輕人工審核員的負(fù)擔(dān)。
圖片來源:OpenAI官網(wǎng)
OpenAI表示,將GPT-4用于內(nèi)容策略開發(fā)和內(nèi)容審核決策,從而實(shí)現(xiàn)更一致的標(biāo)記、更快的策略優(yōu)化反饋循環(huán),以及減少人工審核人員的參與。
OpenAI稱,內(nèi)容審核在維持?jǐn)?shù)字平臺的健康方面發(fā)揮著至關(guān)重要的作用。使用GPT-4的內(nèi)容審核系統(tǒng)可以更快地迭代策略更改,將周期從幾個月縮短到幾個小時。GPT-4還能夠解釋長內(nèi)容策略文檔中的規(guī)則和細(xì)微差別,并立即適應(yīng)策略更新,從而實(shí)現(xiàn)更一致的標(biāo)記。
OpenAI相信,這為數(shù)字平臺的未來提供了一個更積極的愿景,在數(shù)字平臺上,人工智能可以根據(jù)特定平臺的政策幫助調(diào)節(jié)在線流量,并減輕大量人類版主的心理負(fù)擔(dān)。任何擁有OpenAI API訪問權(quán)限的人都可以實(shí)現(xiàn)這種方法來創(chuàng)建自己的人工智能輔助審核系統(tǒng)。
OpenAI一直在測試該技術(shù),并邀請客戶也進(jìn)行試驗(yàn)。OpenAI表示,其工具有望幫助企業(yè)在一天左右的時間內(nèi),就完成原本需要六個月才能做完的工作。
內(nèi)容審核需要細(xì)致的努力、敏感度、對上下文的深刻理解,以及對新用例的快速適應(yīng),這使得它既耗時又具有挑戰(zhàn)性。傳統(tǒng)上,這項(xiàng)任務(wù)的負(fù)擔(dān)落在了人類主持人身上,他們在較小的垂直特定機(jī)器學(xué)習(xí)模型的支持下,篩選大量內(nèi)容,過濾出有毒有害的材料。這個過程本身就很慢,可能會給人類調(diào)節(jié)者帶來心理壓力。
OpenAI表示,我們正在探索使用LLM來應(yīng)對這些挑戰(zhàn)。我們的大型語言模型,如GPT-4,可以理解并生成自然語言,使其適用于內(nèi)容審核。模型可以根據(jù)提供給它們的政策指導(dǎo)方針做出適度的判斷。
有了這個系統(tǒng),開發(fā)和定制內(nèi)容策略的過程從幾個月縮短至幾個小時。一旦制定了政策指南,政策專家就可以通過識別少量示例并根據(jù)政策為其分配標(biāo)簽來創(chuàng)建一組黃金數(shù)據(jù)。然后,GPT-4讀取策略并為同一數(shù)據(jù)集分配標(biāo)簽,但看不到答案。
通過檢查GPT-4的判斷與人類判斷之間的差異,政策專家可以要求GPT-4提出標(biāo)簽背后的推理,分析政策定義中的歧義,解決困惑,并相應(yīng)地在政策中提供進(jìn)一步的澄清。我們可以重復(fù)步驟操作,直到我們對政策質(zhì)量感到滿意為止。
這個迭代過程產(chǎn)生了精細(xì)的內(nèi)容策略,這些策略被轉(zhuǎn)換為分類器,從而能夠大規(guī)模部署策略和內(nèi)容審核。
在審核能力上,OpenAI承認(rèn)GPT-4的標(biāo)記質(zhì)量與經(jīng)過輕度訓(xùn)練的人類審核員相似,但與經(jīng)驗(yàn)豐富、訓(xùn)練有素的人類審核員相比仍有差距。對此,OpenAI強(qiáng)調(diào),審核的過程不應(yīng)該完全自動化。
值得注意的是,OpenAI的工具并不是該領(lǐng)域第一個引入人工智能的先行者。早于2017年,谷歌的技術(shù)團(tuán)隊(duì)就開發(fā)了一個基于AI的內(nèi)容審核API,名為“Perspective”,已經(jīng)被多家媒體組織所使用。
但即使如此,一些企業(yè)仍選擇將審核工作外包給其他人力公司來節(jié)省成本。
OpenAI稱,其最新的內(nèi)容審核系統(tǒng)為數(shù)字平臺的未來提供了一個更積極的愿景,即AI可以根據(jù)平臺特定的政策減輕大量人工審核人員的精神負(fù)擔(dān)。公司還透露,已經(jīng)有一些客戶在使用這一流程。
每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、第一財(cái)經(jīng)、財(cái)聯(lián)社
封面圖片來源:視覺中國(16.940, -0.33, -1.91%)-VCG111419382557