1 月 27 日消息,OpenAI 近日發(fā)布新聞稿,在更新 GPT-4 Turbo 預(yù)覽模型之外,還下調(diào) API 調(diào)用價(jià)格,優(yōu)化現(xiàn)有模型性能,并發(fā)布全新嵌入性模型。
OpenAI 今天一口氣宣布了 5 個(gè)新模型,包括兩個(gè)文本嵌入模型、升級(jí)的 GPT-4 Turbo 預(yù)覽版和 GPT-3.5 Turbo、一個(gè)審核模型。
更新 GPT-4 Turbo 預(yù)覽模型
OpenAI 根據(jù)開(kāi)發(fā)者對(duì)早期預(yù)覽版的反饋,發(fā)布了 gpt-4-0125-preview 預(yù)覽模型,重點(diǎn)修復(fù)了模型的“變懶”情況,能更徹底地完成代碼生成等任務(wù)。
新預(yù)覽版還改善了對(duì)非英語(yǔ)生成問(wèn)題的支持,引入“gpt-4-turbo-preview”模型別名,可自動(dòng)指向最新的預(yù)覽版。
OpenAI 還計(jì)劃在未來(lái)幾個(gè)月內(nèi)全面推出帶有視覺(jué)功能的 GPT-4 Turbo。
定價(jià)更低的新嵌入模型
OpenAI 還引入了兩種新的嵌入模式,一種是體積更小、效率更高的 text-embedding-3-small 模型,另一種是體積更大、功能更強(qiáng)的 text-embedding-3-large 模型。
嵌入(embedding)是表示自然語(yǔ)言或代碼等內(nèi)容中概念的數(shù)字序列。機(jī)器學(xué)習(xí)模型和其他算法通過(guò)嵌入,可以更容易理解內(nèi)容之間的關(guān)聯(lián),也更容易執(zhí)行聚類或檢索等任務(wù)。
ChatGPT 和 Assistants API 中的知識(shí)檢索等應(yīng)用,以及許多檢索增強(qiáng)生成(RAG)開(kāi)發(fā)工具都使用到了嵌入這個(gè)概念。
text-embedding-3-small
相比較 2022 年 12 月發(fā)布的 text-embedding-ada-002 模型,text-embedding-3-small 性能和效率大幅提升。
性能方面,text-embedding-3-small 在多語(yǔ)言檢索常用基準(zhǔn)(MIRACL)的平均得分從 31.4% 提高到 44.0%,而英語(yǔ)任務(wù)常用基準(zhǔn)(MTEB)的平均得分從 61.0% 提高到 62.3%。
定價(jià)方面,text-embedding-3-small 的定價(jià)是 text-embedding-ada-002 的五分之一,從每 1k token 0.0001 美元降至 0.00002 美元。
text-embedding-3-large
text-embedding-3-large 是 OpenAI 新推出的性能最佳的模型。將 text-embedding-ada-002 與 text-embedding-3-large 進(jìn)行比較:在 MIRACL 上,平均得分從 31.4% 提高到 54.9%,而在 MTEB 上,平均得分從 61.0% 提高到 64.6%。
text-embedding-3-large 的價(jià)格為每 1k token 售價(jià) 0.00013 美元。
原生支持 shortening
允許開(kāi)發(fā)人員以降低存儲(chǔ)和計(jì)算需求來(lái)?yè)Q取一定的準(zhǔn)確性。簡(jiǎn)單地說(shuō),保持主旨不變的情況下,shortening 就像從一個(gè)復(fù)雜的標(biāo)簽中去掉一些不那么重要的細(xì)節(jié)。
GPT-3.5 Turbo
在 API 領(lǐng)域,GPT-3.5 Turbo 同樣表現(xiàn)不俗。在執(zhí)行各類任務(wù)時(shí),它不僅能夠提供比 GPT-4 更低的成本,還能保證更快的執(zhí)行速度。
因此,對(duì)于那些付費(fèi)用戶來(lái)說(shuō),此次輸入價(jià)格下調(diào) 50%、輸出價(jià)格下調(diào) 25% 無(wú)疑是一大利好。
具體來(lái)說(shuō),新的輸入價(jià)格定格在每 1k token 價(jià)格為 0.0005 美元,而輸出價(jià)格則為每 1k token 價(jià)格為 0.0015 美元。