不久前,OpenAI召開發(fā)布會(huì),在時(shí)長僅有半小時(shí)發(fā)布會(huì)上,它不僅推出更新了ChatGPT桌面版與網(wǎng)頁端的UI,還推出了新的大模型GPT-4o,該模型可以對(duì)文字、音頻以及圖像任意混合內(nèi)容進(jìn)行推理,生成的新內(nèi)容,而且還免費(fèi)。
GPT-4o中的“o”代表“omni”,源自于拉丁語“omnis”,意為全能,它能夠?qū)ξ淖?、音頻以及圖像任意混合內(nèi)容任意內(nèi)容進(jìn)行推理,并生成文字、音頻以及圖像不同形式內(nèi)容,只欠缺視頻內(nèi)容,但是已經(jīng)是獨(dú)領(lǐng)風(fēng)騷。
除了推理更為復(fù)雜的內(nèi)容,GPT-4o效能表現(xiàn)也相當(dāng)出色,尤其是音頻,它最快可以在232毫秒時(shí)間內(nèi)對(duì)用戶輸入語音進(jìn)行反應(yīng),平均反應(yīng)時(shí)間為320毫秒,與人們?nèi)粘?duì)話的反應(yīng)時(shí)間相差無幾,而且能夠隨時(shí)打斷、開始對(duì)話,識(shí)別對(duì)話人的語氣、情緒,還支持包括中文、日語在內(nèi)的20種語言進(jìn)行音頻等多模態(tài)交互,因此能夠勝任實(shí)時(shí)翻譯工作。根據(jù)OpenAI官方提供的數(shù)據(jù),GPT-4o效率近乎全面優(yōu)于GPT-4 Turbo,更別說免費(fèi)的GPT-3.5。
GPT-4o如此強(qiáng)大,相信大家會(huì)認(rèn)為它收費(fèi)不便宜,目前OpenAI政策是用戶能夠免費(fèi)使用GPT-4o,但是有使用次數(shù)限制,一旦超出限制后會(huì)自動(dòng)降級(jí)到基于GPT-3.5的ChatGPT,若是用戶付費(fèi)的話將獲得免費(fèi)用戶的5倍使用次數(shù)。
GPT-4o問世無疑再一次確保OpenAI在生成式AI技術(shù)的領(lǐng)導(dǎo)地位,也給國內(nèi)同行巨大壓力,不知國內(nèi)什么時(shí)候有對(duì)標(biāo)產(chǎn)品出現(xiàn)呢?