央視新聞客戶端報道 北京時間14日凌晨,OpenAI公司在美國加州舉辦新品發(fā)布會,推出一款名為GPT-4o(歐)的人工智能模型。公司表示,新模型具備“聽、看、說”的出色本領。發(fā)布會上,OpenAI公司展示了新模型的多個應用場景。
據(jù)介紹,GPT-4o(歐)的“o”源自拉丁語,意思是“全能”(字幕:omni,全能),新模型能夠處理50種不同的語言,提高了速度和質(zhì)量,并能夠讀取人的情緒。
新模型可以在最短232毫秒對音頻輸入做出反應,與人類在對話中的反應時間相近。即使對話被打斷,新模型也可以做出自然反應。這是此前人工智能語音聊天機器人做不到的。
圖像輸入方面,研究人員啟動攝像頭,要求實時完成一道方程題,新模型輕松完成了任務;研究人員還展示了它對一張氣溫圖表進行實時解讀的能力。
OpenAI公司研究人員 巴雷特:ChatGPT,我正在和你分享這張圖表。你能否用非常簡短的一句話概括你所看到的?
人工智能模型GPT-4o:這張圖表顯示了2018年全年的平均、最低和最高溫度。一個明顯的注釋顯示,9月下旬曾下過一場大雨。
評論