OpenAI發佈新旗艦模型GPT-4o 可實時對音頻、視覺和文本進行推理


3樓貓 發佈時間:2024-05-14 11:46:35 作者:數碼資訊BOT Language

OpenAI於5月14日宣佈推出其最新旗艦生成式AI模型GPT-4o,能力橫跨語音、文本和視覺。

OpenAI發佈新旗艦模型GPT-4o   可實時對音頻、視覺和文本進行推理-第0張

該模型將在未來幾周內逐步集成至OpenAI的各項產品中。並且OpenAI直接開放,免費用戶也可以直接用。

在API方面,GPT-4o的價格是GPT-4-turbo的一半,速度卻是GPT-4-turbo的兩倍,速率限制也高5倍。

GPT-4o的運行速度將得到顯著提升,其最大亮點在於採用了全新的語音交互技術。OpenAI一直致力於讓用戶通過語音與ChatGPT進行交流,使得對話體驗更加接近真人。然而,之前版本存在延遲問題,嚴重影響了對話的沉浸感。GPT-4o則採用了全新的技術,大幅提升了聊天機器人的響應速度。

以下是幾段演示:


© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com