OpenAI發佈新旗艦模型GPT-4o 可實時對音頻、視覺和文本進行推理-3樓貓

OpenAI於5月14日宣佈推出其最新旗艦生成式AI模型GPT-4o，能力橫跨語音、文本和視覺。

該模型將在未來幾周內逐步集成至OpenAI的各項產品中。並且OpenAI直接開放，免費用戶也可以直接用。

在API方面，GPT-4o的價格是GPT-4-turbo的一半，速度卻是GPT-4-turbo的兩倍，速率限制也高5倍。

GPT-4o的運行速度將得到顯著提升，其最大亮點在於採用了全新的語音交互技術。OpenAI一直致力於讓用戶通過語音與ChatGPT進行交流，使得對話體驗更加接近真人。然而，之前版本存在延遲問題，嚴重影響了對話的沉浸感。GPT-4o則採用了全新的技術，大幅提升了聊天機器人的響應速度。

以下是幾段演示：