OpenAI发布新旗舰模型GPT-4o 可实时对音频、视觉和文本进行推理-3楼猫

OpenAI于5月14日宣布推出其最新旗舰生成式AI模型GPT-4o，能力横跨语音、文本和视觉。

该模型将在未来几周内逐步集成至OpenAI的各项产品中。并且OpenAI直接开放，免费用户也可以直接用。

在API方面，GPT-4o的价格是GPT-4-turbo的一半，速度却是GPT-4-turbo的两倍，速率限制也高5倍。

GPT-4o的运行速度将得到显著提升，其最大亮点在于采用了全新的语音交互技术。OpenAI一直致力于让用户通过语音与ChatGPT进行交流，使得对话体验更加接近真人。然而，之前版本存在延迟问题，严重影响了对话的沉浸感。GPT-4o则采用了全新的技术，大幅提升了聊天机器人的响应速度。

以下是几段演示：