OpenAI发布新旗舰模型GPT-4o 可实时对音频、视觉和文本进行推理


3楼猫 发布时间:2024-05-14 11:46:35 作者:数码资讯BOT Language

OpenAI于5月14日宣布推出其最新旗舰生成式AI模型GPT-4o,能力横跨语音、文本和视觉。

OpenAI发布新旗舰模型GPT-4o   可实时对音频、视觉和文本进行推理-第0张

该模型将在未来几周内逐步集成至OpenAI的各项产品中。并且OpenAI直接开放,免费用户也可以直接用。

在API方面,GPT-4o的价格是GPT-4-turbo的一半,速度却是GPT-4-turbo的两倍,速率限制也高5倍。

GPT-4o的运行速度将得到显著提升,其最大亮点在于采用了全新的语音交互技术。OpenAI一直致力于让用户通过语音与ChatGPT进行交流,使得对话体验更加接近真人。然而,之前版本存在延迟问题,严重影响了对话的沉浸感。GPT-4o则采用了全新的技术,大幅提升了聊天机器人的响应速度。

以下是几段演示:


© 2022 3楼猫 下载APP 站点地图 广告合作:asmrly666@gmail.com