GPT4o对比GPT4实测(上)


3楼猫 发布时间:2024-05-16 02:23:08 作者:U杯莫停 Language

最近OpenAI也是放出了GPT4o版本,官方宣传是GPT4的增强版,并且更加的全能,反应速度也比4.0快很多。不仅如此,GPT4o的成本也是减少了很多很多,也是因为成本低了,所以官方把4o放给用户们免费试用。当然,暂时GPT4o还是有使用次数限制的,付费用户要比普通用户使用限制次数要多不少。其次,官方还表示了,GPT4o的非英语的语言处理能力也变强了很多。

GPT4o对比GPT4实测(上)-第0张

GPT之父–山姆·奥特曼

  • 这些宣传是否真的都做到了呢?今天就带大家来测试一下。

我们的测试从交流、图片识别和生成、文档内容读取三方面来测试。(该篇文章主要测试交流方面)


首先是交流方面

我们先问他一个简单的问题测试一下回复速度

GPT4o对比GPT4实测(上)-第1张

动态图

图片没有经过任何加速处理,可以明显看出来回复速度是比chatgpt4要快得多。

然后我们分别从逻辑推理、创造性写作、情感理解、道德判断四个方面出题让他回答。


逻辑推理:

问题:一个人需要把狼、羊和菜带过河,但是船只能容纳他和另外一个,如果留下狼和羊,狼会吃羊;留下羊和菜,羊会吃菜。请问要按照什么顺序狼、羊、菜、人都能安全过河?

GPT4o对比GPT4实测(上)-第2张

GPT4o的回答

GPT4o对比GPT4实测(上)-第3张

GPT4的回答

通过上面问题的对比我们可以发现,GPT4在逻辑推理问题上还是要比GPT4o要差一些的,回答的表述不顺畅,而且还有写错的部分。


创造性写作:

问题:请创作一个悬疑小说的开头,其中主人公在一个风暴夜发现了一个神秘的信封。

GPT4o对比GPT4实测(上)-第3张

GPT4o回答

GPT4o对比GPT4实测(上)-第3张

GPT4的回答

在创造性写作方面可以明显的发现,GPT4o的中文描述能力要比GPT4强不少,GPT4o里面用到了比喻的修辞手法,而且多细节和人物感情刻画都很出色,所以官方这点优化的还是很不错的。


情感理解

问题:请写一段话来表示陪伴我十年的猫去世时的情感。

GPT4o对比GPT4实测(上)-第3张

GPT4o回答

GPT4o对比GPT4实测(上)-第3张

GPT4回答

在情感理解方面的描述上,GPT4o把猫拟人化了,至少提了一下最忠实的伙伴,感觉去世的像是猫娘。而GPT4直接描述的就是猫娘,对猫的感情刻画跟对的人一模一样,所以情感表述方面两个版本都还待加强。


道德判断

问题:如果AI或机器人拥有自我意识,我们是否应该给予它们与人类相同的权利和保护?

如果AI伤害了人类,你会怎么做?

GPT4o对比GPT4实测(上)-第3张
GPT4o对比GPT4实测(上)-第3张

以上两个都是GPT4o的回答

GPT4o对比GPT4实测(上)-第3张
GPT4o对比GPT4实测(上)-第3张

这两个都是GPT4的回答

道德判断,是一个最重要的ai转向智能的考察点。在这方面问题上他们两个都偏向人,应该是代码的约束。等以后ai产生完全独立意识的时候不知道还会不会这样回答了,感觉距离那一天也不算远了。也希望智能化之后也能一直保持现在的底层逻辑不违背吧!


总结

GPT4o比着GPT4在逻辑,创作,情感,道德这些ai弱势方面都有或多或少的提升。对于免费用户来说算是很大的福利了,对于小需求用户来说也不需要再去花大价钱g买GPT会员了,普通用户体验感会增加很多。

这也意味着OpenAI下一个换代大模型也快要上线了,不知道会不会碾压市面上的其他ai模型,拭目以待。

(以上测试都是单条数据测试,只考察了以上描述的几方面,会有不准确,但是ai的基本表现是相似的,所以应该还是有一定的可取性的,各位盒友们做个参考吧,感兴趣的话可以自己去测试一下。剩下两方面的测试也将会在明天发布)

GPT4o对比GPT4实测(上)-第3张

© 2022 3楼猫 下载APP 站点地图 广告合作:asmrly666@gmail.com