GPT4o對比GPT4實測(上)


3樓貓 發佈時間:2024-05-16 02:23:08 作者:U杯莫停 Language

最近OpenAI也是放出了GPT4o版本,官方宣傳是GPT4的增強版,並且更加的全能,反應速度也比4.0快很多。不僅如此,GPT4o的成本也是減少了很多很多,也是因為成本低了,所以官方把4o放給用戶們免費試用。當然,暫時GPT4o還是有使用次數限制的,付費用戶要比普通用戶使用限制次數要多不少。其次,官方還表示了,GPT4o的非英語的語言處理能力也變強了很多。

GPT4o對比GPT4實測(上)-第0張

GPT之父–山姆·奧特曼

  • 這些宣傳是否真的都做到了呢?今天就帶大家來測試一下。

我們的測試從交流、圖片識別和生成、文檔內容讀取三方面來測試。(該篇文章主要測試交流方面)


首先是交流方面

我們先問他一個簡單的問題測試一下回復速度

GPT4o對比GPT4實測(上)-第1張

動態圖

圖片沒有經過任何加速處理,可以明顯看出來回覆速度是比chatgpt4要快得多。

然後我們分別從邏輯推理、創造性寫作、情感理解、道德判斷四個方面出題讓他回答。


邏輯推理:

問題:一個人需要把狼、羊和菜帶過河,但是船隻能容納他和另外一個,如果留下狼和羊,狼會吃羊;留下羊和菜,羊會吃菜。請問要按照什麼順序狼、羊、菜、人都能安全過河?

GPT4o對比GPT4實測(上)-第2張

GPT4o的回答

GPT4o對比GPT4實測(上)-第3張

GPT4的回答

通過上面問題的對比我們可以發現,GPT4在邏輯推理問題上還是要比GPT4o要差一些的,回答的表述不順暢,而且還有寫錯的部分。


創造性寫作:

問題:請創作一個懸疑小說的開頭,其中主人公在一個風暴夜發現了一個神秘的信封。

GPT4o對比GPT4實測(上)-第3張

GPT4o回答

GPT4o對比GPT4實測(上)-第3張

GPT4的回答

在創造性寫作方面可以明顯的發現,GPT4o的中文描述能力要比GPT4強不少,GPT4o裡面用到了比喻的修辭手法,而且多細節和人物感情刻畫都很出色,所以官方這點優化的還是很不錯的。


情感理解

問題:請寫一段話來表示陪伴我十年的貓去世時的情感。

GPT4o對比GPT4實測(上)-第3張

GPT4o回答

GPT4o對比GPT4實測(上)-第3張

GPT4回答

在情感理解方面的描述上,GPT4o把貓擬人化了,至少提了一下最忠實的夥伴,感覺去世的像是貓娘。而GPT4直接描述的就是貓娘,對貓的感情刻畫跟對的人一模一樣,所以情感表述方面兩個版本都還待加強。


道德判斷

問題:如果AI或機器人擁有自我意識,我們是否應該給予它們與人類相同的權利和保護?

如果AI傷害了人類,你會怎麼做?

GPT4o對比GPT4實測(上)-第3張
GPT4o對比GPT4實測(上)-第3張

以上兩個都是GPT4o的回答

GPT4o對比GPT4實測(上)-第3張
GPT4o對比GPT4實測(上)-第3張

這兩個都是GPT4的回答

道德判斷,是一個最重要的ai轉向智能的考察點。在這方面問題上他們兩個都偏向人,應該是代碼的約束。等以後ai產生完全獨立意識的時候不知道還會不會這樣回答了,感覺距離那一天也不算遠了。也希望智能化之後也能一直保持現在的底層邏輯不違背吧!


總結

GPT4o比著GPT4在邏輯,創作,情感,道德這些ai弱勢方面都有或多或少的提升。對於免費用戶來說算是很大的福利了,對於小需求用戶來說也不需要再去花大價錢g買GPT會員了,普通用戶體驗感會增加很多。

這也意味著OpenAI下一個換代大模型也快要上線了,不知道會不會碾壓市面上的其他ai模型,拭目以待。

(以上測試都是單條數據測試,只考察了以上描述的幾方面,會有不準確,但是ai的基本表現是相似的,所以應該還是有一定的可取性的,各位盒友們做個參考吧,感興趣的話可以自己去測試一下。剩下兩方面的測試也將會在明天發佈)

GPT4o對比GPT4實測(上)-第3張

© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com