GPT4o對比GPT4實測（下）-3樓貓

上一篇文章我們從文本交流方面對比了GPT4o和GPT4，從最終結果上看GPT4o的進步還是不小的。那麼這篇文章我就帶著大家從圖片識別和生成、文檔內容讀取兩方面來更深入的對兩個版本就行對比測試。

首先我們先進行圖片識別對比，我們將從自然風景、藝術作品、文字標註、人物識別來分別對比測試一下。

自然風景:

這坐山是南迦帕爾巴特峰

GPT4o

GPT4

藝術作品:

畢加索的

GPT4o

GPT4

文字標註:

兩個常見的警示標誌

GPT4o

GPT4

人物識別:

埃隆馬斯克

GPT4o

GPT4

然後加大難度試一下，詢問他人群裡面哪個是馬斯克

複雜場景

GPT4o

GPT4

再次增加難度，用comfyUI生成的圖片詢問他們是否能識別出ai生成的圖片

comfyUI生成的

GPT4o

GPT4

通過上面對比可以發現在圖片內容識別上，無論是GPT4o還是GPT4都能比較準確的做出判斷，甚至對風景圖片的位置也能進行比較準確的判斷。不得不說，GPT在圖片識別方面確實很厲害。但是，在後面對ai生成的圖片進行判斷識別的時候卻產生了一些差異，GPT4無法判斷圖片是否由ai生成的，而GPT4o卻第一句話就表示可能是ai生成的，並且給出來了判斷依據，說明GPT4o在圖片更細節的識別以及知識庫的儲存量是要比GPT4要強上些許的。

於是我就詢問了一下他們的信息儲備時間如下圖:

GPT4o

GPT4

可以看出來GPT4o的信息儲備是在我詢問他問題的這一天，說明他的信息儲備是實時更新的。而GPT4這邊卻只顯示在2023年十二月，估計是官方在那個時間點已經不再更新GPT4的數據庫了，估計是把心思放到了GPT4o的數據更新上，亦或是新一代的大模型上。

在圖片生成方面

圖生圖

分別讓GPT4o和GPT4對上面comfyUI生成的圖片進行相同內容的生成:

GPT4o

GPT4

根據上面回答可以看出來，GPT4o不能進行圖生圖，而GPT4可以進行圖生圖的操作，但是結果相似度很一般。

文生圖

我用comfyUI生成貓孃的提示詞分別發給GPT4o和GPT4，得到如下回答:

我給的提示詞

GPT4o和GPT4回答相同

然後我就減少了一些提示詞的數量，也就是減少細節:

回答還是一樣

我又減少提示詞

GPT4o的結果

可以看出來，生成的圖片已經跟原來的圖片天差地別了，所以當圖片提示詞（細節）過多的時候兩個版本都無法生成對應圖片，所以生成圖片的特指性太差，如果有生成特定圖片需求的話還是建議用專用來生成圖片的ai，能更精確的生圖；如果是想讓ai發揮自己的創造力的話可以用GPT生圖。

總的來說，圖生圖GPT4o是要差GPT4一些的，文字生圖方面兩個半斤八兩，對單次描述文本量過大、細節過多的都無法生成，還待進步。

文檔內容讀取

文檔內容讀取方面我們從文檔內圖片識別、信息讀取和修正、文本尋找三方面來淺測一下。

我們準備的是一份Word文檔，裡面是一篇論文，一共一萬四千多字。我們在裡面加入一張圖片（圖片還是上面那個ai生成的）和對圖片的錯誤描述，以及插入個別跟文章不相關的信息。

首先是文檔圖片識別

GPT4o

GPT4o給出的是我在下面寫的錯誤描述

GPT4

可以發現兩個模型都無法讀取文檔裡面圖片上的內容，GPT4o還把我發的誤導信息給拿出來了。

信息讀取修正

GPT4o

GPT4

我在文檔裡面的隨機兩個位置輸入的與文檔無關的話，都成功的被兩個模型讀取出來並且進行了修改。

文本尋找

我們分別詢問兩個模型“文獻6”，他們的回答如下

GPT4o

GPT4

可以發現GPT4o可以準確的尋找出我們想要的信息，而GPT4卻不知所云。所以在文本方面GPT4o是明顯要比GPT4強出不少的。

總結

GPT4o的信息儲備，識別能力等都大於等於GPT4，是GPT4的增強版本，實用性是要更強，所以普通用戶可以先不用購買會員的，利用免費次數足夠解決大多數問題了。

最後說一下上一篇很多盒友們提出的問題。

第一、為什麼沒有找到GPT4o？

先說網頁上，使用網頁訪問沒找到的兄弟們可以在GPT對話下面找到一個星星的標誌，點一下可以看到模型選擇，選擇GPT4o就可以了。

然後是手機APP（記得更新到最新版本），長摁GPT回覆的對話，選項最下面有個星星，點一下可以選擇模型。

如果以上方法都沒解決，那就要麼是網不好，要麼是節點不對，可以換一換試試。

第二，怎麼使用？

網頁版百度直接搜官網就能搜到，不過要魔法才能進網頁。

APP只能谷歌商店下載，也要魔法。

沒有魔法的小夥伴就只能先等一等國內某些大模型更新GPT4o了。

自然風景:

這坐山是南迦帕爾巴特峰

GPT4o

GPT4

藝術作品:

畢加索的

GPT4o

GPT4

文字標註:

兩個常見的警示標誌

GPT4o

GPT4

人物識別:

埃隆馬斯克

GPT4o

GPT4

複雜場景

GPT4o

GPT4

comfyUI生成的

GPT4o

GPT4

GPT4o

GPT4

在圖片生成方面

GPT4o

GPT4

我給的提示詞

GPT4o和GPT4回答相同

回答還是一樣

GPT4o的結果

文檔內容讀取

GPT4o

GPT4

信息讀取修正

GPT4o

GPT4

文本尋找

GPT4o

GPT4

總結

第一、為什麼沒有找到GPT4o？

第二，怎麼使用？

製作不易，盒u們電個吧