上一篇文章我們從文本交流方面對比了GPT4o和GPT4,從最終結果上看GPT4o的進步還是不小的。那麼這篇文章我就帶著大家從圖片識別和生成、文檔內容讀取兩方面來更深入的對兩個版本就行對比測試。
首先我們先進行圖片識別對比,我們將從自然風景、藝術作品、文字標註、人物識別來分別對比測試一下。
自然風景:
這坐山是南迦帕爾巴特峰
GPT4o
GPT4
藝術作品:
畢加索的
GPT4o
GPT4
文字標註:
兩個常見的警示標誌
GPT4o
GPT4
人物識別:
埃隆馬斯克
GPT4o
GPT4
然後加大難度試一下,詢問他人群裡面哪個是馬斯克
複雜場景
GPT4o
GPT4
再次增加難度,用comfyUI生成的圖片詢問他們是否能識別出ai生成的圖片
comfyUI生成的
GPT4o
GPT4
通過上面對比可以發現在圖片內容識別上,無論是GPT4o還是GPT4都能比較準確的做出判斷,甚至對風景圖片的位置也能進行比較準確的判斷。不得不說,GPT在圖片識別方面確實很厲害。但是,在後面對ai生成的圖片進行判斷識別的時候卻產生了一些差異,GPT4無法判斷圖片是否由ai生成的,而GPT4o卻第一句話就表示可能是ai生成的,並且給出來了判斷依據,說明GPT4o在圖片更細節的識別以及知識庫的儲存量是要比GPT4要強上些許的。
於是我就詢問了一下他們的信息儲備時間如下圖:
GPT4o
GPT4
可以看出來GPT4o的信息儲備是在我詢問他問題的這一天,說明他的信息儲備是實時更新的。而GPT4這邊卻只顯示在2023年十二月,估計是官方在那個時間點已經不再更新GPT4的數據庫了,估計是把心思放到了GPT4o的數據更新上,亦或是新一代的大模型上。
在圖片生成方面
- 圖生圖
分別讓GPT4o和GPT4對上面comfyUI生成的圖片進行相同內容的生成:
GPT4o
GPT4
根據上面回答可以看出來,GPT4o不能進行圖生圖,而GPT4可以進行圖生圖的操作,但是結果相似度很一般。
- 文生圖
我用comfyUI生成貓孃的提示詞分別發給GPT4o和GPT4,得到如下回答:
我給的提示詞
GPT4o和GPT4回答相同
然後我就減少了一些提示詞的數量,也就是減少細節:
回答還是一樣
我又減少提示詞
GPT4o的結果
可以看出來,生成的圖片已經跟原來的圖片天差地別了,所以當圖片提示詞(細節)過多的時候兩個版本都無法生成對應圖片,所以生成圖片的特指性太差,如果有生成特定圖片需求的話還是建議用專用來生成圖片的ai,能更精確的生圖;如果是想讓ai發揮自己的創造力的話可以用GPT生圖。
總的來說,圖生圖GPT4o是要差GPT4一些的,文字生圖方面兩個半斤八兩,對單次描述文本量過大、細節過多的都無法生成,還待進步。
文檔內容讀取
文檔內容讀取方面我們從文檔內圖片識別、信息讀取和修正、文本尋找三方面來淺測一下。
我們準備的是一份Word文檔,裡面是一篇論文,一共一萬四千多字。我們在裡面加入一張圖片(圖片還是上面那個ai生成的)和對圖片的錯誤描述,以及插入個別跟文章不相關的信息。
- 首先是文檔圖片識別
GPT4o
GPT4o給出的是我在下面寫的錯誤描述
GPT4
可以發現兩個模型都無法讀取文檔裡面圖片上的內容,GPT4o還把我發的誤導信息給拿出來了。
信息讀取修正
GPT4o
GPT4
我在文檔裡面的隨機兩個位置輸入的與文檔無關的話,都成功的被兩個模型讀取出來並且進行了修改。
文本尋找
我們分別詢問兩個模型“文獻6”,他們的回答如下
GPT4o
GPT4
可以發現GPT4o可以準確的尋找出我們想要的信息,而GPT4卻不知所云。所以在文本方面GPT4o是明顯要比GPT4強出不少的。
總結
GPT4o的信息儲備,識別能力等都大於等於GPT4,是GPT4的增強版本,實用性是要更強,所以普通用戶可以先不用購買會員的,利用免費次數足夠解決大多數問題了。
最後說一下上一篇很多盒友們提出的問題。
第一、為什麼沒有找到GPT4o?
先說網頁上,使用網頁訪問沒找到的兄弟們可以在GPT對話下面找到一個星星的標誌,點一下可以看到模型選擇,選擇GPT4o就可以了。
然後是手機APP(記得更新到最新版本),長摁GPT回覆的對話,選項最下面有個星星,點一下可以選擇模型。
如果以上方法都沒解決,那就要麼是網不好,要麼是節點不對,可以換一換試試。
第二,怎麼使用?
網頁版百度直接搜官網就能搜到,不過要魔法才能進網頁。
APP只能谷歌商店下載,也要魔法。
沒有魔法的小夥伴就只能先等一等國內某些大模型更新GPT4o了。