深淵數據統計OCR自動化教程|忍者必須死3


3樓貓 發佈時間:2022-08-14 18:29:07 作者:留白土曰 Language

前言
眾所周知,家族管理在數據統計上面是個髒活累活。依託現在OCR技術,其實可以減輕這一過程的負擔。這一帖子一是技術交流,其次也是希望有老哥能幫我一起維護和使用我的
開源代碼。目前剛起步,還在畫餅階段,僅實現每週深淵副本的一套識別。也歡迎各位家族管理想使用的加我qq交流。QQ:477977734。

簡介

理想的全自動過程是:(1)機器人進入深淵列表,(2)獲取圖片,(3)OCR識別,(4)生成結構化數據及可視化

由於(1), (2)步過程比較繁瑣,我的實現還不穩定,而且有違規被用於非法用途之嫌,所以這裡不公開及介紹這部分。(4)有空我單獨開貼介紹。這裡主要介紹目前我實現(3)步驟的大體思路。簡單來說:如何上傳圖片到百度API識別,再拉下來試用。

大致流水線:
深淵數據統計OCR自動化教程|忍者必須死3 - 第1張Disclaimer: 雖然這裡用到了百度的技術,但這絕對不是百度AI平臺的廣告,我也沒收過百度一分錢。這裡只是分享這個技術在自動化家族深淵數據的應用。

第一步 你先要獲得一張像這樣的深淵的圖片:
深淵數據統計OCR自動化教程|忍者必須死3 - 第2張第二步 百度雲賬號申請,可以參考這個帖子前半部分https://www.jianshu.com/p/816cc6ef571b 第三步 進入OCR子模塊:https://console.bce.baidu.com/ai/#/ai/ocr/overview/index

第四步 點擊iOCR-創建模板-上傳模板圖片(剛才的深淵圖片)
深淵數據統計OCR自動化教程|忍者必須死3 - 第3張第五步 設置參照字段,用於程序校準,能夠識別到深淵板塊的位置。這裡我的工程實踐是選擇:深淵頂部標籤頁的:家族狀況、全國。下面的玩家、挑戰次數。
深淵數據統計OCR自動化教程|忍者必須死3 - 第4張第六步 設置識別內容
深淵數據統計OCR自動化教程|忍者必須死3 - 第5張第七步 模板完成了,可以點擊右上角試一試。在這裡分享一下我的模板ID5e325de161f970154c1d11c26147712b
深淵數據統計OCR自動化教程|忍者必須死3 - 第6張可以看到雖然有一些不完美,但是大體名字和數字還是很準確的。由於百度提供的是API(python可以pip安**aidu-aip庫直接調用,很方便),我們可以藉助本地腳本一些後處理,去和提前錄入的玩家metadata做匹配(名字,UID等),來校準名字,最後輸出成CSV文件。我的python實現在
這裡(在此不多作展開,有興趣的話我可以再開一貼介紹)。如果沒有編程經驗的小夥伴,也可以想借助平臺上的DEMO來加速數據收集過程。

結束
畢竟是Tap論壇,在這裡只是對我這個閒暇時間小項目做個推廣,我不想寫的太硬核。更多後續教程我應該會發布在我Github庫的WIKI裡。

最後,再招募一下有興趣的家族管理和我聯繫。
1.希望至少有一定python基礎。
2.此外,有測試相關經驗的可以幫助我繼續完善文檔。有Web全棧能力的也可以試著將寫下前後端(Web我實在苦手),方便沒有編程技術的小夥伴。
3.有計算機視覺相關經驗的也可以聯繫我。但目前為了程序效率,和不想標註數據(神TM還在遊戲里加班標數據),不需要深度學習經驗的小夥伴。更加希望對傳統方法:基於HOG特徵的圖像搜索等等的聯繫我,便於寶物自動識別的工作。

© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com