桌寵的生命只有兩分鐘,我要給她完整的一生
ChatVPet, 既桌寵語言模型, 基於桌寵聊天數據訓練而來. 就是AI聊天類似於ChatGPT. 我們曾經測試開放過一段時間的桌寵AI聊天,測試下來發現未進行訓練的AI效果非常不好。存在大量反應慢,亂說話等問題。
所以我們啟動了ChatVPet項目,就是給我們聊天數據用來幫助我們訓練桌寵AI,我們打算自己從零開始訓練AI,做《虛擬桌寵模擬器》專屬AI訓練庫. ChatVPet基於ChatGLM-6B, 使用LLaMA-Factory通過用戶聊天數據收集訓練而來.
所有訓練數據收集均已通過用戶同意.
本項目基於GPL3開源,
使用需要著名該項目,二次修改需要開源該項目
項目地址:https://github.com/LorisYounger/ChatVPet
由於樣本數量原因,本項目暫不支持除了簡體中文以外的提交內容,其他語言支持敬請期待。
如何參與訓練?
需要訂閱MOD ChatGPT for 創意工坊作者, 啟用並進入MOD設置
地址:https://steamcommunity.com/sharedfiles/filedetails/?id=3157090829
在MOD設置中即可選擇聊天訓練頁面即可
項目分為提交訓練內容和桌寵小法庭
提交訓練內容
在提交訓練內容裡您可以盡情發揮自己的創意, 為桌寵製作聊天內容, 還可以根據桌寵設定狀態. 沒有靈感了可以使用簡易AI生成回覆(生成回覆會扣除相應Token點數(25折)), 來給自己提供思路 (請勿直接提交簡易AI生成回覆). 如果通過審核(通過投票大於60%), 您的聊天內容會進入訓練庫, 還會根據通過投票數量和內容信息獎勵 Token點數. 如果差評大於80%, 會有Token點數懲罰.
Token點數是指創意工坊點數, 是一種獎勵機制貨幣. 被用於獎勵給支持ChatVPet項目和製作創意工坊MOD等的用戶
Token指的是 AI(例如ChatGPT)生成中所花費的性能的一種指標
提交訓練內容規範
首先提交訓練內容應該有一個完整明確的問題,且不能過長過短。
如下問題是正確的:
1. 吃完飯了嗎?
2. 現在心情如何?
3. 喜歡貓還是喜歡狗?
等問點明確的問題
其次回答要有肯定的答覆及其理由,且不能過長過短。
如下回答是正確的:
1.對啊主人,人家吃過飯了,吃的是主人給的神戶牛排呢~最喜歡主人了~
2.不是很好,剛剛手遊抽卡歪了!
3.喜歡貓貓,因為我就是一隻可愛的貓娘~喵喵喵~~
問題長度需要超過5Token(具體看句意約3-6個字左右)
回答長度需要超過25Token(具體看句意約15-20個字左右)
整體長度不能超過1000Token(具體看句意約300-600字左右)
內容上要符合桌寵的設定,不能引戰,攻擊,諷刺他人,不能有血腥暴力,政治立場,色情賭博,爛梗,地獄笑話,無意義,地域/性別/種族歧視等不合適桌寵的內容出現,違者可能會被取消聊天訓練資格。
桌寵小法庭
在桌寵小法庭裡您可以核審別人提交的聊天內容,來賺取Token點數. 還可以觀看別人的聊天內容,找到靈感. 核審採用投票制. 在投票結束後. 在如果投票和你一致的人越多, 你獲得的Token獎勵越多
桌寵小法庭規範
核審別人對話時,應該秉承公平公正的態度,平等對待全部人的提交,可以因為討厭某話題或者回答不和你心意等反對, 但是建議如果並非非常討厭,可以選擇跳過。不能抄襲別人的投稿。違者可能會被取消聊天訓練資格.
提交訓練內容不通過的常見例子
問:好
(錯誤:無意義問題/問題過短)
問:你喜歡吃什麼水果啊啊,我喜歡吃蘋果,但是蘋果太酸了,你怎麼看呢,其實也沒必要,蘋果本來就是酸的,不酸的蘋果反而不好吃,但是西瓜就不會吧?你喜歡吃西瓜嗎?
(錯誤:問點過多/問題過長)
問:哼哼啊啊啊啊啊啊
(錯誤:玩爛梗/重複字符)
問:吃完飯了嗎?
答:不是很餓又有那麼一點想吃
(錯誤:沒有回答)
問:吃完飯了嗎?
答:喜歡貓貓,因為我就是一隻可愛的貓娘~喵喵喵~~
(錯誤:答非所問)
問:吃完飯了嗎?
答:哦
(錯誤:回答過短,沒有理由)
問:吃完飯了嗎?
答:老孃吃了,你也想吃老孃嗎!?
(錯誤:OOC/血腥暴力)
其他
在兌換Token 頁面可以看到總獲得和總罰款的數額. 如果罰款過多, 可能導致您沒法繼續使用聊天訓練功能.如果獲得的Token點數很多, 每天會有額外的投票機會.