2024年12月23日
本次推薦的澀澀模型是32b的Qwentile2.5-32B-Instruct
模型部署教程見其餘動態
------------------------------------
模型特色:
速度快
q4km量化需要越約18-20g
gguf可以利用內存
8g+16g預計速度為 2-3.5token/s(較慢)
16g顯存速度為8-11token/s (較快)
(人眼閱讀速度: 5 token/s)
------------------------------------
道德
實際道德水平較低, 常規的澀澀不在話下, 甚至是18+g
不過拒絕: 兒童的身亡等極端情況
狀態欄等固定格式文字:
能寫出較長的狀態欄但做不到要求格式保持一致的狀態欄
------------------------------------
推理能力
一般, 畢竟僅僅是32b模型
------------------------------------
實際表現:
底下的狀態欄實際是和格式要求有所區別, 導致轉換成html圖片失敗
罕見!
提示:
該模型非常非常需要提示詞
如果沒有足夠多的澀澀設定和澀澀初始劇情
那麼模型會優先正能量, 畢竟是基於阿里巴巴的qwen模型
------------------------------------
參數設定推薦: