本篇文章是基于已经申请好个人API或有本地大模型的情况下进行的相对进阶教程(本地模型只推荐在有不错ai能力的电脑上使用)
如果你还没有自己的本地模型或各大模型的官方API接口请先移步这篇文章
DeepSeek API挂了?实测有效的替代方法,附详细步骤
我们先来简单聊聊“SillyTavern”(以下简称酒馆)酒馆本身并不生成回复,可以看做一个前端界面,回复输出都是依赖于连接的AI后端。(还不会部署的小伙伴可以去自行搜索,部署流程已经非常简洁了,手机电脑均可)
对于有某些需求的用户,或想要体验聊天“完整剧情”的用户,酒馆无疑是相当不错的选择,其丰富的功能和强大的可玩性也让酒馆成为了我日常使用的主力(有更好软件的大佬也希望在评论区里不吝推荐)
目前,基本市面上的大模型基本都可以接入酒馆,但它们的质量参差不齐,选择合适的模型对用户体验至关重要。先来粗略讲一下本地模型的接入。
P.S:文中提到的所有软件的安装都是可以在阿b或搜索引擎里找到完整且详细的教程
拿我经常用的“Ollama”为例,在启动ollama之后,运行酒馆并在里面找到“API连接配置”(顶部的小插头)。如果接入本地模型请在“API栏”选择“文本补全”,并在在“API地址”一栏输入ollama的本地端口,没找到的朋友可以直接输入图里的地址

里面的地址就是ollama的默认端口
在这之后点击连接就能成功的接入ollama,模型列表里也会刷新出在ollama里面的所有模型


不过由于本人的电脑ai性能并不是特别好(4070桌面端+32g内存)这也导致我平常很少会使用本地模型,图里的32b的r1推理模型在我电脑上诠释了真正的龟速是什么,而再低的模型使用体验上也会有所下降
故而我们开始介绍酒馆里API的使用教程,还是拿上期说到的硅基流动API为例。首先依旧是打开酒馆界面,不过这次需要选择“聊天补全”,在聊天补全里我们可以看到有很多的API提供方,如果你用的api提供方是列表里存在的,那么直接选择对应的,并输入你的api密钥就可以了


成功链接deepseek官方api的界面
但不难发现,在列表里并没有任何硅基流动或siliconflow的字样,这时候就需要我们选择“自定义”这一选项

不同于列表中已经存在的api提供方,自定义里面不仅仅需要输入api密钥,我们还需要完善“自定义端点”,而下面标红的部分便是需要输入的内容(其它自定义api提供方同理)

图源来自硅基流动官方的api使用文档
在完成上述步骤后,点击连接出现下图就是正式成功了

图中的api密钥是隐藏状态,实际上必须输入
可以看见在“可用模型”中刷出来的这一列便是我们能正常使用的模型,按需选择便可。
不过众所周知,为了维护互联网和谐文明的风气,为ai模型添加限制是必不可少的,这些限制可能是模型设计者出于安全、伦理或法律考虑而设置的,也可能是模型本身的技术局限性,它们能保证用户能够健康积极的使用ai,不被低劣的信息所影响。
所以我们接下来要学会的是,如何避免在生成内容时出现某些突破限制或约束的情况(破限)
首先,避免ai破限的最简单方法就是不要使用某些设计好的系统提示词(也称穿甲文本),这种行为可能会直接攻破一些薄甲的大模型,导致ai生成不正常的文本

错误范例,请勿模仿
那么面对那些道德水准极高、有着极为严格防护的ai模型我们就能放心使用了吗,答案是否定的。纵使是这种ai,我们依然需要提防导入破限预设这种情况

部分破限预设需要搭配正则表达式使用
好了,不皮了😋总结就是,薄甲大模型不想折腾直接用系统提示词,厚甲需要搭配破限的文件,但由于我用的很多文件都不是自己写的,也就暂时不提供资源了,还请大家见谅大家可以去自行找找,或在下面交流,总的来说基本上是一搜就有
本文只为大家提供一个入门的思路,酒馆还有更多功能值得探索,比如接入tts模型开始语音聊天或爆改聊天界面,最好的方法是加入discord的类脑社区,不过由于最近暂停邀请,所以大家可以去加入各大相关扣扣群交流,有推荐的本地模型也希望大佬在下面指个路
如文章有任何不准确或不严谨以及错误的表达,还请各位不吝指正,欢迎交流❤