在 Tavern Studio 下载本地模型

下载本地模型和选择云端模型名不是一回事。你是在设备上添加一个真实文件,所以存储、内存、速度和设备能力都要考虑。

Tavern Studio 支持本地模型工作流,让用户可以做私有或离线聊天,而不是只能当 API 包装器。

适合谁

  • 想用本地 LLM 但不想另开聊天 UI 的用户。
  • Windows 上选择 GGUF 模型的人。
  • Android 上测试端侧模型能力的人。
  • 想做私有角色聊天的创作者。

核心内容

下载模型前先看文件大小和硬件要求。一个小而稳定的量化模型,可能比一个勉强能跑的大模型更适合日常使用。

还要看用途。角色聊天、写作、总结和指令跟随,对模型能力要求不同。

Tavern Studio 如何处理

Tavern Studio 把下载/导入的模型放进同一个工作区。模型可用后,你可以选择它作为路线,绑定预设,并配合角色卡和世界书使用。

本地模型是本地优先能力的一部分,但云端 API 仍然可用。

操作步骤

  1. 判断你需要 Windows 本地推理、Android 本地推理,还是两者都要。
  2. 选择适合存储和内存的模型大小。
  3. 在 Tavern Studio 中下载或导入模型。
  4. 在模型设置里选择它。
  5. 先发短 Prompt 测试。
  6. 用较小上下文跑一段角色聊天。
  7. 重要角色和聊天要单独备份,不要和模型文件混为一谈。

常见问题

Tavern Studio 可以下载本地模型吗?

可以。Tavern Studio 支持本地模型下载/导入工作流。

本地模型占空间大吗?

可能很大。下载前应检查文件大小。

模型越大越好吗?

不一定。运行太慢的大模型不适合日常聊天。

模型可以之后删除吗?

可以管理模型存储,但删除前要区分模型文件和角色/聊天数据。

还能用 OpenAI 或 Claude 吗?

可以。Tavern Studio 同时支持本地模型和云端 API。

下一步