Tavern Studio Guide - ZH-HANT

Windows 本地 LLM：Tavern Studio 的 llama.cpp 路線

在 Windows 上，Tavern Studio 把本地 LLM 推理當作原生能力，而不是只連接外部工具。它使用 llama.cpp 生態的本地模型路線，讓 GGUF 模型可以和角色卡、世界書、預設、聊天記錄放在同一個工作流裡。

llama.cpp 的核心價值是用相對直接的方式在本地運行大語言模型。Tavern Studio 關注的是把它接入聊天工作檯，而不是讓用戶只面對模型文件和命令行。

適合誰

Windows 本地模型工作流需要三個部分：兼容模型文件、運行時和懂得組裝上下文的聊天界面。GGUF 是 llama.cpp 工作流中常見的本地模型格式。

硬體很重要。小模型和量化模型更容易運行。大模型會受到記憶體、CPU/GPU、後端和上下文長度影響。

Tavern Studio 把本地模型路線接入同一套 Prompt 組裝系統。角色資料、世界書、預設和聊天歷史仍然會參與請求。它不是單獨的「本地模型玩具模式」。

Windows 發布包可以包含本地 LLM 運行組件，具體後端隨發布配置管理。

可以。Windows 本地推理是 Tavern Studio 的核心能力之一。

GGUF 是 llama.cpp 本地模型工作流中的常見格式。

使用 Tavern Studio 原生本地模型路線時不一定需要。你仍然可以按需連接外部兼容端點。

不會。速度取決於模型大小、量化、硬體、後端和上下文長度。

可以。它們會進入同一套 Prompt 組裝流程。