Descargar modelos locales en Tavern Studio

Descargar un modelo local no es lo mismo que elegir el nombre de un modelo en la nube. Estás agregando un archivo real a tu dispositivo, por lo que el almacenamiento, la memoria, la velocidad y la capacidad del dispositivo son factores fundamentales.

Tavern Studio, una app de LLM local, admite flujos de trabajo con modelos locales para que puedas disfrutar de un cliente de chat IA privado y chats con capacidad sin conexión sin que la aplicación sea solo un wrapper de API.

A quién está dirigido

  • Usuarios que buscan una alternativa a SillyTavern con flujos de trabajo de modelos locales integrados.
  • Usuarios que desean usar LLM locales sin tener que gestionar una interfaz de chat (UI) independiente.
  • Usuarios de Windows que eligen ejecutar un modelo GGUF de forma local.
  • Usuarios de Android que prueban los límites de modelos en el propio dispositivo.
  • Escritores que quieren un cliente de roleplay IA privado y chat de personajes sin conexión.
  • Creadores que quieren utilizar funciones avanzadas como swipe, regenerar respuestas o chat con múltiples ramas de forma completamente offline.

Contenido principal

Antes de descargar un modelo, verifica su tamaño y los requisitos de hardware estimados. Un modelo cuantizado pequeño puede ser mejor para el uso diario que un modelo más grande que apenas funcione.

También ten en cuenta el propósito de tu sesión. El chat con tarjeta de personaje, la escritura creativa, la sintetización de textos y el seguimiento de instrucciones pueden ofrecer rendimientos muy diferentes según el modelo elegido.

Cómo lo maneja Tavern Studio

Tavern Studio almacena los modelos descargados o importados dentro del mismo espacio de trabajo que los presets y los chats. Una vez que el modelo esté disponible, puedes seleccionarlo como ruta de generación, asociar preajustes (presets) y usarlo junto con tus tarjetas de personaje y World Info (libro de lore / Lorebook).

La descarga de modelos forma parte del funcionamiento local prioritario (local-first), aunque las API en la nube siguen estando disponibles cuando las necesites.

Pasos para operar

  1. Decide si necesitas inferencia local en Windows, en Android, o en ambos.
  2. Elige un tamaño de modelo que se ajuste a tu capacidad de almacenamiento y memoria.
  3. Descarga o importa el modelo en Tavern Studio.
  4. Selecciónalo en los ajustes del modelo.
  5. Utiliza un prompt corto de prueba.
  6. Prueba un chat de personajes con una configuración de contexto moderada.
  7. Mantén copias de seguridad de tus tarjetas de personaje y chats importantes separadas de los archivos de los modelos.

Preguntas frecuentes

¿Puedo descargar modelos dentro de Tavern Studio?

Sí. Tavern Studio admite flujos de trabajo de descarga e importación de modelos locales en esta app de LLM local.

¿Los modelos locales ocupan mucho espacio de almacenamiento?

Pueden ocuparlo. Asegúrate de verificar el tamaño del archivo del modelo antes de descargarlo.

¿Un modelo más grande es siempre mejor?

No. A veces un modelo demasiado pesado para tu dispositivo puede volverse inutilizable. Un modelo GGUF más pequeño y rápido suele ser más práctico para el día a día.

¿Puedo eliminar los modelos más tarde?

El almacenamiento de los modelos debe gestionarse por separado de los datos principales del personaje y del chat. Revisa las herramientas de almacenamiento de la aplicación antes de eliminarlos.

¿Puedo seguir usando OpenAI o Claude?

Sí. Tavern Studio admite tanto modelos locales (incluyendo conexiones a través de una API compatible con OpenAI) como API de servicios en la nube.

Siguiente paso