Lokaler GGUF-Modellführer
Mit lokalen Modellen können Sie KI-Chats ausführen, ohne Eingabeaufforderungen an einen Cloud-Modellanbieter zu senden. Tavern Studio unterstützt lokale GGUF-Workflows für Benutzer mit geeigneter Hardware.
Für wen das ist
- Benutzer mit leistungsfähigen CPUs, GPUs oder dedizierten lokalen Modellkonfigurationen.
- Benutzer, die Offline- oder lokales Rollenspiel bevorzugen.
- Benutzer beheben Fehler aufgrund von unzureichendem Arbeitsspeicher oder langsamer Generierung.
Was Sie lernen werden
- Was GGUF ist.
- Wie sich lokale Modelle von Cloud-APIs unterscheiden.
- So importieren oder laden Sie ein lokales Modell herunter.
- Wie sich GPU-Ebenen und zugehörige Einstellungen auf die Leistung auswirken.
- So beheben Sie Abstürze.
GGUF und Hardware-Erwartungen
GGUF ist ein gängiges Format für lokale LLM-Inferenz. Quantisierte Modelle reduzieren den Speicherbedarf, größere Modelle benötigen jedoch immer noch genügend RAM oder VRAM.
[!NOTE]> Die Geschwindigkeit des lokalen Modells hängt stark von der Hardware, der Modellgröße, der Quantisierung und der Backend-Konfiguration ab.
Schritt 1: Laden Sie ein GGUF-Modell herunter oder importieren Sie es
Verwenden Sie den Modellverwaltungsbereich, um eine.gguf-Datei herunterzuladen oder zu importieren. Wählen Sie eine Modellgröße, die Ihre Hardware verarbeiten kann.
Schritt 2: Starten Sie das lokale Modell
Öffnen Sie die lokalen Modelleinstellungen und konfigurieren Sie:
- Backend-Typ.
- Kontextgröße.
- GPU-Ebenen.
- CPU-Threads.
- Chat-Format bei Bedarf.
Fehlerbehebung
Warum stürzt die App ab oder zeigt „Nicht genügend Speicher“ an?
Niedrigere GPU-Ebenen, verwenden Sie eine kleinere Quantisierung oder wählen Sie ein kleineres Modell.
Warum ist die Generierung sehr langsam?
Probieren Sie ein kleineres Modell aus, passen Sie die Threads an, nutzen Sie die GPU-Beschleunigung, falls verfügbar, oder reduzieren Sie die Kontextgröße.
Warum schlägt der Import fehl?
Die Datei ist möglicherweise unvollständig, beschädigt oder kein gültiges GGUF-Modell.
Nächste Schritte
- Schnittstellenübersicht: Verstehen Sie, wo lokale Modelleinstellungen angezeigt werden.
- Konfigurieren Sie Ihre erste API: Verwenden Sie Cloud-APIs, wenn lokale Hardware nicht ausreicht.
- FAQ: Sehen Sie sich weitere Fragen zur Fehlerbehebung an.