كيفية تحميل نماذج الذكاء الاصطناعي المحلية (Local Models)
يعتمد تشغيل الذكاء الاصطناعي محلياً على جهازك (Local LLM) على تحميل ملفات النماذج وتخزينها، لتعمل كـ "دماغ" يعالج المحادثات وينتج الردود دون الحاجة للاتصال بالإنترنت. يسهل لك Tavern Studio هذه العملية بفضل التوافق الكبير مع أحدث صيغ النماذج المتاحة للكمبيوتر والأندرويد.
هذا الدليل يشرح كيفية العثور على النماذج المناسبة لتطبيقك، سواء كنت تستخدم جهاز كمبيوتر شخصي أو هاتفاً محمولاً.
كيفية تحميل نماذج GGUF للكمبيوتر (Windows)
أجهزة الكمبيوتر المدعومة بتقنية llama.cpp تتطلب نماذج محفوظة بصيغة GGUF. إليك كيفية الحصول عليها:
- اذهب إلى موقع Hugging Face، وهو أكبر مستودع مفتوح لنماذج الذكاء الاصطناعي.
- في شريط البحث، اكتب اسم النموذج الذي تريده (مثل Llama 3) وأضف كلمة
GGUFللبحث. هناك مطورون (مثل TheBloke أو Bartowski) متخصصون في تحويل النماذج لهذه الصيغة. - اختر النموذج الذي يتناسب مع حجم الرام (RAM / VRAM) في جهازك (مثل
Q4_K_MأوQ5كخيارات توازن بين الأداء والجودة). - قم بتحميل ملف النموذج (ينتهي بـ
.gguf). - افتح مدير النماذج (Model Manager) في Tavern Studio وأضف الملف المحمل.
تحميل نماذج LiteRT للأندرويد
بالنسبة للهواتف المحمولة (Android)، يوفر Tavern Studio دعم محرك LiteRT لتشغيل نماذج أخف وأسرع تناسب المعالجات المحمولة. عملية التحميل مشابهة:
- ابحث عن نماذج محولة لدعم تكنولوجيا أجهزة المحمول. (سيوفر التطبيق لاحقاً توصيات داخلية لأفضل النماذج).
- قم بتحميل النموذج إلى مجلدات الهاتف الخاصة بك.
- افتح إعدادات المحرك (LiteRT) داخل تطبيق Tavern Studio على الأندرويد واستورد النموذج للبدء فوراً.
الأسئلة الشائعة
كيف أعرف حجم النموذج المناسب لجهازي؟
القاعدة العامة هي الانتباه لحجم الرام المتوفر. نموذج بحجم 7B أو 8B بمعمارية Q4 سيتطلب حوالي 6 جيجابايت من الذاكرة العشوائية للتشغيل بسلاسة.
هل تعمل هذه النماذج باللغة العربية؟
نعم، العديد من النماذج الحديثة (مثل Llama 3 و Gemma 2 وغيرها) تم تدريبها على بيانات متعددة اللغات ويمكنها التحدث وإجراء رول بلاي باللغة العربية بشكل مدهش.