ذاكرة فيديو 4G بتكوين منخفض لتشغيل AIGC! وصل العمل الجديد لمؤلف ControlNet إلى أعلى قائمة GitHub الساخنة

مصدر المقال: كوبيت

النص: كريسي شياوكسياو

العب الرسم بالذكاء الاصطناعي، الآن لا داعي للقلق بشأن "الطعن في الظهر" بواسطة مهارات السكين Old Huang!

كل ما تحتاجه هو GTX 1650 (ذاكرة فيديو بسعة 4 جيجابايت) منذ 4 سنوات، وتأثير عرض الذكاء الاصطناعي يمكن مقارنته بأفضل طراز مفتوح المصدر حاليًا SDXL.

** ** المصدر: تويتر @ナビ

هذا مشروع جديد Foocus سيطر على قائمة TOP 1 على GitHub لعدة أيام متتالية، وقد تم تمييزه بـ 4K في ثلاثة أيام، وهو من إنتاج ControlNet Author.

قبل ظهور ذلك، إذا كنت تريد تشغيل أحدث طراز XL من Stable Diffusion بسلاسة، فيجب عليك استخدام 4060ti مع ذاكرة فيديو 16G (3060 الأصلي مع ذاكرة فيديو 12G متردد جدًا في التشغيل).

على عكس أدوات الذكاء الاصطناعي مفتوحة المصدر الأخرى، يركز Fooocus على الجيل نفسه، ولا يحتوي على متطلبات منخفضة للأجهزة فحسب، بل إنه أيضًا سهل الاستخدام، صديق جدًا للمبتدئين ——

ليست هناك حاجة لضبط أي معلمات في العملية برمتها، فقط انقر بالماوس، ويمكن إنشاء صورة في 3 خطوات.

** ****△**مصدر الصورة Twitter @Photogenic Weekend

وقال بعض مستخدمي الإنترنت: "هذا ببساطة تتويج لـ Stable Diffusion و Midjourney":

قل وداعاً للضبط اليدوي! غير متصل بالإنترنت ومفتوح المصدر ومجاني، فقط اطلب الكلمات والصور ودع السحر يحدث!

أعرب بعض مستخدمي الإنترنت عن أسفهم: حتى Xiaobai يمكنه إطلاق العنان لتأثير نموذج Stable Diffusion XL.

إذًا، ما هو التأثير الفعلي لأداة الذكاء الاصطناعي للصور الجديدة هذه؟ لقد جربناها.

Colab يرسم الصورة في نصف دقيقة، التأثير مشابه لـ SD

من منظور واجهة التشغيل، يحتوي Fooocus على أكثر من مائة نمط مدمج للاختيار من بينها.

** ****△**مصدر الصورة تويتر @camenduru

أما بالنسبة لـ الكفاءة، فإن Fooocus سريع جدًا أيضًا في الرسم. في Colab، يستغرق رسم صورة في وضع أولوية السرعة حوالي نصف دقيقة:

الوقت المعروض في السجل هو وقت الرسم، ولكن كانت هناك عملية تحليل نص من قبل، والتي استغرقت حوالي 40 ثانية في المجمل:

** **### تم تسريع الصورة

ثم دعها ترسم كاريكاتيرًا أولاً، وانظر كيف ستبدو "حرب مزار" من منظور الذكاء الاصطناعي. (ليست هذه مزاحا)

نظرًا للتوليد المباشر للصور باستخدام الذكاء الاصطناعي، لا تزال هناك بعض المشكلات في التعامل مع اليدين، لذلك سمحنا ببساطة لـ Musk وZuckerberg بارتداء القفازات:

يبدو أن التأثير جيد جدًا. لا أعرف إذا كان لديهم أي رهانات، لكن من الأفضل أن يسمحوا للخاسر أن يأتي ليرتدي ملابسه.

(تذكير: لا يوجد فائز في القتال)

وفي النهاية "تصافحا وتصالحا"، وهذا المشهد الثمين سجله المصور أيضا، فهل الصورة العامة لها تلك النكهة؟

بعد انتهاء "معركة مزار"، عاد لاو ما بطاعة إلى الشركة وباع تيسلا.

إذا تجاهلت الشعار، فإن المعنى التصميمي لـ الملصق موجود تمامًا عبر الإنترنت.

في الواقع، كل نمط مدمج في Fooocus مثير جدًا للاهتمام، لذلك دعونا نلقي نظرة على هذه الصور الحية للأنماط المختلفة:

عندما يتعلق الأمر بتقليد الأعمال الشهيرة، هناك نسخة Cyberpunk، ونسخة Zelda، ونسخة Minecraft، وحتى نسخة Pokémon من Musk للمشاهدة.

أما بالنسبة للأشكال الفنية الأخرى، فهناك أنماط Pixel و Lowpoly، بالإضافة إلى إصدارات Nendoroid و Scissorial...

بالطبع، هناك أمثلة لا حصر لها، يمكن للقراء والأصدقاء من ذوي الأنماط الأكثر تجربة ذلك بأنفسهم.

(يجب أن يقال أن النص الموجود في رسم الذكاء الاصطناعي ليس في النهاية رسمًا شبحيًا)

هل الرسامون العظماء نفد صبرهم بالفعل ويريدون تجربتها؟ سنقدم لك كيفية لعب Fooocus بعد قليل!

واجهة Fooocus مملوكة للعمة Jiang، والتي يمكن القول أنها موجزة للغاية:

إذا كنت تحاول تجربة شيء جديد وليس لديك أي متطلبات خاصة، مربع المطالبة هذا كافٍ تمامًا.

نظرًا لأن المؤلف قد استوعب العديد من المهارات المعقدة في البرنامج، فإن عمليات ضبط المعلمات هذه لم تعد بحاجة إلى القيام بها يدويًا.

أدخل مباشرة في المربع أدناه، وانقر فوق زر الإنشاء وانتظر حتى يتم إنتاج الرسم.

(افتراضيًا، يتم إخراج صورتين في كل مرة، والحجم هو 1152×896، والنمط هو الافتراضي السينمائي، ويتم تحديد الأولوية للسرعة)

إذا كانت الإعدادات المتقدمة مطلوبة، حدد خيارات متقدمة في الزاوية اليسرى السفلية، وستظهر معلومات التكوين على الجانب الأيمن من الصفحة، مقسمة إلى ثلاث علامات تبويب:

تشمل الأشياء التي يمكن تعديلها الحجم والكمية والأسلوب والأداء والمزيد.

إذا كنت لاعبًا محترفًا، فيمكنك أيضًا اختيار إصدار النموذج وحتى ضبط معلمات LoRA.

بالإضافة إلى ذلك، هناك لعبة متطورة ضبط الحدة.

بالنسبة لنفس المحتوى، يوضح ملف GIF التالي تغير الحدة من 2 إلى 10 ثم إلى 20. ويمكن ملاحظة أنه مع زيادة الحدة، تصبح تفاصيل الصورة أكثر وفرة:

ومع ذلك، فيما يتعلق بما إذا كان Fooocus يدعم الصينية، فقد جربناه أيضًا، ولكن من المؤسف أنه غير متوفر بعد.

على سبيل المثال، نقوم بإدخال الكلمة السريعة "تفاحة"، وتكون النتيجة فتاة.

هذا... هل يحاول أن يقول "أنت قرة عيني"؟

الآن ربما تعرف كيفية لعب Fooocus، فكيف يمكنك تكوينها؟

إذا كان لديك جهاز يعمل بنظام التشغيل Windows مزودًا ببطاقة رسومات Nvidia، فيمكنك استخدام الإصدار الجاهز. (من المحتمل أن تكون هذه هي المرة رقم 114514 التي يفوز فيها لاو هوانغ بلعبة جونغ)

وفي الوقت نفسه، يحتاج الجهاز إلى تلبية الحد الأدنى من متطلبات التكوين - ذاكرة فيديو بسعة 4 جيجابايت + ذاكرة بسعة 8 جيجابايت.

حمل مباشرة من هنا أولا:

بعد فك الضغط، انقر نقرًا مزدوجًا فوق run.bat للتشغيل، وسيقوم النظام تلقائيًا بتنزيل النموذج ونشره، ويمكن استخدامه بعد اكتمال التكوين.

متطلبات التكوين لإصدار Linux هي نفس متطلبات Windows، لكن عملية التكوين أكثر تعقيدًا.

(إذا كان لديك Jupyter، يمكنك أيضًا الرجوع إلى ملف الملاحظات المستخدم في Colab)

أولاً، قم بتثبيت تبعيات البيئة:

gitclone مؤتمر نزع السلاح فوكووس conda env create -f بيئة.yaml كوندا تفعيل fooocus تثبيت النقطة -r require_versions.txt

ثم قم بتنزيل ملف النموذج وتخزينه في الدليل المحدد:

** ** لمزيد من التفاصيل، يرجى الرجوع إلى صفحة جيثب

بالطبع، يمكنك أيضًا السماح للنظام بتنزيل النموذج تلقائيًا:

بايثون Launch.py

إذا كنت تستخدم جهاز Mac، أو إذا كان تكوين الأجهزة لا يلبي المتطلبات، فيمكنك أيضًا تشغيله مباشرةً باستخدام Colab.

(منفذ:

ومع ذلك، ما لا يزال يتعين علي الشكوى منه هو أن إصدار Colab سوف يتعطل عدة مرات من وقت لآخر، إما أن يتوقف تلقائيًا أو تجاوز الذاكرة...

إذا كنت تريد تشغيل Fooocus بشكل أكثر سلاسة على جهاز Mac أو كمبيوتر بطاقة، فيمكنك انتظار تحديث المؤلف.

بشكل عام، تأثير إخراج صورة Fooocus جيد، إذا تم تحديد كلمة المطالبة بشكل جيد، فيمكن حتى استخدامها كنشر مستقر، والمفتاح هو أن متطلبات تكوين الأجهزة ليست عالية.

كيف بحق السماء هذا ممكن؟

من أحدث مشروع لمؤلف ControlNet

فيما يتعلق بالتصميم المعماري، ينقسم Fooocus بشكل أساسي إلى قسمين: الواجهة التفاعلية ونموذج الذكاء الاصطناعي.

من بينها، تشير الواجهة التفاعلية إلى مشروعين، هما: Stable-diffusion-webui وComfyUI.

يعد Stable-Diffusion-webui بشكل أساسي التصميم الأمامي للواجهة التفاعلية:

يحتوي ComfyUI على كل من واجهة المستخدم الرسومية والتصميم الخلفي لـ Stable Diffusion:

أما بالنسبة لنموذج الذكاء الاصطناعي، فيمكن ملاحظة أنه تم استخدام نموذج SDXL الجديد للانتشار المستقر:

يعد هذا حاليًا أحد أفضل إصدارات Stable Diffusion، وقد تم تحسين تأثير التوليد كثيرًا مقارنة بالإصدار السابق 1.5.

ومع ذلك، على الرغم من أن تصميم النموذج وواجهة المستخدم لـ Fooocus يشيران إلى مشروع Stable Diffusion مفتوح المصدر الجاهز، إلا أن المؤلف قام بدمج الكثير من تصميم التحسين الخاص به عند صنعه، مما جعل النموذج يعمل بشكل أكثر سلاسة.

على سبيل المثال، اعتمد المؤلف بعناية طريقة أخذ العينات k-diffusion المتقدمة التي صممها بنفسه في Fooocus، والتي يمكنها تحسين استمرارية أخذ العينات، وتقليل فقدان الأداء، وتحسين كفاءة أخذ العينات؛

بالإضافة إلى ذلك، قام المؤلف أيضًا بتعديل معلمات جهاز أخذ العينات (Sampler) بعناية، كما قام بتعديل وإضافة بعض الإعدادات الجديدة بما في ذلك نمط الفيلم على أساس الإصدار الأصلي.

سبب إضافة خيار LoRA إلى Fooocus هو أن المؤلف وجد أن نموذج SDXL مع LoRA (إعداد الوزن أقل من 0.5) دائمًا تقريبًا أفضل من نموذج SDXL بدون LoRA.

المؤلف الذي طور مشروع Fooocus يدعى Lvmin Zhang، وقد تخرج من جامعة Soochow في عام 2021 وهو حاليًا طالب دكتوراه في جامعة ستانفورد.

العديد من المشاريع التي قام بها، بما في ذلك ControlNet وstyle2paints، جميعها تقريبًا انفجرت:

والآن، يبدو أن المشروع الأخير، Fooocus، يحظى بشعبية مماثلة.

على وسائل التواصل الاجتماعي، قام بعض مستخدمي الإنترنت تلقائيًا بتجميع إصدار Fooocus لمجموعة من الكلمات السريعة في أنماط مختلفة من Excel.

إذا كنت لا تعرف نوع الصورة التي تريد إنشاؤها، فما عليك سوى الرجوع إلى الكلمات السريعة في هذا المستند:

هل اكتشفت نوع الصور التي تريد إنشاءها باستخدام Fooocus؟

عنوان المشروع:

الرابط المرجعي: [1] [2] مجموعة من الكلمات السريعة: [3] [4]

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت
تداول العملات الرقمية في أي مكان وفي أي وقت
qrCode
امسح لتنزيل تطبيق Gate.io
المنتدى
بالعربية
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)