كيف تستخدم ChatGPT Images 2.0؟ اختبار قائمة لحم البقر، غلاف مجلة، وتأثير التوعية بعدة لغات

robot
إنشاء الملخص قيد التقدم

أطلقت OpenAI أداة الصور 2.0 لـ ChatGPT، والتي تتميز بقدرات قوية في التنسيق المعقد ومعالجة النصوص متعددة اللغات (بما في ذلك الصينية)، ستقدم هذه المقالة شرحًا شاملًا لوظائف وميزات Images 2.0، وخطط الاستخدام المجاني والمدفوع، بالإضافة إلى نتائج الاختبار الفعلي.

ما هو ChatGPT Images 2.0؟ سنوضح لك الوظائف والميزات الرئيسية!

هل أداة إنشاء الصور الذكية التي تنافس Gemini Nano Banana 2 قد وصلت؟ أعلنت OpenAI عن إطلاق ChatGPT Images 2.0، المدعوم بنموذج GPT Image 2 الجديد، والذي يركز على إنتاج صور ذات قدرات اختيار، ترتيب، وكشف المعلومات، وفيما يلي أهم ثلاث ميزات لـ ChatGPT Images 2.0:

معالجة قوية للتنسيق والنصوص متعددة اللغات

أول ميزة واضحة هي تحسين كبير في قدرات التنسيق ومعالجة النصوص متعددة اللغات في ChatGPT Images 2.0.

ذكرت وسائل الإعلام الأجنبية «Techcrunch» أن أدوات توليد الصور بالذكاء الاصطناعي السابقة كانت غالبًا تعتمد على نماذج الانتشار، وغالبًا ما كانت تواجه صعوبة في كتابة النصوص بشكل صحيح، لكن ChatGPT Images 2.0 يمكنه بدقة عرض النصوص الصغيرة، والرموز، وواجهات المستخدم وغيرها من التفاصيل.

قالت OpenAI إن Images 2.0 أحرزت تقدمًا ملحوظًا في معالجة اللغات غير اللاتينية، بما في ذلك الصينية، واليابانية، والكورية، والهندية، والبنغالية، حيث يمكنها توليدها بوضوح عالٍ داخل الصور.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

قدرات تفكير جديدة والبحث عبر الإنترنت

بالإضافة إلى قدرات التنسيق ومعالجة النصوص متعددة اللغات، يوفر ChatGPT Images 2.0 قدرات تفكير جديدة، حيث يمكنه البحث في الإنترنت في الوقت الحقيقي للمساعدة في توليد الصور. قاعدة معرفته محدثة حتى ديسمبر 2025، مما يساعد على إنشاء محتوى يتضمن أحداثًا حديثة.

مصدر الصورة: أمثلة توليد رسمية من OpenAI لـ ChatGPT Images 2.0

دعم دقة 2K وتنوع نسب الطول والعرض

يدعم ChatGPT Images 2.0 توليد صور بدقة تصل إلى 2K، ويوفر خيارات أوسع لنسب الطول والعرض، من 3:1 العرضي إلى 1:3 الطولي.

قال الباحث في OpenAI، Boyuan Chen، إن بنية Images 2.0 قد خضعت لإعادة تصميم كاملة، وهي نموذج عام يمكنه، عبر أوامر نصية بسيطة، التعامل مع تحويلات زوايا بأسلوب ثلاثي الأبعاد واستنتاجات فضائية معقدة.

وظائف خطة الاستخدام المجاني والمدفوع لـ ChatGPT Images 2.0

هل الجودة مقابل السعر؟ تختلف الوظائف التي يمكن للمستخدمين المدفوعين من جميع المستويات فتحها، والتفاصيل كالتالي:

  • المستخدمون المجانيون: يمكنهم حاليًا استخدام نموذج ImageGen 2.0 الأساسي لأداء مهام توليد الصور القياسية. النسخة الأساسية تتضمن العديد من الترقيات الأساسية، مثل تحسين التوافق مع الأوامر، تأثيرات النصوص الأقوى، دعم متعدد اللغات، وخيارات نسب الطول والعرض المتنوعة.
  • مستخدمو ChatGPT Plus، Business، وEnterprise: يمكنهم تفعيل النموذج الجديد للتفكير. في هذا الوضع، يستخدم مولد الصور الخاص بالدردشة الإنترنت للبحث عن المعلومات، ويقوم بإنشاء رسومات تفسيرية استنادًا إلى الملفات التي يرفعها المستخدم، ويقوم بعمل استنتاجات هيكلية قبل توليد الصورة. يمكن توليد حتى 8 صور في نفس الوقت، مع ضمان التناسق في الشخصيات، والأشياء، والأساليب في كل مشهد.
  • مستخدمو Pro: يحصلون على وصول أكثر تقدمًا إلى نموذج ImageGen Pro. على الرغم من أن OpenAI لم توضح بعد الفروق الدقيقة بين Pro ووظيفة التفكير، إلا أن المستخدمين المؤسساتيين يمكنهم اعتبار وظيفة التفكير ترقية حقيقية، وتناسب المهام التي تتطلب حقائق، وتحويل المستندات الداخلية إلى رسومات تفسيرية، أو الحفاظ على التناسق البصري عبر أصول متعددة.
  • مطورو API: يمكنهم الآن دمج نموذج gpt-image-2، مع دعم دقة عالية وخيارات مرنة لنسب الطول والعرض.

اختبار ChatGPT Images 2.0: قوائم، مجلات، رسومات تفسيرية

هل الأداء الفعلي لـ ChatGPT Images 2.0 يطابق الدعاية من OpenAI؟ لنختبر ذلك.

اختبار قائمة مطعم لحم البقر

استخدم محرر «مدينة التشفير» خطة مجانية من ChatGPT لاختبار، وطلب إنشاء قائمة طعام لطبخة لحم البقر التايواني، مع توجيه بسيط: «ساعدني في إنشاء قائمة طعام تركز على لحم البقر التايواني، وتكون مكتوبة باللغة التقليدية، وتعرض أسماء الأطباق، الأسعار، ومعلومات الصور.»

وفيما يلي النتائج:

مصدر الصورة: توليد من ChatGPT Images 2.0

بالنسبة للمحتوى الذي يمكن توليده باستخدام الخطة المجانية، يبدو جيدًا للوهلة الأولى، لكن عند التدقيق ستلاحظ أن Images 2.0 لا تزال تواجه أخطاء في كتابة الحروف المعقدة في النصوص التقليدية، وربما تكون نتائج الخطط المدفوعة أفضل.

كما أن النتائج تقارب أسعار لحم البقر في تايبيه، ويمكنك طلب إضافة نودلز مجانًا مع الوجبة.

لكن إذا كنت تريد طباعة القائمة، فمن الأفضل تحويل الصور التي يوفرها ChatGPT Images 2.0 إلى ملفات متجهة (مثل EPS، ملفات .ai من Adobe Illustrator، PDF)، واستخدام ألوان CMYK، فهي الأنسب للطباعة. قد يقبل الطابعون ملفات JPG و PNG، لكن إذا كانت لديك متطلبات عالية للجودة، سيكون من الصعب تعديلها لتلبية رغباتك.

اختبار غلاف مجلة تقنية

ثم نختبر غلاف مجلة خيالية، وهذه المرة «مدينة التشفير» تختبر معالجة تنسيق معقد، مع طلب: «ساعدني في إنشاء غلاف مجلة تقنية مكتوب باللغة التقليدية، عنوانها «مدينة التشفير»، موضوعها «تقاطع البلوكشين والذكاء الاصطناعي»، ويجب أن يتضمن العنوان، رقم المجلد، رمز شريطي، وتاريخ انتهاء العرض فوق الباركود، ويجب أن تكون جميع النصوص واضحة ومحترفة في الترتيب.»

وفيما يلي النتائج:

مصدر الصورة: توليد من ChatGPT Images 2.0

هذه النتيجة مشابهة للسابقة، فهي تبدو جيدة من بعيد، لكن عند التدقيق في معالجة النصوص المعقدة، لا تزال هناك بعض الأخطاء، والخطوط المستخدمة على الغلاف تشبه خط «كينغسيف» من Justfont في تايوان، وربما يكون هناك ترخيص لاستخدامها.

وقد أثارت هذه الشكوك، كما حدث مع إطلاق Nano Banana Pro، حيث طرح المستخدمون تساؤلات حول:

  • تقرير ذي صلة: اختبار Nano Banana Pro: تحسن في النصوص الصينية! لكن تظهر مخاوف من حقوق النشر للرسوم المتحركة والخطوط

اختبار الرسوم البيانية متعددة اللغات

اختبر «مدينة التشفير» رسمًا بيانيًا يوضح أسباب حدوث زلزال، مكتوبًا بالصينية التقليدية، واليابانية، والكورية، ونجح في تقريبًا في عرض النصوص متعددة اللغات بشكل جيد. من ناحية التنسيق، تم تمييز اللغات بألوان مختلفة، رغم أن بعض النصوص المعقدة من الحروف الصينية والكورية لا تزال تظهر ضبابية عند التدقيق.

وفيما يلي النتائج:

مصدر الصورة: توليد من ChatGPT Images 2.0

صور تظل متسقة في الشخصيات والأشياء، وتسهّل العمليات المعقدة

بالإضافة إلى ذلك، فإن Images 2.0، مثل Nano Banana 2، تتيح التعديل، حيث يمكن النقر على زر «تحرير» أسفل الصورة المولدة لبدء التعديل، مما يحافظ على تماسك الشخصيات والأشياء، ويسهل تصميم صفحات المانغا، وسلسلة الصور الاجتماعية، أو مخططات تصميم غرف المنازل.

قالت Adele Li، مسؤولة منتجات ChatGPT Images، إن هذه الميزة تحل مشكلة الحاجة إلى توليد صورة واحدة تلو الأخرى يدويًا، وتسمح للمبدعين بإنشاء كتب أطفال ذات مظهر موحد أو مواد تسويقية للعلامات التجارية بسهولة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت