أعلنت شركة جوجل (Google) عن إطلاق الإصدار الرابع من نموذجها المتقدم لتوليد الصور، والمعروف باسم Imagen 4، وهو نموذج قائم على الذكاء الاصطناعي التوليدي، ويأتي بتحسينات كبيرة على مستوى جودة الصورة ودقة التفاصيل، إلى جانب قفزة واضحة في التعامل مع النصوص داخل الصور، وهي ميزة لطالما شكلت تحديًا أمام النماذج السابقة.
دقة مذهلة في التفاصيل وتحسينات واقعية
في بيان رسمي نُشر عبر مدونة شركة DeepMind التابعة لجوجل، صرح "إيلي كولينز"، نائب رئيس إدارة المنتجات، قائلاً:
"يمثل Imagen 4 خطوة متقدمة في تطوير الذكاء الاصطناعي المرئي، حيث يجمع بين السرعة والدقة في إنتاج صور عالية الجودة، قادرة على إظهار تفاصيل معقدة مثل الأقمشة متعددة الطبقات، قطرات الماء المتناثرة، وفراء الحيوانات بدقة واقعية تلفت النظر".
وأضاف أن النموذج الجديد يتميز بقدرته على التمييز بين الأنماط الواقعية والتجريدية، مع المحافظة على تناسق بصري فائق، ما يجعله أداة مثالية ليس فقط للفنانين الرقميين، بل أيضًا للمصممين والمستخدمين العاديين.
نماذج تجريبية واقعية بدرجة استثنائية
ضمن الإعلان الرسمي، شاركت جوجل مجموعة من الصور التي تم إنشاؤها باستخدام Imagen 4، منها صورة لحوت ضخم يقفز من سطح الماء بتفاصيل غاية في الدقة، وأخرى لحرْباء مغطى بألوان غنية وموزعة بدقة على جلده، ما يعكس قدرة النموذج على محاكاة الواقع بدرجة مذهلة.
إدخال النصوص داخل الصور بدقة عالية
من أبرز الميزات التي أبهرت المتابعين في نموذج Imagen 4 هي القدرة المحسّنة على إدخال النصوص داخل الصور بدقة ووضوح. هذه الخاصية التي طالما كانت مشكلة في النماذج السابقة أصبحت اليوم أحد أبرز نقاط القوة في الإصدار الجديد. حيث أظهرت الصور التجريبية أن النصوص داخل الصور تُعرض بوضوح حتى عند استخدام خطوط صغيرة الحجم، مثل تلك الموجودة في الطوابع البريدية أو أغلفة المنتجات.
تفتح هذه الميزة الباب أمام استخدامات واسعة، تشمل تصميم البطاقات الترويجية، الملصقات الإعلانية، القصص المصوّرة، والمزيد، وهو ما يجعل Imagen 4 منافسًا مباشرًا لنماذج OpenAI التي دخلت مؤخرًا بقوة في هذا المجال.
مدى توفر Imagen 4 وطرق الوصول إليه
ابتداءً من 20 مايو 2025، أصبح نموذج Imagen 4 متاحًا للاستخدام عبر عدة منصات، من بينها:
- تطبيق الذكاء الاصطناعي Gemini
- منصة Whisk
- خدمة Vertex AI
بالإضافة إلى دمجه بشكل مباشر في تطبيقات Google Workspace مثل:
- Google Docs
- Google Slides
- Google Vids
ويتيح هذا الانتشار للمستخدمين دمج إمكانيات النموذج في عملهم اليومي، سواء في إنتاج المحتوى، أو تقديم عروض تقديمية غنية بالصور التوضيحية، أو حتى إنشاء تصاميم دعائية.
إصدار أسرع في الطريق: أداء يتجاوز Imagen 3 بعشرة أضعاف
ولم تكتفِ جوجل بذلك، بل كشفت أيضًا عن نيتها إطلاق إصدار سريع ومحسّن من Imagen 4 قريبًا، مع وعد بأن يكون هذا الإصدار الجديد أسرع من Imagen 3 بما يصل إلى عشرة أضعاف، ما يجعله مثاليًا للتطبيقات التي تتطلب استجابة فورية، مثل الألعاب، التطبيقات الإبداعية، أو حتى واجهات الذكاء الاصطناعي للمستخدمين النهائيين.
ما الذي يميز Imagen 4 عن منافسيه؟
عند مقارنة Imagen 4 بنماذج توليد الصور الأخرى، نلاحظ مجموعة من المميزات الفريدة:
- دقة فائقة في عرض التفاصيل البصرية
- دعم ممتاز لإدخال النصوص داخل الصور
- سرعة كبيرة في إنتاج النتائج
- تنوع في الأنماط من الواقعية إلى الفن التجريدي
- تكامل سلس مع خدمات Google السحابية
مستقبل التصميم بالذكاء الاصطناعي
مع هذا التطور الكبير، تؤكد جوجل مرة أخرى ريادتها في مجال الذكاء الاصطناعي التوليدي، وتفتح الباب أمام عالم جديد من الإبداع البصري القائم على الأوامر النصية. فلا حاجة بعد اليوم إلى برامج التصميم المعقدة لإنشاء صور احترافية؛ كل ما تحتاجه هو وصف دقيق، وImagen 4 سيتولى الباقي.
يمثل Imagen 4 خطوة مهمة في مسار تطور أدوات توليد الصور باستخدام الذكاء الاصطناعي. ومن خلال دمجه لتحسينات دقيقة على مستوى جودة الصورة، وسرعته في التنفيذ، ودعمه المثالي للنصوص، فإنه يضع معيارًا جديدًا للأدوات المنافسة في السوق.