التكنولوجياآبل

يستطيع الذكاء الاصطناعي الجديد من أبل تعديل الصور بناءً على جمل لغوية بسيطة

يعد MGIE، نموذج الذكاء الاصطناعي الذي قدمته شركة أبل، بإحداث تحول في تحرير الصور من خلال تفسير التعليمات النصية، مما يمثل إنجازًا كبيرًا في الإبداع المدعوم بالذكاء الاصطناعي للشركة.


لقد اتخذ تطور الذكاء الاصطناعي في إنشاء الصور خطوات مهمة إلى الأمام، وعلى الأخص مع برنامج Bing Image Creator من مايكروسوفت، مما يوفر للمستخدمين القدرة على إنشاء صور من أوصاف النص. يُظهر هذا الابتكار والتحسينات اللاحقة في السرعة والكفاءة التقدم السريع الذي حققته الشركة في استخدام الذكاء الاصطناعي للتطبيقات الإبداعية.

لقد تفوقت مايكروسوفت مؤخرًا على شركة أبل من حيث التقييم، ويرجع ذلك أساسًا إلى التزامها والتقدم الكبير في مجال الذكاء الاصطناعي، كما يتضح من نجاحات ChatGPT-4 وCopilot Pro. وفي هذا السياق، تظهر مبادرة MGIE الخاصة بشركة أبل كاستجابة استراتيجية تهدف إلى الحفاظ على قدرتها التنافسية في مجال الذكاء الاصطناعي.

تقدم أبل نموذجًا جديدًا لتحرير الصور بتقنية الذكاء الاصطناعي

نتيجة للتعاون بين أبل والباحثين في جامعة كاليفورنيا في سانتا باربرا، يتميز MGIE (تحرير الصور الموجه بـ MLLM) بقدرته على فهم أوامر النص وتنفيذها لإجراء عمليات معالجة دقيقة على مستوى البكسل. هذه القدرة على تحويل التعليمات النصية البسيطة أو الغامضة إلى إرشادات واضحة ودقيقة تفتح إمكانيات جديدة لتحرير الصور بشكل بديهي. يُظهر هذا النموذج، الذي تم تقديمه في مؤتمر ICLR 2024، فعالية ملحوظة. فهو يقدم نتائج دقيقة تمت الموافقة عليها من قبل المستخدمين، مع العمل بسرعة ودون إهدار الموارد.

تتميز MGIE بقدرتها على إجراء مجموعة واسعة من عمليات تحرير الصور، بدءًا من تعديلات الألوان البسيطة وحتى تحويلات الكائنات المعقدة. يعمل القالب أيضًا على تحسين الصور بشكل عام ويسمح بالتعديلات المستهدفة في مناطق محددة. إنه يتفوق في قص الصور وتغيير حجمها وتدويرها، بالإضافة إلى ضبط السطوع والتباين وتوازن الألوان، كل ذلك من خلال مطالبات نصية بسيطة. يتوفر هذا البرنامج كمصدر مفتوح، ويسهل الوصول إليه عبر GitHub، مع موارد إضافية مثل دفتر ملاحظات تجريبي وعرض ويب على Hugging Face Spaces، مما يجعله مناسبًا للاستخدام مع مجموعة متنوعة من تطبيقات التحرير.

زر الذهاب إلى الأعلى