المواضيع الرائجة:

برنامج فوتوشوب يُبتلع بواسطة مربع الحوار

 أدوات معالجة الصور بالذكاء الاصطناعي تجعل عملية التحرير تبدو أقل شبهاً بالبرامج وأكثر شبهاً بالمحادثة، لكن المحادثة ليست تعاونية دائماً.

شخص، حيوان، حشرة
نانو بنانا  جوجل

بعد عودتي من رحلةٍ حديثة، وجدتُ نفسي أُفرز كومةً من الصور التي تحتاج إلى بعض التعديلات. لا شيء مُلفت للنظر، مجرد عنصر مُشتت هنا، أو تفصيل غير مُناسب في الخلفية هناك. أول ما خطر ببالي هو برنامج فوتوشوب ، لكن النسخة الكاملة منه تتطلب اشتراكًا، وأنا لستُ ماهرًا بما يكفي لتبرير دفع ثمنه، كما أنني لستُ بحاجة إلى كل ما يُقدمه.

لم تكن تطبيقات تحرير الصور على الهاتف المحمول أكثر جاذبية. لديّ أصابع سميكة، وهناك نوع خاص من الإحباط ينشأ من محاولة إجراء تعديل دقيق على شاشة الهاتف، ثم النقر على الشيء الخطأ ثلاث مرات متتالية.

لذا فكرتُ في تجربة البديل الواضح. لقد شهدت أدوات معالجة الصور بالذكاء الاصطناعي تطورًا ملحوظًا، ويبدو أن جميع شركات التكنولوجيا مقتنعة بأن مربعات الإدخال هي مستقبل هذه الأدوات. فلماذا لا أجرب وصف التعديلات التي أريدها ببساطة، وأترك ​​للجهاز مهمة الباقي؟

وبصراحة، لقد نجحت هذه الطريقة. أحيانًا. وفي أحيان أخرى، شعرتُ وكأنني عالقٌ في جدالٍ مهذبٍ مع برنامجٍ يُسيء فهم تعليماتٍ منطقيةٍ تمامًا. كانت هذه التجربة كافيةً لأُدرك أن تحرير الصور يتطور بسرعة، ولكنه لا يصبح بالضرورة أسهل.

لماذا يرغب كل محرر في أن يصبح صندوق دردشة

سرعان ما أصبح هذا التفاعل هو الشكل الجديد لتحرير الصور. تعمل أدوبي على دمج Firefly بشكل أعمق في برنامج فوتوشوب، وتجري تجارب على مساعدين إبداعيين تفاعليين. حوّلت كانفا مهام التصميم إلى مجموعة واسعة من الأزرار "السحرية". وتدور أدوات معالجة الصور Gemini من جوجل، وتقنية توليد الصور ChatGPT ، وMidjourney، وIdeogram، وRunway، وغيرها من منصات الذكاء الاصطناعي المرئي الطموحة ، حول الفكرة نفسها: أن يكون التحرير أشبه بطلب المساعدة منه بتشغيل برنامج.

السبب ليس غامضاً. فمعظم الناس لم يرغبوا قط في أن يصبحوا خبراء في الفوتوشوب. لم يرغبوا في حفظ أدوات التحديد، وأنماط المزج، وطبقات التعديل، وفرش المعالجة، والفرق الدقيق بين "حفظ" و"تصدير باسم". كل ما أرادوه هو إزالة شخص من الخلفية، أو إصلاح صورة مائلة، أو توسيع مشهد، أو تحسين صورة منتج، أو إنشاء صورة جيدة بما يكفي لعرض تقديمي دون الحاجة إلى فتح دروس تعليمية تبدأ بعبارة "أولاً، افهم سير العمل غير التدميري".

مربع الأسئلة جذاب لأنه يتجاوز المقدمة. فهو لا يسأل عما إذا كنت تعرف ما هو قناع الطبقات، بل يطلب النتيجة مباشرة.

جاذبية هذه التقنية واضحة، وأحيانًا تُشعرك حقًا بالتحرر. يستطيع المستخدم العادي الآن إنجاز ما كان يتطلب سابقًا الصبر، أو معرفة بالبرامج، أو حتى صديقًا يملك برنامج فوتوشوب ويدين له بمعروف، وذلك في غضون 20 ثانية فقط. كان العائق القديم تقنيًا، أما العائق الجديد فهو أقل وضوحًا: لا يزال عليك معرفة ما يبدو صحيحًا، وما يبدو مزيفًا، وأين قرر الجهاز الارتجال بهدوء.

عندما يصبح التحرير تفاوضاً

المشكلة تكمن في أن طلب المساعدة لا يعني بالضرورة الحصول عليها. أي شخص استخدم أدوات معالجة الصور بالذكاء الاصطناعي لأكثر من خمس دقائق يعرف ذلك الشعور المزعج الذي ينتابك عندما تكون النتيجة قريبة من المثالية، مما يزيد الأمر سوءًا. يختفي الشخص، لكن الخلفية تبدو الآن وكأنها ورق جدران ذائب. الإضاءة أفضل، لكن الصورة بأكملها تبدو وكأنها التُقطت لعيادة أسنان فاخرة. تحرك العنصر إلى المكان الذي تريده، لكن الذكاء الاصطناعي أعاد تصميم الطاولة بهدوء، وغير الظلال، وأضاف إصبعًا إضافيًا غامضًا، لأن الأيدي، على ما يبدو، اختيارية.

هنا يتحول التعديل إلى تفاوض. لم تعد تعدّل الصورة فحسب، بل تعدّل الطلب أيضاً. اجعلها أكثر دفئاً، لكن لا تجعلها مصطنعة. أزل ذلك العنصر، لكن حافظ على الخلفية طبيعية. اجعل السماء أكثر كآبة، لكن لا تحوّلها إلى ملصق خيالي. أبقِ الوجه كما هو، وهذا أمر بديهي، لكنه ضروري.

كانت أدوات التحرير القديمة مزعجة لأنها تجبرك على تعلم قواعدها. أما التحرير القائم على التوجيهات فهو مزعج لأنه يتظاهر بأن اللغة كافية، وهذا هراء محض. فاللغة مبهمة، والحكم البصري غير دقيق، ونماذج الذكاء الاصطناعي لديها عادة سيئة تتمثل في ثقتها بنفسها كما يثق المتدرب العادي: سريعة، متحمسة، ومقتنعة أحيانًا بأن المهمة تتضمن قمرًا ثانيًا.

"قم بالتكبير والتحسين!"

تعد النسخة التسويقية بمصممين فوريين. أما الواقع فهو أقل واقعية وأقل إرضاءً: إذ أصبح بإمكان عدد أكبر من الناس الآن تصميم أشياء ذات أشكال مميزة دون فهم الآليات الكامنة وراءها. ومع ذلك، يبقى هذا تحولاً مهماً، لكنه يستحق قدراً أكبر من الشك مقارنةً بأي عرض توضيحي لمنتج تعمل فيه كل التعليمات من المحاولة الأولى.

غالباً ما تكون النتيجة الأولى هي أفضل وسيلة للترويج. قد تبدو رائعة للوهلة الأولى، خاصةً عندما يكون التعديل بسيطاً. ثم تطلب إجراء تعديلات. اضبط الإضاءة. استعد التفاصيل. اجعل الوجه أقل شمعية. بعد عدة جولات، قد تبدأ الصورة بالانحراف عن مسارها. تتلاشى التفاصيل، ويتحول الأشخاص إلى كتل غير واضحة، ويصبح التعديل البسيط أقل إثارة للإعجاب كلما حاولت إصلاحه.

بالنسبة للمحترفين، قد يكون ذلك مفيدًا دون أن يكون مريحًا. يصبح العمل الرتيب أسرع، لكن الإشراف يزداد صرامة. لا يزال على أحدهم أن يكتشف الصورة الباهتة، والتكوين غير المتناسق، والتفاصيل الباهتة، والنتيجة المبهرة لثلاث ثوانٍ فقط قبل أن يلاحظها أي شخص آخر. يتحول جزء من العمل من مجرد تنفيذ إلى توجيه، وهو ما يبدو أسهل حتى يبدأ المتدرب بمنح الجميع بشرة ناعمة كالحرير وإضاءة مثالية بشكل مثير للريبة.

بالنسبة للمستخدمين العاديين، تصبح واجهة المستخدم أكثر سهولةً وتقترب منهم إمكانيات التحكم. لكنّ الإحباط يصبح أكثر صعوبةً في وصفه. عندما كان المحرر التقليدي يزعجك، كان لديك على الأقل أزرار للتحكم. أما عندما يُخطئ محرر الذكاء الاصطناعي في تلبية طلب معقول، فإنّ المشكلة تبدأ في الظهور وكأنها حوارٌ يسير بشكل سيئ.

سيبقى برنامج فوتوشوب. عادةً ما تبقى الأدوات القوية. لكن منطقها القديم يُدمج في واجهة أبسط وأكثر غرابة. قد لا يكمن مستقبل التحرير في معرفة أماكن الأدوات، بل في تعلم كيفية التواصل مع جهاز يتظاهر باستمرار بأنه يفهمك

إرسال تعليق