لعقودٍ من الزمن، كان تلوين الصور حيز إهتمامٍ مستمرٍ من قبل العامة. حتى وبعد أن نال تلوين الصور حصته من الإنتقاد، كان هنالك شيئًا مميزًا حول إضافة الألوان للصور غير الملونة. سواء أكان طريقة لإيصال الذكريات عبر الأجيال أو للتعبير عن الإبداع بصورةٍ فنيةٍ.
على أية حال، عملية إضافة الألوان يدويًا يمكن أن تتطلب الكثير من الوقت وتحتاج الكثير من الخبرة، مع الإجراءات التقليدية التي تستهلك ساعات وربما أيامًا لتصل الصورة حد الكمال. قدم فريقٌ من الباحثين تقنية جديدة لزيادة فعالية الشبكات المعقدة والذكاء الإصطناعي، مما يساعد العامة، حتى الذين لديهم قدرة فنية بسيطة في إنتاج صور ملونة مقبولة بصورةٍ سريعةٍ.
حمل البحث عنوان “مستخدم أنظمة الوقت الحقيقي يوجه التلوين مع سوابق معرفة عميقة” (Real – Time User Guided Colorization With Learned Deep Priors) وتم تأليفه بواسطة فريق من جامعة كاليفورنيا (UC Berkeley) بقيادة اليكسي ايفروس (Alexei A. Efros) البروفسور في الهندسة الكهربائية وعلوم الحاسب. وسيقدمون عملهم في مؤتمر صوريات الحاسوب أو ما يعرف بـ “SIGGRAPH” في العام الحالي. ويسلط هذا المؤتمر الضوء على بحوث مبدعة في مجال رسومات الحاسب والتقنيات التفاعلية حول العالم على حدٍ سواء. وسيعقد المؤتمر السنوي اليوم وحتى الثالث من أغسطس.
في البدايات الأولى للعمل، درب الفريق شبكة معقدة “Deep Network” على بيانات صورية ضخمة “مليون صورة” لتلوين الصور الرمادية تلقائيًا، بدون أي تدخل من المستخدم. وبينما كانت الصور المنتجة بإستخدام البرنامج جيدة جدًا، فقد كانت هنالك قيود لها تأثيرات معينة على الصور. أحد القيود المهمة كان لون المواضع العديدة – على سبيل المثال، القمصان – قد تكون غامضة بطبيعتها. وهكذا لم يكن بإستطاعة النظام أن يحسم أمره على إحتمالية لون موحد.
يقول ريتشارد زانغ (Richard Zhang) كاتب البحوث المشارك في هذه الدراسة والمرشح للدكتوراه من قبل البروفيسور ايفروس: “إن هدف مشروعنا السابق كان الحصول على تلوين واحد ومعقول” وأضاف قائلًا: “إذا لم يعجب المستخدم شيئًا ما أو أراد تغيير شيء ما، لم يكن بإستطاعته ذلك، أدركنا أن تمكين المستخدم وجعله يتفاعل مع البرنامج كان في الحقيقة شيء أساسي للحصول على النتائج المطلوبة”.
التدريب على الصور الرمادية
مع تدريب الشبكة الجديدة على الصور الرمادية، مع محاكاةٍ لمعطيات المستخدم. أبدى النظام تحسنًا بالمقارنة مع أنظمة التلوين السابقة بواسطة تمكين المستخدم ليصحح ويعدل أو يكيف عملية التلوين.
يقوم المستخدم بإرشاد النظام بواسطة أضافة نقط ملونة أو إيحائات ويقوم النظام بدوره بتعميمها على بقية الصورة. تقوم الشبكة أيضًا بتعلم الألوان العامة لمجموعة مختلفة من الأشياء وإقتراحها للمستخدم. على الرغم من أن النظام مدربٌ فقط على الصور الطبيعية – على سبيل المثال، تكون الفيلة أما رمادية أو بنية اللون – كما ويمكن للنظام أن يسير على هوى المستخدم، بتفعيل التلوين الخارج عن المعقول على سبيل المثال، – فيل زهري اللون – على الرغم من أنه غير المعقول أن يكون الفيل زهريُا – إلا أن النظام يعتبره معقولاً إن أراد المستخدم ذلك.
لتقييم النظام، إختبر الباحثون النظام على مستخدمين من العامة. متحدون إياهم لإنتاج صورٍ ذات تلوينٍ واقعي على صور رمادية مختلفة. وعلى الرغم من التدريب القليل والوقت المحدود – دقيقة واحدة فقط لكل صورة – تعلم المستخدمون بسرعة كيفية إنتاج صور ملونة والتي غالبًا ما خدعت الحكام – من البشر – في أختبار الحقيقي من المزيف.
تُستخدَم الشبكات المعقدة بصورة هائلة في الرسومات. ولربما بعد التغلب على المشاكل الباقية الأخرى مثل تنظيم إستخدام الذاكرة ومتطلبات الأجزاء الصلبة في الحاسب (Hardware)، وبمساعدة أدوات التعديل على الصور الموجودة. يمكن لنظامٍ كهذا أن يشق طريقه في عالم التلاعب بالصور للأغراض التجارية.