شبكات اجتماعية

الذكاء الاصطناعي لفيسبوك يمكنه ترجمة الكلمات إلى صور، والعكس

شارك هذا الموضوع:

هاشتاق عربي 

هذا العام، كشفت فيسبوك لأبحاث الذكاء الاصطناعي (FAIR) عن شبكتهم العصبي في مؤتمر GPU للتكنولوجيا.

في هذا الحدث، أظهروا قدرة تكنولوجيتهم على خلق صور افتراضية من أوصاف مكتوبة.

في هذا العرض، أظهر الفريق قدرة الشبكة العصبية عن طريق كتابة كلمة “شاطئ”، والتي استخدمها الذكاء الاصطناعي لتوليد صورة لرسمة شاطئ تحت السماء. ثم قاموا بكتابة عبارة “شاطئ – سحب” التي سرعان ما تبعها صورة مماثلة ولكن دون السحب هذه المرة.  وفي ختام عرضهم أدخلوا عبارة “شاطئ الغروب – السحب” وولّد الذكاء الاصطناعي صورة لغروب الشمس على شاطئ، تحت سماء صافية.

الفيديو أدناه يوضح ما قد يعنيه هذا النوع من التكنولوجيا لعامة الناس لا سيما ذوي الإعاقات البصرية.

كما هو مبين، تمكن فريق فيسبوك لبحوث الذكاء الاصطناعي من تدريب هذه الشبكة العصبية لربط كلمات معينة بالصور المقابلة لها.

فعلوا ذلك باستخدام حاسوب فائق لإظهار آلاف الصور المتنوعة للشبكة العصبية.

ما يميز الشبكة العصبية الخاصة بفيسبوك هي قدرتها على ربط مزيج من الكلمات بالصور المقابلة المناسبة. يمكن للذكاء الاصطناعي إضافة وصف أو إزالة جوانب معينة من الصورة على حد سواء، ليستوفي الوصف النصي. وهذا يسمى بواجهة اللغة الطبيعية.

هذه الخدعة تعمل بشكل جيد مع الصور ثنائية الأبعاد، ولكن الشركة لديها طموحات أكبر تتضمن توليد صور ثلاثية الأبعاد باستخدام واجهة اللغة الطبيعية ذاتها.

الترقي من الصور ثنائية الأبعاد إلى الصور ثلاثية الأبعاد ليس بالمهمة السهلة. إذ ينطوي على تمكين الشبكة العصبية من التعرف على المساحات ثلاثية الأبعاد ثم تدريبها للتعرف على العديد من الموجودات ثلاثية الأبعاد، الأمر الذي ليس بوفرة ما هو متوفر للصور ثنائية الأبعاد. لحسن الحظ، الإزدهار الراهن في صناعات الواقع الافنراضي والواقع المعزز قد تفتح الباب إلى عالم من الموجودات المختلفة، مما يجعل المراهنة على أن المستقبل القريب سيتضمن خلقاً لعوالم افتراضية كاملة بمجرد القول، رهاناً رابحاً.

المصدر: مرصد المستقبل

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى