قامت شركة OpenAI بعرض Sora، نموذجها لتوليد الفيديو بالذكاء الاصطناعي، أمام المديرين التنفيذيين في صناعة الإعلام في الأسابيع الأخيرة لإثارة الحماس وتخفيف المخاوف بشأن إمكانية قيام التكنولوجيا بتعطيل قطاعات معينة.
أرادت صحيفة فاينانشيال تايمز أن تضع سورا – ومنافسيها – على المحك.
لقد طلبنا من المديرين التنفيذيين في مجال الإعلان والرسوم المتحركة والعقارات كتابة مطالبات لإنشاء مقاطع فيديو قد يستخدمونها في عملهم. ثم سألناهم عن آرائهم حول الكيفية التي يمكن بها لهذه التكنولوجيا أن تغير وظائفهم في المستقبل.
لم يتم طرح Sora للعامة بعد، لذا قامت OpenAI بتعديل بعض المطالبات قبل إرسال المقاطع الناتجة. في Runway وPika، تم إدخال المطالبات الأولية والمعدلة باستخدام نماذج الشركتين الأكثر تقدمًا. وهنا النتائج.
شارلوت بنيان، المؤسس المشارك لشركة Arq، مستشار إعلانات العلامات التجارية
نسخة OpenAI المنقحة من مطالبة بنيان بإنشاء حملة لـ “سوبر ماركت معروف في الشوارع الرئيسية”:
مقاطع فيديو Pike وRunway استنادًا إلى مطالبة بنيان الأصلية:
“كان عرض سورا للأشخاص متسقًا، في حين تم تقديم التصور الفعلي للملعب الخيالي بأمانة من حيث أوصاف العناصر المختلفة، والتي فشل الآخرون في توليدها.
“من المثير للاهتمام أن OpenAI غيرت كلمة “أطفال” إلى كلمة “أشخاص”، وأود أن أعرف السبب. هل هو سؤال وقائي؟ هل من الصعب تمثيل الأطفال لأنهم لم يتدربوا على الكثير منهم؟ لقد اختاروا كلمة “أشخاص” بدلاً من رجل قوقازي ذو لحية وشعر بني، وهو ما ولّده سورا بالفعل، مما يثير تساؤلات حول التحيز.
“شعرت بيكا بالسريالية كما لو كنت في لحظة فيلم ثلاثية. نسخة الأطفال أفضل بكثير من النسخة الخاصة بالأطفال جامعة السادة سريالية التكرار للبالغين، لكن بقية البيئة تفتقر إلى التفاصيل من الموجه. لدي ولع معين لحيوية [Pika’s children’s] النسخة، لأنها تنقل الشعور بالبهجة والسعادة بقوة أكبر من أي من الإصدارات الأخرى.
“كان المدرج في المنتصف إلى حد كبير. بالتأكيد، في نسخة البالغين، كان هناك خلل أقل، لكن تمثيل عناصر الملعب كان ناقصًا.
“من المحتمل أن أستخدم فيديو Sora كتجربة لشيء يمكننا إضفاء الحيوية عليه في تجربة افتراضية. من شأنه أن يظهر مرح الطعام. ومع ذلك، قد تحتاج إلى إضافة طبقة بشرية إلى المحتوى باستخدام أدوات التحرير.
“ستعمل هذه الأدوات على تسريع الطريقة التي نتواصل بها بالأفكار الإبداعية وتجعلها أكثر واقعية. على سبيل المثال، في المراحل الأولى من تقديم المفهوم إلى العلامة التجارية، فإن هذا من شأنه أن يسهل على العملاء فهم الشكل الذي يمكن أن يبدو عليه أو كيف سيعمل.
“تحتوي مطالبتي على مفاهيم إبداعية مجردة أصعب بالنسبة لهذه الأدوات. في كثير من الأحيان، في عالم الإبداع، تحاول إنشاء شيء لم يكن موجودًا من قبل. أعلم أن هناك الكثير من القلق وربما السلبية بشأن استيلاء الذكاء الاصطناعي على جميع وظائفنا، ولكن أعتقد أننا يجب أن نفكر في كيفية جعل الذكاء الاصطناعي وظائفنا أسهل وتخفيف بعض الأعباء.
أليكس ويليامز، رسام الرسوم المتحركة الذي تشمل اعتماداته فيلم “Who Framed Roger Rabbit؟” و”الأسد الملك”
مقاطع الفيديو التي تم إنشاؤها بواسطة موجه OpenAI المنقح:
“إنها تتمتع بتلك الجودة المتغيرة الطفيفة التي يتمتع بها العمل المولد بواسطة الذكاء الاصطناعي، والذي لا أعتقد أنه يجعله جاهزًا للعميل بعد، ولكن هذا شيء سيتم تسهيله.
“كل واحد منهم مذهل من حيث ما يفعله، ولكن كل واحد منهم [has] أخطاء واضحة. . . مثل تغير شكل الرؤوس واندماج طيور النحام مع طيور النحام الأخرى، الأمر لا يعمل بعد.”
«لم تتمكن من إنتاج فيلم قصير له بداية ووسط ونهاية، لذلك لم تفعل ما كنت أتمناه. ومن ناحية أخرى، فإن ما تفعله من حيث الرسوم المتحركة مثير للإعجاب للغاية.
“منذ أن بدأت في مجال الرسوم المتحركة في الثمانينات، أحدثت بعض التطورات التكنولوجية المهمة تغييرًا كبيرًا في عالم الرسوم المتحركة. ليس هناك شك في أن هذا هو أكبر تغيير رأيته في مسيرتي المهنية.
“أود إجراء مقارنات مع التحول من الرسوم المتحركة ثنائية الأبعاد إلى الرسوم المتحركة ثلاثية الأبعاد، والذي حدث في أواخر التسعينيات عندما قصة لعبة خرج. كان هناك الكثير من المقاومة بين مجتمع الرسوم المتحركة المرسومة يدويًا لهذه التغييرات، بما فيهم أنا، في البداية.
“لقد استغرق الأمر مني بضع سنوات لأدرك أنه كان عليّ أن أتقبل هذا التغيير. لقد حاربناه جميعًا بشكل جماعي لفترة من الوقت، لكنه أصبح المحرك العظيم لشباك التذاكر. كصناعة، نحن بحاجة إلى تبني التكنولوجيا لأنك لا تريد أبدًا أن تكون في الجانب الخطأ.
آشلي شاكيباي، مدير الإنتاج في شركة OBI Property للوكلاء العقاريين التجاريين
مقاطع الفيديو التي تم إنشاؤها بواسطة المطالبة بالفيديو الترويجي لمبنى تجاري في مانشستر:
“قام سورا بعمل معقول في البداية. سيكون الانتقال دائمًا صعبًا، وقد عانى من ذلك. لكنني أعتقد أن الصورة الواقعية في نهاية اللقطة كانت ممتعة ومدهشة للغاية.
“من الناحية الفنية، كان الموجه هو أن الناس كانوا يسيرون في المبنى، ولكن لم يتم إظهار ذلك وكان هناك العديد من العناصر الأخرى التي لم تحققها.
“كل ما جمعه بيكا من موجهي هو” يوم مشمس “. لقد أعطتنا بعض النيران وبعض المباني، لكن لا يمكنك تمييز الناس.
“كان علي أن أضحك عندما شاهدت هذا المدرج. هناك قدر أكبر من الواقعية ولكن الناس يسيرون للأمام ثم للخلف، لذلك فهو بالتأكيد مشهد غير قابل للتصديق.
“باعتباري متخصصًا في الصناعة، فإن توقعاتي هي الكمال. أنا أبحث عن فيديو بجودة واقعية، وربما لن يصل الذكاء الاصطناعي إلى هذا الهدف أبدًا.
“في نهاية فيديو سورا، يجري الزوجان محادثة في المقهى، ويبدو أنهما يستمتعان بوقتهما. ستكون هذه لقطة نستخدمها لبيع مساحة عقارية تجارية كوسيلة راحة قريبة.
“سنصل في النهاية إلى نقطة تصبح فيها هذه أداة قوية بشكل لا يصدق للمبدعين، مما يؤدي حتماً إلى القضاء على استخدام الأدوات الأخرى. سوف يتحدى Sora بشكل جدي مواقع الأسهم ودور الممثلين، وكلاهما نستخدمه الآن.
“يجب أن تكون حذرًا للغاية عند إضافة الصور التي يتم إنشاؤها بواسطة الكمبيوتر. إذا لم يكن لغرض ما، إذا لم يكن قابلاً للتصديق، فقد يكون مشتتًا للغاية. إنها في مرحلة الاختبار إلى حد كبير.”
تقارير إضافية من مادوميتا مورجيا