يثير ظهور الذكاء الاصطناعي العديد من الأسئلة الملحة لمنشئي المحتوى وصناعة الإعلام. أحد أهم هذه الأمور هو: كيف يمكننا التمييز بين الصور أو مقاطع الفيديو أو المقطوعات الموسيقية التي تم إنشاؤها بواسطة الذكاء الاصطناعي وبين الإبداعات البشرية؟ عندما أعلن الرئيس بايدن أمس أن سبع شركات تكنولوجية كبرى تتخذ خطوات طوعية لتنظيم تقنيات الذكاء الاصطناعي الخاصة بها ، ظهرت إجابة محتملة: العلامة المائية الرقمية. جوجل
جوجل
و OpenAI على وجه الخصوص ملتزمان بتطوير مخططات العلامات المائية للمساعدة في تحديد المحتوى الذي تم إنشاؤه باستخدام أدوات الذكاء الاصطناعي الخاصة بهم.
تأخذ العلامة المائية الرقمية اسمها من تقنيات عمرها قرون لتضمين علامات غير مرئية في الورق للإشارة إلى مصدرها وأصالتها ، وهي علامات يمكن رؤيتها إذا كانت الورقة مبللة ببعض السوائل. تحتوي معظم العملات الورقية اليوم ، على سبيل المثال ، على أنواع مختلفة من العلامات المائية. في وضع العلامات المائية الرقمية ، تعمل خوارزمية على ملف محتوى رقمي – صورة JPEG ، ملف صوتي MP3 ، ملف فيديو MP4 – لإدراج جزء صغير من البيانات بطريقة لا تؤثر على كيفية رؤيتها أو سماعها للمستخدم. يمكنك تشغيل برنامج على الملف لاستخراج تلك القطعة الصغيرة من البيانات ، والتي تسمى ملف الحمولة.
هذه التكنولوجيا ليست جديدة ولا نادرة. ظهرت تقنيات العلامات المائية الرقمية لأول مرة في التسعينيات. يتم استخدامها بشكل روتيني في العديد من أنواع المحتوى اليوم ، من الأفلام المعروضة في المسارح إلى الصور من وكالات الأسهم إلى الكتب الإلكترونية إلى ملفات الموسيقى الرقمية التي يتم بيعها عبر الإنترنت. في معظم الحالات ، يتم استخدامها لتتبع أصول المحتوى المشتبه في تعرضه للقرصنة. أدوات إنشاء المحتوى اليوم مثل Adobe
ADBE
يحتوي Photoshop على وظائف إضافية تمكن المستخدمين من تضمين علامات مائية غير مرئية.
تجعل خوارزمية العلامات المائية الجيدة إزالة الحمولة صعبة للغاية دون إتلاف المحتوى وقوية بما يكفي لتحمل التحولات مثل التقاط الشاشة للصور أو التسجيلات التناظرية للموسيقى الرقمية. نتيجة لذلك ، تكون سعة البيانات الخاصة بحمولة العلامة المائية صغيرة جدًا – عادةً بضع عشرات من البايتات – لذا لا يمكن حشر الكثير من المعلومات المفيدة في علامة مائية. بدلاً من ذلك ، عادةً ما تكون الحمولة عبارة عن معرف يُستخدم لفهرسة إدخال في قاعدة بيانات ، حيث يمكن تخزين معلومات حول المحتوى.
هذا يؤدي إلى استخدام العلامات المائية في الذكاء الاصطناعي. يمكن تعديل أدوات الذكاء الاصطناعي التوليدية بسهولة بحيث يتم تضمين علامة مائية عند إنتاج جزء من المحتوى. يمكن أن تشير الحمولة إلى إدخال في سجل عبر الإنترنت يخزن معلومات مثل اسم أداة الذكاء الاصطناعي ، والتاريخ والوقت ، وهوية المستخدم الذي استخدمها ، وربما معلومات حول كيفية أو ما إذا كان المستخدم قد شارك في إنشاء المحتوى. المعلومات الأخيرة مهمة ، على سبيل المثال ، في تحديد ما إذا كان المستخدم مؤهلاً كـ “مؤلف” المحتوى بموجب قانون حقوق النشر. يمكن لبائعي أدوات الذكاء الاصطناعي إتاحة أدوات استخراج العلامة المائية مجانًا للجمهور حتى يتمكنوا من فحص أي جزء من المحتوى يصادفونه لمعرفة أصول الذكاء الاصطناعي ، إن وجدت. قد تكون هذه الأدوات مثل “نظارات الرؤية بالأشعة السينية” للنظر في المحتوى والعثور على معلومات عنه.
هذا الاستخدام للعلامة المائية مشابه لمبادرة قائمة تسمى مبادرة أصالة المحتوى (CAI) ، والتي بدأتها Adobe في عام 2019. تم تصميم CAI في الأصل لتتبع أصل وأصل المحتوى ، لا سيما المحتوى الإخباري ، لتمييزه عن المعلومات المضللة ؛ تضم عضوية CAI منظمات صحفية مثل AP و New York Times
نيويورك تايمز
و بي بي سي. أعلنت Adobe مؤخرًا أنها تضيف إلى تطبيقاتها لتحرير الصور القدرة على تسجيل استخدام الذكاء الاصطناعي التوليدي ، مثل Adobe’s Firefly ، في أدوات CAI الخاصة بها.
ومع ذلك ، على الرغم من وجود التكنولوجيا ، إلا أن التحديات ما زالت تنتظرنا. أحدهما هو أن مخططات العلامات المائية تختلف من نوع واحد من المحتوى (على سبيل المثال ، الصور) إلى نوع آخر (مثل الموسيقى). آخر هو أنه لا توجد خوارزميات قياسية للعلامة المائية حتى لأنواع معينة من المحتوى. العديد من البائعين لكل منهم مخططات الملكية الخاصة به. هناك ما يسميه خبراء الملكية الفكرية “غابة براءات الاختراع” في التكنولوجيا: توجد العديد من براءات الاختراع المتعلقة بالعلامات المائية ، بعضها مملوك لشركات تحافظ عليها باستمرار وتستخدمها لاستخراج رسوم الترخيص ، مثل التهديد أو رفع دعاوى قضائية لانتهاك براءات الاختراع. لن يكون من الممكن وضع معايير لمخططات العلامات المائية التي يستخدمها جميع بائعي أدوات إنشاء محتوى الذكاء الاصطناعي دون الشروع في عملية طويلة ومثيرة للجدل تتضمن تحديد براءات الاختراع والترخيص.
هذا يعني أنه في المستقبل المنظور ، من المرجح أن يقوم كل بائع لأدوات الذكاء الاصطناعي بتطوير مخطط العلامات المائية الخاص به واتخاذ قراراته الخاصة بشأن مسؤولية براءات الاختراع وترخيص التكنولوجيا. نتيجة لذلك ، سيكون من الضروري استخدام عدة مجموعات من “نظارات الرؤية بالأشعة السينية” للعثور على العلامات المائية في المحتوى.
سيكون من الممكن أيضًا لموردي تقنية الذكاء الاصطناعي أن يجتمعوا معًا على تنسيق قياسي لبيانات الحمولة وحتى سجل مشترك (قاعدة بيانات) لتخزين المعلومات التي تشير إليها الحمولات. في عام 2009 ، أنشأت RIAA حمولة قياسية للعلامة المائية لملفات الموسيقى التي تم تصميمها للعمل مع أنظمة العلامات المائية الصوتية المتعددة.
يجب أن تسير شركات تكنولوجيا الذكاء الاصطناعي هذه في مسار تنسيقات الحمولة القياسية ، والتسجيل المشترك ، وأدوات الكشف عن العلامة المائية المتاحة مجانًا. هذا هو الجانب الأفضل لقاعدة 80/20 عندما يتعلق الأمر بتوحيد هذه التكنولوجيا لصالح الجميع في فترة زمنية معقولة – والوقت هو الجوهر هنا. سيمكن هذا النوع من وضع المعايير بائعي تقنيات الذكاء الاصطناعي الآخرين ، بما في ذلك العديد من الشركات الناشئة القادمة ، من الانضمام بسهولة.
هناك العديد من الأسباب الوجيهة لتحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي وتمييزه عن المحتوى الذي أنشأه البشر وحتى المحتوى الذي أنشأه الأشخاص بمساعدة الذكاء الاصطناعي. من المحتمل أن يؤدي الذكاء الاصطناعي إلى انفجار المحتوى الذي يقزم ما ابتكره البشر ، حتى مع الأدوات الرقمية القوية التي نمتلكها اليوم. على سبيل المثال ، تفاخرت شركة الموسيقى الناشئة Mubert في الأسبوع الماضي فقط بأن تقنيتها قد أنشأت أكثر من 100 مليون مقطع صوتي ، أي ما يعادل حجم مكتبة Spotify بأكملها. وعلى الرغم من أن Mubert لم يحاول تحميل كل تلك الموسيقى إلى Spotify ، إلا أن شركة أخرى لموسيقى الذكاء الاصطناعي تدعى Boomy فعلت ذلك بالضبط – واتخذت Spotify خطوات لإزالتها. هذه مجرد مناوشة فيما سيكون بالتأكيد عملية طويلة لتعطيل الموسيقى وأنواع أخرى من المحتوى ، والنتيجة بعيدة كل البعد عن الوضوح.
بالطبع ، سيكون استخدام العلامة المائية لتحديد المحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي أمرًا اختياريًا ؛ لا مفر من بائعي تقنيات الذكاء الاصطناعي الذين يرفضون استخدام العلامات المائية ، حتى لو كانت التكنولوجيا مجانية الاستخدام. (وبالطبع ، سيبحث المتسللون عن طرق لإزالة العلامات المائية للذكاء الاصطناعي دون تغيير المحتوى). وهذا يؤدي إلى الحاجة إلى تحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بعد إنشائه.
هذه التكنولوجيا موجودة اليوم كفرع من الأدوات للكشف عن الانتحال في المهام الكتابية في المدارس والكليات. تعمل شركات أخرى على تطوير تقنية لاكتشاف المحتوى المرئي والمسموع الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي ، وذلك بهدف القضاء على التزييف العميق. سيؤدي هذا حتمًا إلى سباق تسلح بين أدوات الكشف عن الذكاء الاصطناعي وأدوات إنشاء المحتوى بالذكاء الاصطناعي. ومع نمو الاحتياجات التجارية لاكتشاف محتوى الذكاء الاصطناعي – على سبيل المثال ، إذا قررت Spotify عدم قبول أشكال معينة من الموسيقى التي تم إنشاؤها بواسطة الذكاء الاصطناعي في كتالوجها الواسع – فسوف يتسارع سباق التسلح.
يقول البعض أن اكتشاف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي هو مهمة خيالية. ومع ذلك ، قيلت أشياء مماثلة حول تقنية التعرف على المحتوى لاكتشاف الموسيقى والنصوص والفيديو المحمية بحقوق الطبع والنشر عبر الإنترنت في التسعينيات – وهي تقنية مماثلة لاكتشاف الذكاء الاصطناعي بطرق معينة. في البداية ، لم تكن تقنية التعرف على المحتوى دقيقة للغاية ، ولكن مع تزايد الحاجة إليها مع ظهور مشاركة الملفات عبر الإنترنت والمسؤولية عن حقوق النشر ، تحسنت التقنية – لدرجة أنها تُستخدم حاليًا يوميًا في خدمات مثل YouTube و Facebook. إنها ليست مثالية ، لكنها تعمل بشكل جيد بما يكفي لإرضاء مالكي حقوق الطبع والنشر في معظم الأوقات. قد يحدث الشيء نفسه مع اكتشاف الذكاء الاصطناعي ؛ علينا فقط أن ننتظر ونرى.