ابق على اطلاع بالتحديثات المجانية
ببساطة قم بالتسجيل في الذكاء الاصطناعي myFT Digest – يتم تسليمه مباشرة إلى صندوق الوارد الخاص بك.
قد يكون من التسرع الاستقراء من عينة بحجم شخص واحد (أنا). لكنني أعترف أن ذاكرتي ليست مثالية: أنسى بعض الأشياء، وأربك البعض الآخر، وأحيانًا “أتذكر” أحداثًا لم تحدث أبدًا. وأظن أن بعض قراء “فاينانشيال تايمز” قد يكونون مشوشين بالمثل. يمكن للآلة الذكية أن تسمي هذا هلوسة بشرية.
نتحدث كثيرًا عن نماذج الذكاء الاصطناعي التوليدية التي تهلوس الحقائق. نحن نجفل من المحامي الذي قدم وثيقة للمحكمة تحتوي على قضايا وهمية اخترعها ChatGPT. أحد زملاء “فاينانشيال تايمز”، الذي دفع برنامج الدردشة الآلي إلى إنتاج مخطط لتكاليف التدريب على نماذج الذكاء الاصطناعي التوليدية، اندهش عندما رأى أن النموذج الأغلى الذي حدده لم يكن موجودا (ما لم يكن لدى النموذج إمكانية الوصول إلى المعلومات الداخلية). وكما يكتشف كل مستخدم سريعًا: هذه النماذج غير موثوقة، تمامًا مثل البشر. السؤال المثير للاهتمام هو: هل الآلات أكثر قابلية للإصلاح منا؟ قد يكون من الأسهل إعادة كتابة التعليمات البرمجية بدلاً من إعادة توصيل الدماغ.
أحد أفضل الأمثلة على قابلية الذاكرة البشرية للخطأ هو الشهادة التي قدمها جون دين، المستشار القانوني للبيت الأبيض في إدارة ريتشارد نيكسون. في جلسات الاستماع في فضيحة ووترغيت عام 1973، عُرف دين باسم “المسجل البشري” بسبب ذاكرته الرائعة. لكن دون علم دين، قام نيكسون بتركيب جهاز تسجيل حقيقي في المكتب البيضاوي. لذلك تمكن الباحثون من مقارنة رواية دين للمحادثات المهمة مع النسخ المكتوبة.
في ورقة بحثية صدرت عام 1981 لتحليل شهادة دين، سلط عالم النفس أولريك نيسر الضوء على العديد من الهفوات الصارخة وإعادة تفسير المحادثات في رواية المحامي – بالإضافة إلى صعوبة تحديد الحقيقة والدقة. في ورقته، ميز نيسر بين الذاكرة الدلالية والذاكرة العرضية. وكان دين على حق تقريباً عندما تذكر الجوهر العام لمحادثاته مع نيكسون – وطبيعة التستر على فضيحة ووترغيت – حتى لو كان مخطئاً تماماً بشأن تفاصيل حلقات معينة.
يمكن للمرء أن يجادل بأن النماذج اللغوية الكبيرة تفعل العكس: فنظرًا لجميع البيانات التي تستوعبها، يجب أن تتمتع بذاكرة عرضية جيدة (على الرغم من أنها يمكنها توليد مخرجات قمامة باستخدام المدخلات المهملة). لكن لا يزال لديهم ذاكرة دلالية ضعيفة. على الرغم من أن برنامج LLM من المحتمل أن يلخص تسجيلات المكتب البيضاوي بشكل أكثر دقة مما يتذكره دين المحادثات بعد أشهر، إلا أنه لن يكون لديه فهم سياقي لأهمية هذا المحتوى.
يعمل الباحثون على إيجاد طرق لتحسين الذاكرة العرضية لنماذج الذكاء الاصطناعي التوليدية وتقليل الهلوسة. اقترحت ورقة بحثية حديثة أجراها باحثون في Google DeepMind منهجية جديدة تسمى “آمنة” – مقيم الحقائق المعزز بالبحث. يتم تقسيم الاستجابات التي تم إنشاؤها بواسطة النموذج إلى جمل مكونة ويتم فحصها مقابل بحث Google للتأكد من صحتها أو صحتها. تدعي الورقة أن هذا النظام التجريبي يتفوق على المدققين البشريين في التحقق من الحقائق من حيث الدقة وهو أرخص بأكثر من 20 مرة.
“في السنوات القليلة المقبلة، سنكون قادرين على التحقق من مخرجات النماذج اللغوية الكبيرة بدقة جيدة. أعتقد أن هذا مفيد جدًا،» هذا ما أخبرني به أحد مؤلفي البحث، كوك لو. ويقول إن الهلوسة هي سمة من سمات ماجستير إدارة الأعمال التي يجب الترحيب بها عندما يتعلق الأمر بالإبداع، وهي خطأ يجب قمعه عندما يتعلق الأمر بالواقعية.
في هذه الأثناء، لا يزال بإمكان حاملي الماجستير في القانون أن يخلطوا بين الإبداع والواقعية. على سبيل المثال، عندما طلبت من مساعد الطيار في Microsoft Bing أن يخبرني بالرقم القياسي العالمي لعبور القناة الإنجليزية سيرًا على الأقدام، أجاب بثقة: “إن الرقم القياسي العالمي لعبور القناة الإنجليزية سيرًا على الأقدام بالكامل يحمله كريستوف واندراتش من ألمانيا، الذي أكمل الرحلة الإنجليزية سيرًا على الأقدام”. العبور خلال 14 ساعة و51 دقيقة بتاريخ 14 أغسطس 2020”. بسهولة، حتى أنها قدمت اقتباسًا لهذه الحقيقة. لسوء الحظ، تبين أن المرجع هو مقال تم نشره العام الماضي يسلط الضوء على الهلوسة الناتجة عن ChatGPT.
لا ينبغي لنا أن نركز فقط على كيفية إنشاء المحتوى، ولكن أيضًا على كيفية وصوله، وفقًا لماريا شنيل، كبير مسؤولي اللغات في RWS، التي تقدم خدمات النصوص والترجمة المدعومة بالتكنولوجيا لأكثر من 8000 عميل في 548 مجموعة لغة. في عالم حيث أصبح المحتوى رخيصًا ومنتشرًا في كل مكان على نحو متزايد، سيصبح من المهم للغاية تخصيص المعلومات لجمهور محدد في شكل ولغة وسياق ثقافي يفهمونه، وهذا يتطلب لمسة إنسانية.
“من السهل نسبيًا أتمتة الدقة. يقول شنيل: “إن الملاءمة ليست أمرًا مسلمًا به”. “علينا أن نفكر في كيفية تلقي المحتوى، وهذا هو المكان الذي يعاني فيه الذكاء الاصطناعي.”
في الوقت الحالي، على الأقل، يستطيع البشر والآلات العمل معًا بشكل مثمر لتضخيم قدراتهم المختلفة وتقليل عيوبهم.
john.thornhill@ft.com