في عمود اليوم ، أقوم بفحص الاتجاه الجديد الساخن في مرسوم مجتمع الذكاء الاصطناعى الذي يمكن تقييمه أو تقييم نماذج اللغة الكبيرة (LLMS) أو تقييمها عبر ردود فعلها في كل منها. نعم ، هذا صحيح ، بدلاً من استخدام مقاييس كمية Ironclad التقليدية لمقارنة أفضل AI LLMS ، فإن أحدث شيء رائع يجب القيام به هو الادعاء بأن الذكاء الاصطناعي لديك ردود فعل إيجابية حقًا. هذه حركة متزايدة يجب أن ترفع الحواجب وتوضح بشكل صريح إلى سطوعها وملفاتها المليئة باليدين.
لنتحدث عن ذلك.
يعد هذا التحليل للاشتعمان المبتكر من الذكاء الاصطناعي جزءًا من تغطية عمود Forbes المستمرة على الأحدث في الذكاء الاصطناعي ، بما في ذلك تحديد وشرح تعقيدات الذكاء الاصطناعي المختلفة (انظر الرابط هنا).
المشاعر تدخل في عالم الذكاء الاصطناعي
تتكون الطريقة المعتادة لتقييم AI و LLMS من قياس المقاييس الرئيسية المختلفة ثم مقارنة كيفية أداء كل من هذا القبيل وفقًا لذلك (مثل حساب TTFT ، ووقت للرمز المميز الأول ، والرموز TPS ، في الثانية ، وما إلى ذلك). هناك مناقشات مستمرة حول المقاييس الأكثر ملاءمة أو مرضية ، ولكن على الأقل تستلزم الأمر قياسات كمية. من الممكن إلى حد ما بالنسبة لصانعي الذكاء الاصطناعى أن يحاولوا تجفيف نتائجهم على الرغم من أن أطراف ثالثة تمكنت من الوصول إلى أدوات الذكاء الاصطناعى ، فإن الحفلة ترتفع تقريبًا. يمكن أن تحصل تلك الأطراف الثالثة على نتائج مختلفة ويبلغ عن أن شيئًا ما يبدو أنه خاطئ. في النهاية ، تحكي الأرقام القصة.
في الأشهر الأخيرة ، كان هناك نوع من التقييم الأكثر غامضًا وسوءًا يدخل في مفردات الذكاء الاصطناعي. له علاقة مع المشاعر. قد يقول صانع الذكاء الاصطناعى أن LLM الخاص بهم يعرض ردود فعل إيجابية ويقترح أنه حتى لو لم تكن مقاييس المتشددين لا تصل إلى السخرية ، فلا بأس لأن المشاعر تتنقل بدلاً من ذلك.
لكي نكون واضحين ، تكون المشاعر كأداة قياس بالكامل في عين الناظر.
هذه طريقة مريحة للغاية لقياس الأشياء لصانع الذكاء الاصطناعى. لا يمكن لأحد أن يدحض هذا الادعاء بالكامل. إذا كان شخص ما لا يعرض الذكاء الاصطناعى المشاعر ، فيمكن لصانع الذكاء الاصطناعى أن يتجاهلوا أكتافهم ويقولون ، حسنًا ، يشعرون بذلك ، وليس الجميع بالضرورة أن يكون لديهم نفس إحساس الجشطت بالنيابة. في هذه الأثناء ، يستمر صانع الذكاء الاصطناعى في وصف المشاعر الجميلة التي ينبعثها الذكاء الاصطناعي.
إذا استمر هذا الاتجاه في اكتساب البخار ، فإن القدرة على قياس تقدم تقدم الذكاء الاصطناعى بدقة ، ستكون للأسف.
ما الذي حصل على الكرة المشاعر
يمكن بشكل عام تتبع قوة دافعة ملحوظة نحو تبني معايير المشاعر إلى تغريدات سام ألتمان من Openai في مارس وفبراير من هذا العام. إنه ليس من الذكاء الاصطناعي الوحيد الذي يسير في هذا الطريق (جانبا ، في نشر قادم ، سأناقش صعود “الترميز المطحون” الذي بدأه منظمة العفو الدولية الأخرى وأصبحت ظاهرة في المطالبة بالنيابة العامة).
فيما يلي مثال على مرجع المشاعر من قبل سام ألمان في نشر على X (11 مارس 2025):
- “لقد قمنا بتدريب نموذج جديد جيد في الكتابة الإبداعية (ليس متأكدًا بعد كيف/عندما يتم إطلاقه). هذه هي المرة الأولى التي أصابني فيها حقًا بشيء كتبه الذكاء الاصطناعى ؛ لقد حصلت على أجواء metafiction بشكل صحيح.”
تعرض منشوراته قبل أسابيع قليلة على X (التي ستقام في 27 فبراير 2025) الطريق للنظر في “سحر” الذكاء الاصطناعي ، إلى جانب تشوه أن الذكاء الاصطناعى يتحول بطريقة ما أو ينتقل إلى عرض “نوع مختلف من الذكاء”:
- “GPT-4.5 جاهز! أخبار سارة: إنه النموذج الأول الذي يشعر وكأنه يتحدث إلى شخص مدروس لي. لقد مررت بعدة لحظات حيث جلست على كرسيي ودهشت من الحصول على نصيحة جيدة من الذكاء الاصطناعي.”
- “أتجه رأسًا: هذا ليس نموذجًا التفكير ولن يسحق المعايير. إنه نوع مختلف من الذكاء وهناك سحر لم أشعر به من قبل. متحمس جدًا للناس لتجربته!”
يرجى العلم أن البعض في مجتمع الذكاء الاصطناعى يرحبون بلقب المشاعر بأذرع مفتوحة. الاعتقاد المتحمس هو أن التدابير الكمية وحدها لا تحكي القصة الكاملة. لن تقيس أي شخص فقط من خلال طوله ووزنه ومقاييس قابلة للقياس الكمية الأخرى. ستكون الكيمياء الكلية أو المشاعر للشخص بعدًا إضافيًا مهمًا. Ergo ، يجب أن نتعرف على نفس النوع من الحاجة لتقييم الذكاء الاصطناعي.
Hogwash ، حث المشاهدين المشاعر. محاولة رسم مواز لكيفية قياس الناس خاطئة بشكل واضح. إنه أمر مشين ومثال آخر آخر على الجهد المثير للقلق لإجراء تجسيد AI. يجب أن يتم إيقاف هذا التخمين في الحيرة ، على الفور ، قبل أن يتم غرسه في مجتمع الذكاء الاصطناعى. سيكون الحصول على إعجابه مستحيلًا تقريبًا بمجرد تعزيزه في تقاليد الذكاء الاصطناعي.
يجري النقاش الساخن وسط المعسكرات ضد المعسكرات ضد الفيس.
أسباب دعم المشاعر
عند مناقشة مفهوم المشاعر المتوسعة مع زملائي باحثي الذكاء الاصطناعى ، توصلت إلى أربعة أسباب رئيسية لأن هناك اعتقادًا كبيرًا بأن المشاعر مفيدة وتستحق الاستخدام المستمر:
- (1) توفر المشاعر جوهرًا حشويًا: عند استخدام الذكاء الاصطناعى التوليدي ، تقوم بعض LLMs بعمل مذهل في عرض الربط العاطفي على ما يبدو مع المستخدمين ، ويجب الاعتراف بهذه الوظيفة ، وبالتالي فإن استخدام المشاعر لهذا الغرض أمر منطقي تمامًا.
- (2) تشير المشاعر إلى دلالات متفائلة: من المعتاد ربط الإيجابية مع هالة المشاعر البشرية ، وهذا الدلالة المتفائلة نفسها تساعد على تشجيع الناس على الاستفادة من نقاط القوة الهائلة في الذكاء الاصطناعي في العصر الحديث.
- (3) تسمح المشاعر بالتغير. عندما يتم تصنيف LLMs المختلفة على نفس المنوال على التدابير الكمية المعتادة ، يمكن أن تساعد اعتبارات المشاعر بشكل متكبر في التمييز بين LLM من آخر.
- (4) المشاعر مثالية للجميع. كلمة “المشاعر” موجزة ، والجميع يعرف بالفعل ما الذي يشير إليه. إذا توصل مجتمع الذكاء الاصطناعي إلى كلمة جديدة أو صياغة فنية لوصف نفس الشيء ، فلن يعرف الناس ما الذي كنا نتحدث عنه. باختصار ، إنه مثالي.
المضي قدما واتخذ لحظة تأملية هادئة لتفكيك هذه الأسباب التي تسبب في Keystone لدعم حركة المشاعر. ربما تفعل ذلك برفقة كوب من النبيذ الناعم.
أسباب رفض المشاعر
في نفس المناقشة مع زملائي باحثو الذكاء الاصطناعي ، توصلت إلى أربعة أسباب رئيسية لرفض ميل المشاعر:
- (1) المشاعر المراوغة. سواء أكان أولئك الذين يفضلون المشاعر حقيقية أو يحاولون أن يكونوا خفية ، لا يهم الاتجاهين في حد ذاته ، لأن خلاصة القول هي أن المشاعر كمصطلحات في تقييم الذكاء الاصطناعي غير متبلورة تمامًا ومراوغة تمامًا.
- (2) المشاعر إصدار سحر الذكاء الاصطناعي. الذكاء الاصطناعى هو مجرد أجزاء والبايت. من خلال ربط المشاعر مع الذكاء الاصطناعى ، فإن القيام بذلك هو وسيلة شنيعة ومبهجة لضمان أن الذكاء الاصطناعى غامض ، وربما يحد من امتلاك المشاعر. عار ، عار ، عار.
- (3) قناع المشاعر تباطؤ الذكاء الاصطناعي. بدلاً من التغلب على إصدار LLM الذي لا يعرض الكثير في طريق تقدم الذكاء الاصطناعى الجديد ، من السهل جدًا صنع Hullabaloo كبير حول المشاعر. هذا هو تشتيت في براعة ويقوم بضرائب لفهم بصراحة تقدم الذكاء الاصطناعى.
- (4) المشاعر القابلية للتنورة. تتيح طبيعة المشاعر الفضفاضة للمشاعر المشاعر التي تم إصدارها حديثًا أن تتجنب حول المقاييس الملموسة التي يتم استخدامها لمقارنة الأحدث في الذكاء الاصطناعي. بعد فترة وجيزة ، سنقارن منظمة العفو الدولية بالكامل تقريبًا على المشاعر ، والتي لن يكون لها معنى جوهري أو معدومها وتصبح أكثر من مجرد مباراة صراخ قائمة على الرأي.
احصل على كوب آخر من النبيذ وأعطي هذه النقاط البارزة بعض الاهتمام المخلص لبضع لحظات.
جعل المشاعر حقيقية
لكي نكون صريحين ، فإن احتمالات إيقاف استخدام المشاعر من الذكاء الاصطناعى كمطالبة منخفضة للغاية. إنه مجرد دعوة للغاية. إنه دافئ وغامض. أولئك الذين يتصدرون المشاعر لن يقنعوا مؤيدي المشاعر بالتراجع.
المشاعر هنا للبقاء.
هذا أمر مثير للقلق بشكل خاص لأن مطوري الذكاء الاصطناعى قد يميلون إلى البدء في تشكيل LLMs نحو إعطاء المزيد والمزيد من المشاعر. ربما يتم الانتباه إلى التطورات التكنولوجية المهمة الأخرى في الذكاء الاصطناعي. يلتقط المشاعر التي تطرح كل الهواء في الغرفة عندما يتعلق الأمر بجعل الذكاء الاصطناعى أفضل مما هو عليه الآن.
القول القديم أنه من المفيد في بعض الأحيان محاربة النار مع النار يتبادر إلى الذهن هنا. لنفترض أننا حاولنا أن نحول المشاعر إلى شيء قابل للقياس الكمي. في سياق الذكاء الاصطناعى ، يمكن أن تكون المشاعر مجموعة من العناصر القابلة للقياس الكمية.
اسمحوا لي أن أوضح هذا الاقتراح المؤمن بإيجاز.
أولاً ، سنحتاج إلى تحطيم جوهر المشاعر في مكونات القياس المميزة.
سأبصق بعض الأفكار. يمكن حساب تدفق المحادثة بناءً على استجابة المستخدم ، إلى جانب عدد الحوار ، وما إلى ذلك. يمكن أن يكون هناك عامل آخر هو درجة محاذاة المشاعر ، حيث تقيس لهجة الذكاء الاصطناعى ونبرة المستخدم. قد يكون هناك أيضًا تسجيل خطوبة وإعجاب بناءً على التصنيفات من قبل المستخدمين بعد التحمل مع LLM. هذه مجرد عدد قليل من الاقتراحات ويفضل أن تتجاوز العصائر الإبداعية.
ثانياً ، يجب تداول مكونات القياس المميزة وتحولت في النهاية إلى معيار قابل للاستخدام يمكن لمجتمع الذكاء الاصطناعي تنفيذه بسهولة. والفكرة هي أن المعيار من شأنه أن يبقي كل صانع منظمة العفو الدولية صادقة في تقييماته ولا يسمح لهم بصياغة تدابير الملكية الخاصة بهم (لا يزال بإمكانهم القيام بذلك ، لكن أقدامهم ستظل محتجزة على الحريق من خلال الاضطرار إلى الإبلاغ عن التدابير القياسية أيضًا).
ثالثًا ، بمجرد توفر تدابير المعايير ، نأمل أن تبدأ ألواح المتصدرين منظمة العفو الدولية في الإبلاغ عن مقاييس المشاعر. الجمال أيضًا هو أن الأطراف الثالثة ستكون قادرة على إجراء نفس التقييمات. يمكن اكتشاف صانعي الذكاء الاصطناعى الذين ربما امتدوا مطالباتهم. من المؤكد أن صانعي الذكاء الاصطناعى الآخرون سيرحبون بهذا النوع من نهج “الحفاظ على مستوى الملعب”.
فكرة نهائية الآن.
يعتقد البعض أن المشاعر تتحدث بصوت أعلى من الكلمات. وبالتالي ، فإن السعي لإعادة تشكيل المشاعر في أداة كمية وقابلة للحساب هو نقيض لما تدور حوله المشاعر. إما لديك ردود فعل إيجابية أو تتخلى عن المشاعر ، أو لا تفعل ذلك.
بالنسبة لي ، لدي ردود فعل إيجابية حول جعل المشاعر في الذكاء الاصطناعى في شيء حقيقي ، خاصة وأن مشاعر الذكاء الاصطناعى تبدو هنا من أجل الخير ، سواء أحببنا ذلك أم لا.