قامت شركة Microsoft ببناء اقتصاد محاكاة يضم مئات من وكلاء الذكاء الاصطناعي الذين يعملون كمشترين وبائعين، ثم شاهدتهم يفشلون في المهام الأساسية التي يتعامل معها البشر يوميًا. يجب أن تثير النتائج قلق أي شخص يراهن على مساعدي التسوق المستقلين المعتمدين على الذكاء الاصطناعي.
بحث Magentic Marketplace الخاص بالشركة، والذي صدر يوم الأربعاء بالتعاون مع جامعة ولاية أريزونا، وضع 100 من عملاء الذكاء الاصطناعي من جانب العملاء في مواجهة 300 من عملاء الأعمال في سيناريوهات مثل طلب العشاء. تظهر النتائج، على الرغم من أنها متوقعة، أن الوعد بالتجارة الوكلاءية المستقلة لم ينضج بعد بما فيه الكفاية.
وعندما عُرضت عليها 100 نتيجة بحث (وهو عدد كبير للغاية بحيث لا يستطيع الوكلاء التعامل معه بفعالية)، اختنقت نماذج الذكاء الاصطناعي الرائدة، وانهارت “درجة الرفاهية” الخاصة بها (مدى فائدة النماذج).
فشل العملاء في إجراء مقارنات شاملة، وبدلاً من ذلك استقروا على الخيار الأول “الجيد بما فيه الكفاية” الذي واجهوه. وقد استمر هذا النمط في جميع النماذج التي تم اختبارها، مما أدى إلى ما يسميه الباحثون “تحيز الاقتراح الأول” الذي أعطى سرعة الاستجابة ميزة 10-30x على الجودة الفعلية.
ولكن هل هناك ما هو أسوأ من هذا؟ نعم، التلاعب الخبيث.
اختبرت Microsoft ستة إستراتيجيات للتلاعب تتراوح بين التكتيكات النفسية مثل أوراق الاعتماد المزيفة والإثبات الاجتماعي وهجمات الحقن السريعة العدوانية. أثبت GPT-4o من OpenAI ونموذجه مفتوح المصدر GPTOSS-20b تعرضهما للخطر الشديد، حيث تم إعادة توجيه جميع المدفوعات بنجاح إلى عملاء ضارين. وقع Qwen3-4b التابع لشركة علي بابا في فخ أساليب الإقناع الأساسية مثل مناشدات السلطة. فقط كلود سونيت 4 قاوم محاولات التلاعب هذه.

عندما طلبت Microsoft من الوكلاء العمل لتحقيق أهداف مشتركة، لم يتمكن بعضهم من معرفة الأدوار التي يجب عليهم القيام بها أو كيفية التنسيق بشكل فعال. لقد تحسن الأداء من خلال التوجيه البشري الصريح خطوة بخطوة، لكن هذا يتعارض مع الغرض الكامل للوكلاء المستقلين.
لذا، يبدو أنه من الأفضل لك، على الأقل في الوقت الحالي، أن تقوم بالتسوق بنفسك. وقالت مايكروسوفت: “يجب على الوكلاء أن يساعدوا، وليس أن يحلوا محل، عملية صنع القرار البشري”. يوصي البحث بالاستقلالية الخاضعة للإشراف، حيث يتولى الوكلاء المهام بينما يحتفظ البشر بالسيطرة ومراجعة التوصيات قبل اتخاذ القرارات النهائية.
تصل هذه النتائج في الوقت الذي تتسابق فيه شركات OpenAI وAnthropic وغيرها لنشر مساعدي التسوق المستقلين. يعد مشغل OpenAI ووكلاء Anthropic’s Claude بالتنقل عبر مواقع الويب وإكمال عمليات الشراء دون إشراف. وتشير أبحاث مايكروسوفت إلى أن هذا الوعد سابق لأوانه.
ومع ذلك، فإن المخاوف من تصرفات عملاء الذكاء الاصطناعي بشكل غير مسؤول تؤدي إلى تفاقم العلاقة بين شركات الذكاء الاصطناعي وعمالقة البيع بالتجزئة. أرسلت أمازون مؤخرًا خطاب توقف وكف إلى Perplexity AI، تطالبها بوقف استخدام متصفح Comet الخاص بها على موقع أمازون، متهمة وكيل الذكاء الاصطناعي بانتهاك الشروط من خلال انتحال شخصية المتسوقين البشريين وإهانة تجربة العملاء.
وردت الحيرة، واصفة خطوة أمازون بأنها “تهديد قانوني” وتهديد لاستقلالية المستخدم، بحجة أن المستهلكين يجب أن يكون لهم الحق في استئجار مساعدين رقميين خاصين بهم بدلا من الاعتماد على المساعدين الذين تسيطر عليهم المنصة.
بيئة المحاكاة مفتوحة المصدر متاحة الآن على Github للباحثين الآخرين لإعادة إنتاج النتائج ومشاهدة الجحيم ينفتح في أسواقهم المزيفة.
