ننسى مجموعات التركيز: وجدت دراسة جديدة أن نماذج اللغات الكبيرة يمكنها التنبؤ بما إذا كنت تريد شراء شيء ما بدقة مذهلة، مما يتفوق بشكل كبير على أدوات التسويق التقليدية.

لقد وجد الباحثون في جامعة مانهايم والمعهد الفدرالي للتكنولوجيا في زيورخ أن النماذج اللغوية الكبيرة يمكن أن تحاكي نية الشراء البشرية – “ما مدى احتمالية شراء هذا؟” مقياس مفضل لدى المسوقين – عن طريق تحويل النص الحر إلى بيانات مسح منظمة.

وفي ورقة بحثية نشرت الأسبوع الماضي، قدم الفريق طريقة تسمى “تصنيف التشابه الدلالي “، والذي يحول استجابات النموذج المفتوحة إلى تصنيفات عددية “ليكيرت”، وهو مقياس من خمس نقاط يستخدم في أبحاث المستهلك التقليدية.

بدلًا من مطالبة النموذج باختيار رقم بين واحد وخمسة، جعل الباحثون النموذج يستجيب بشكل طبيعي – “سأشتري هذا بالتأكيد” أو “ربما لو كان معروضًا للبيع” – ثم قاموا بقياس مدى قرب هذه العبارات من الإجابات الأساسية مثل “سأشتري هذا بالتأكيد” أو “لن أشتري هذا”.

تم تعيين كل إجابة في مساحة مضمنة لأقرب بيان مرجعي، مما أدى بشكل فعال إلى تحويل نص LLM إلى تقييمات إحصائية. كتب المؤلفون: “لقد أظهرنا أن تحسين التشابه الدلالي بدلاً من التسميات الرقمية يؤدي إلى توزيعات نية الشراء التي تتطابق بشكل وثيق مع بيانات المسح البشري”. “حققت الاستجابات الناتجة عن ماجستير إدارة الأعمال 90% من موثوقية المسوحات البشرية المتكررة مع الحفاظ على التباين الطبيعي في المواقف.”

في الاختبارات التي أجريت على 9300 استبيان بشري حقيقي حول منتجات العناية الشخصية، أنتجت طريقة SSR مجيبين اصطناعيين كانت توزيعات ليكرت الخاصة بهم مطابقة تقريبًا للنسخ الأصلية. بمعنى آخر: عندما طُلب من العارضات “التفكير مثل المستهلكين”، فعلت العارضات ذلك.

لماذا يهم

يمكن أن تعيد هذه النتيجة تشكيل كيفية إجراء الشركات لاختبارات المنتجات وأبحاث السوق. من المعروف أن استطلاعات رأي المستهلكين باهظة الثمن، وبطيئة، وعرضة للتحيز. يمكن للمستجيبين الاصطناعيين – إذا تصرفوا مثل المجيبين الحقيقيين – أن يسمحوا للشركات بفحص آلاف المنتجات أو الرسائل مقابل جزء بسيط من التكلفة.

كما أنه يؤكد صحة ادعاء أعمق: أن هندسة الفضاء الدلالي للماجستير في القانون لا تشفر فقط فهم اللغة ولكن أيضًا المنطق الموقفي. من خلال مقارنة الإجابات في مساحة التضمين بدلاً من التعامل معها كنص حرفي، توضح الدراسة أن دلالات النماذج يمكن أن تحل محل الحكم البشري بإخلاص مدهش.

وفي الوقت نفسه، فإنه يثير مخاطر أخلاقية ومنهجية مألوفة. اختبر الباحثون فئة واحدة فقط من المنتجات، تاركين المجال مفتوحًا لمعرفة ما إذا كان النهج نفسه سيطبق على القرارات المالية أو الموضوعات المشحونة سياسيًا. ومن الممكن أن يصبح “المستهلكون” الاصطناعيون اصطناعيين بسهولة الأهداف: يمكن أن تساعد تقنيات النمذجة نفسها في تحسين الإقناع السياسي، أو الإعلان، أو التنبيهات السلوكية.

وعلى حد تعبير المؤلفين، “يمكن لضغوط التحسين التي يحركها السوق أن تؤدي إلى تآكل التوافق بشكل منهجي” – وهي عبارة يتردد صداها إلى ما هو أبعد من التسويق.

مذكرة من الشك

يعترف المؤلفون بأن مجال اختبارهم – منتجات العناية الشخصية – ضيق وقد لا يعمم على المشتريات عالية المخاطر أو المشحونة عاطفياً. يعتمد تخطيط SSR أيضًا على البيانات المرجعية المختارة بعناية: يمكن أن تؤدي التغييرات الصغيرة في الصياغة إلى تحريف النتائج. علاوة على ذلك، تعتمد الدراسة على بيانات المسح البشري باعتبارها “الحقيقة الأساسية”، على الرغم من أن هذه البيانات صاخبة ومتحيزة ثقافيا.

يشير النقاد إلى أن التشابه القائم على التضمين يفترض أن نواقل اللغة ترسم بدقة المواقف البشرية، وهو افتراض قد يفشل عندما يدخل السياق أو السخرية في المزيج. تبدو أرقام الموثوقية الخاصة بالورقة البحثية ـ 90% من اتساق الاختبار البشري وإعادة الاختبار ـ مثيرة للإعجاب، ولكنها لا تزال تترك مجالًا لانحراف كبير. باختصار الطريقة ناجحة في المتوسطولكن ليس من الواضح بعد ما إذا كانت هذه المتوسطات تعكس التنوع البشري الحقيقي أم أنها تعكس ببساطة التدريبات المسبقة للنموذج.

الصورة الأكبر

ارتفع الاهتمام الأكاديمي بـ “النمذجة الاستهلاكية الاصطناعية” في عام 2025، حيث تقوم الشركات بتجربة مجموعات التركيز القائمة على الذكاء الاصطناعي والاستطلاعات التنبؤية. وقد أظهر عمل مماثل أجراه معهد ماساتشوستس للتكنولوجيا وجامعة كامبريدج أن ماجستير إدارة الأعمال قادر على تقليد القطاعات الديموغرافية والنفسية بموثوقية معتدلة، ولكن لم يُظهر أي منها في السابق تطابقًا إحصائيًا وثيقًا مع بيانات الرغبة في الشراء الحقيقية.

في الوقت الحالي، تظل طريقة SSR نموذجًا بحثيًا أوليًا، ولكنها تلمح إلى مستقبل قد لا يجيب فيه حاملو ماجستير إدارة الأعمال على الأسئلة فحسب، بل يمثلون الجمهور نفسه.

سواء كان ذلك تقدمًا أو هلوسة في طور الإعداد، فلا يزال الأمر مطروحًا للنقاش.

شاركها.
Exit mobile version