فتح Digest محرر مجانًا

في ديسمبر 2021 ، وضع برايان كيلي ، رئيس التعلم الآلي في Quant House AQR Capital Management ، اسمه إلى ورقة أكاديمية تسببت في ضجة كبيرة.

وجدت فضيلة التعقيد في التنبؤ بالعائد-التي شاركت في تأليفها كيلي مع Semyon Malamud و Kangying Zhou-أن نماذج التعلم المعقدة كانت أفضل من النماذج البسيطة في التنبؤ بأسعار الأسهم ومحافظ البناء.

كانت النتيجة أمرًا كبيرًا لأنه يتناقض مع أحد المبادئ التوجيهية في التعلم الآلي ، وهي المفاضلة التحيز والتحيز ، والتي تقول إن القوة التنبؤية للنماذج تضعف مع نموها إلى ما هو أبعد من المستوى الأمثل. بالنظر إلى الكثير من المعلمات التي يمكن اللعب بها ، يميل الروبوت إلى التغلب على إنتاجه إلى ضوضاء عشوائية في بيانات التدريب.

لكن كيلي ومؤلفوه ، خلصوا إلى أنه ، من المثير للدهشة أن المزيد من المتغيرات تعمل دائمًا على تحسين العوائد. قوة الحوسبة المتاحة هي الحد الوحيد. فيما يلي مقطع فيديو لكيلي يشرح لمدرسة وارتون في عام 2023 أن نفس المبادئ التي تنطبق على نماذج المليارات المعلمة التي تعمل على تشغيل chatgpt و Claude AI تنطبق أيضًا على الدقة في التنبؤ المالي.

يكره الكثير من الأكاديميين هذه الورقة. يقول جوناثان بيرك من كلية ستانفورد للأعمال “إنه يعتمد على التحليل النظري” ضيقة لدرجة أنه من غير المجدي تقريبًا للاقتصاديين الماليين “. يعتمد الأداء على البيانات المعقدة التي لن تكون متوفرة في العالم الحقيقي ، وفقًا لبعض الباحثين في جامعة أكسفورد. يقول دانييل بونسيك ، من كلية ستوكهولم للأعمال ، إن النماذج الأكبر التي اختبرها كيلي وآخرون تتفوق فقط لأنها تختار التدابير التي تحرر النماذج الأصغر.

هذا الأسبوع ، انضم ستيفان ناجيل من جامعة شيكاغو إلى كومة. يقول ورقته – التعقيد الفاضل على ما يبدو في التنبؤ – بأن النتيجة “المذهلة” التي أظهرها كيلي وآخرون. . .

. . . بشكل فعال متوسط ​​مرجح للعوائد السابقة ، مع الأوزان الأعلى في الفترات التي تشبه ناقلات تنبؤاتها الأكثر تشابهاً مع العامل الحالي.

يتحدى Nagel الاستنتاج المركزي للورقة المتمثل في أن المربع المعقد للغاية يمكن أن يقوم بتنبؤات جيدة بناءً على سنة واحدة فقط من بيانات أداء الأسهم.

تم تجذير هذا الاستنتاج في مفهوم الذكاء الاصطناعى المعروف باسم النسب المزدوج ، والذي تقول إن خوارزميات التعلم العميق ترتكب أخطاء أقل عندما يكون لديها معلمات متغيرة أكثر من نقاط بيانات التدريب. وجود نموذج مع عدد كبير من المعلمات يعني أنه يمكن أن يتناسب تمامًا حول بيانات التدريب.

وفقًا لـ Kelly et al ، فإن هذا النهج الشامل للتطوير في مطابقة الأنماط قادر على اختيار الإشارات التنبؤية في بيانات صاخبة للغاية ، مثل سنة واحدة من تداول الأسهم الأمريكية.

يقول ناجيل: القمامة:

في نوافذ التدريب القصير ، يعني التشابه ببساطة الحداثة ، وبالتالي فإن التوقعات تنخفض إلى متوسط ​​مرجح للعوائد الأخيرة – وهي استراتيجية الزخم بشكل أساسي.

من الأهمية بمكان ، أن الخوارزمية لا تنصح باستراتيجية الزخم لأنها شعرت أنها ستكون مربحة. لديها فقط تحيز الحداثة.

يقول ناجيل إن الروبوت “ببساطة يتوسط أحدث عوائد قليلة في نافذة التدريب ، والتي تتوافق مع ناقلات التنبؤ الأكثر تشابهاً مع النافذة الحالية”. إنه “لا يتعلم من بيانات التدريب ما إذا كان الزخم أو ديناميات الانعكاس موجودًا ؛ فهو يفرض ميكانيكياً بنية تشبه الزخم بغض النظر عن عملية العودة الأساسية.”

يتجاوز الأداء الذي أظهرته دراسة عام 2021 “وهكذا يعكس النجاح التاريخي المتزامن للزخم الذي توقيه التقلب ، وليس المعلومات التنبؤية المستخرجة من بيانات التدريب”.

نحن نتخطى أ كثير التفاصيل. أي قارئ يرغب في معرفة ميكانيكا تحجيم kernel بواسطة ميزات فوريه العشوائية سيكون من الأفضل تقديمه من قبل مؤلف يعرف ما الذي يتحدثون عنه. إن اهتمامنا الرئيسي في AQR ، الكمية التي تبلغ قيمتها 136 مليار دولار ، والتي ترتدي جذورها الأكاديمية بكل فخر.

يعمل Kelly كرجل أمامي لـ AQR من أجل استثمار أفضل من خلال التعلم الآلي: توجد ورقة “فضيلة التعقيد” على موقع AQR ، إلى جانب بعض التعليقات الأكثر حذراً من رئيسه Cliff Asness على قيمة الإشارات التي تم إنشاؤها.

إن التوفير في Kelly et al – بما في ذلك أستاذ في جامعة شيكاغو ، كل من أمه و Asness's Alma Mater – ليس مظهرًا رائعًا. ولكن نظرًا لأن استراتيجيات الزخم المباشر كانت تاريخياً من بين الأشياء التي تقوم بها AQR بشكل أفضل ، فربما لا يكون هذا الغموض عن الضجيج الأكاديمي أمرًا سيئًا للمستثمرين.

شاركها.