كشفت Openai النقاب عن GPT-5 خلال يوم الخميس ، بمناسبة ما وصفته الشركة بتحول نوعي في قدرة الذكاء الاصطناعي بعد عدة أشهر من الترقب والتأخيرات المتعددة. يتم طرح النموذج إلى جميع مستخدمي ChatGpt طوال اليوم.

يمثل الإصدار محاولة Openai لتوحيد تقنيات الذكاء الاصطناعي المختلفة في نظام واحد. وصفت الشركة المنطق بأنها أساسية لاستراتيجية الذكاء العام الاصطناعي ، مع التخلص من المفاضلات السابقة بين السرعة والعمق التحليلي. لم يعد المستخدمون بحاجة إلى الاختيار بين الاستجابات السريعة وقدرات التفكير العميق-يسلم GPT-5 كلاهما في وقت واحد.

إليك ورقة غش حول ما تحتاج إلى معرفته.

1. متى يمكنني الحصول عليها؟

GPT-5 يخرج اليوم على ChatGPT وعبر واجهة برمجة التطبيقات الخاصة به. قامت Microsoft أيضًا بدمج GPT-5 في منتجاتها على الفور ، مما يجعلها متاحة من خلال Copilot و Github Copilot.

إذا قمت بتحديث متصفح Edge الخاص بك باستخدام Copilot ، فيجب أن تكون مستعدًا لاستخدامه الآن.

2. هل يحصل الجميع على نفس الإصدار؟

نعم ، نوع من: سيبدأ المستخدمون المجانيون مع GPT-5 القياسي قبل الانتقال إلى إصدار “GPT-5 Mini” أخف عندما يستنفد حصة الاستخدام الخاصة بهم. يحصل المشتركون المحترفين (200 دولار شهريًا) على وصول غير محدود إلى النموذج الكامل بينما يحصل المشتركون بالإضافة إلى إمكانية الوصول إلى GPT-5 القياسي.

يمكن للمشتركين المحترفين تشغيل GPT-5 على أعلى مستوى ذكاء مع ميزات إضافية مثل الوصول المبكر إلى وكلاءها المتقدمة ، والاستخدام غير المحدود ، والمزيد من القدرات للبحث العميق ، والوصول إلى الأولوية ، والوضع الصوتي المتقدم مع حدود أعلى لمشاركة الفيديو والشاشة.

3. ماذا يعني متعدد الوسائط؟ هل يذهب مولد الصور المنفصل بعيدًا؟

تعني الوسائط المتعددة أن GPT-5 يمكنه معالجة وإنشاء أنواع مختلفة من المحتوى-النص ، الصور ، الصوت ، وحتى الآن الفيديو-كل ذلك في نفس المحادثة. أظهر النموذج فهم اللغة الأجنبية المعززة للمهام المعقدة ، وتوليد مواقع ويب كاملة بالكلمات الفرنسية والنطق المناسب.

بدلاً من التوفيق بين الرؤية ، Sora ، GPT ، ونماذج “O” إلى المنطق ، يمكن لـ GPT-5 أن تفعل كل شيء من تلقاء نفسها.

4. ما مدى حجم نافذة السياق ولماذا يهم؟

يحتوي GPT-5 على نافذة سياق رمزية 256000 للإدخال ، حيث تقبل واجهة برمجة التطبيقات ما يصل إلى 272،000 رمز إدخال وينبعث بحد أقصى 128،000 رمز للتفكير والإخراج ، لمدة إجمالي طول سياق قدره 400000 رمز.

هذا يعني أنه يمكن أن يعالج ما يقرب من 200000 كلمة في وقت واحد – معاداة لرواية طويلة. تتيح نافذة السياق الأكبر GPT-5 الحفاظ على محادثات متماسكة على تفاعلات أطول بكثير وتحليل قواعد الكود بأكملها أو مستندات طويلة دون فقدان التفاصيل المهمة.

ومع ذلك ، فإن هذه النافذة ليست كبيرة جدًا وفقًا لمعايير اليوم. فقط للسياق ، Gemini 2.5 قادر على التعامل مع مليون رمز ،

5. ما هي الميزات الجديدة التي لديها؟

لا شيء ، حقًا ، ولكن يتم ترقية بعض مهاراتها إلى درجة أنها ستشعر بأنها ميزات جديدة.

6. إذن ما هو رائع في ذلك؟

GPT-5 أكثر قوة في كل طريقة تقريبًا. على سبيل المثال ، أظهرت قدرات ترميز رائعة أثناء العرض التقديمي ، حيث كتبت أكثر من 400 سطر من الكود في دقيقتين عند مطالبة بإنشاء محاكاة تأثير Bernoulli من نقطة الصفر. أشياء رائعة أخرى تظهر في العرض التوضيحي:

  • يبدو أن التفاعلات الصوتية أقل روبوتية وأصبحت إمكانات فيديو حية تتطابق مع منافسي مطابقة مثل Gemini Live.
  • يمكن للنموذج الآن تحليل الصور التي تم تحميلها ودمجها في ردوده.
  • من الأفضل في المهام الوكيل ، ومن المفترض أن تتمكن من التعامل مع التطبيقات الواقعية وشرح تفكيرها.
  • سيتمكن المستخدمون في الأسبوع القادم من دمج Gmail و Google Calendar ، مما سيسمح له بكونه مساعدًا أفضل بكثير.

7. هل تغير التسعير؟

يظل تسعير اشتراك ChatGPT دون تغيير عند 20 دولارًا في الشهر للضغط و 200 دولار شهريًا للمحترفين.

بالنسبة لمستخدمي API ، تكلف GPT-5 1.25 دولار لكل مليون رموز إدخال و 10.00 دولارات لكل مليون رموز الإخراج للنموذج القياسي. تكلف GPT-5 Mini 0.25 دولار لكل مليون رموز إدخال و 2.00 دولار لكل مليون رموز الإخراج ، في حين أن GPT-5 نانو يدير 0.05 دولار للمدخلات و 0.40 دولار للإنتاج.

هذا من شأنه أن يجعل النموذج منافسًا ضد العروض من الشركات الأخرى وحتى أرخص من الطرز الأخرى من Openai مثل GPT-4.1 أو Openai O1 Pro والتي تكلف 600 دولار لكل مليون رمز.

8. هل نحن في AGI حتى الآن؟

لا. ومع ذلك ، وضعت الشركة التفكير في “في قلب برنامج AGI لدينا”.

يمثل النموذج تقدمًا كبيرًا ولكنه لا يزال يركز على مهام محددة بدلاً من مطابقة الذكاء البشري في جميع المجالات. على سبيل المثال ، يعد GPT-5 رائعًا في مهام اللغة ولكنه يفتقر إلى الذكاء العام المطلوب لأداء مجموعة واسعة من الأنشطة بشكل مستقل. إنه ليس بعد التعليم الذاتي أو التكيف الذاتي.

9. هل يمكن لـ GPT-5 إنشاء مقاطع فيديو؟

ليس بعد. على الرغم من عدم تضمين توليد الفيديو في الإصدار الأولي ، فإن Openai لديه Sora لإنشاء الفيديو كمنتج منفصل.

أشار الرئيس التنفيذي سام ألمان سابقًا إلى أن الإصدارات المستقبلية ستدعم الفيديو “في النهاية”.

ومع ذلك ، فإن الإصدار الحالي يفهم الفيديو المباشر ، حتى يتمكن من مشاهدتك تحاول إصلاح دراجة وتقديم إرشادات حية.

10. ما مدى موثوقيها مقارنة بالموديلات السابقة؟

ذكرت Openai أن GPT-5 “أقل خداعًا بشكل ملحوظ” من النماذج السابقة ، حيث يعالج أحد أكثر التحديات المستمرة في نشر نموذج اللغة الكبير.

على معايير الدقة الواقعية ، ترتكب GPT-5 أقل بنسبة 80 ٪ من الأخطاء الواقعية من O3 ، مما يجعلها أكثر جدارة بالثقة في تطبيقات المؤسسات وفقًا لجاكوب باشوكي ، كبير العلماء في Openai.

11. ماذا عن الذاكرة والتخصيص؟

من المفترض أن توفر GPT-5 ذاكرة أفضل مستمرة عبر الجلسات ، وتذكر الحقائق والتفضيلات والتعليمات عبر محادثات متعددة ، حتى لو قمت بإغلاق التطبيق وفتح علامة تبويب جديدة بعد أيام. كانت ذاكرة GPT-4 محدودة ، خاصة بعد أيام من توقف الجلسة.

قالت الشركة إنه يمكنك الآن تحديد أهداف طويلة الأجل (على سبيل المثال ، ساعدني في فقد 10 أرطال بطريقة صحية ، أو تساعدني في الاستعداد لاختبار الفيزياء الخاص بي) ، وسيقوم GPT-5 بتكييف استجاباته وفقًا لتوافق أهدافك بشكل استباقي.

12. ما مدى خصوصية بياناتي الشخصية؟

أقر Altman سابقًا بأن Openai قد يضطر إلى تسليم بيانات المستخدم الشخصية إلى الحكومة إذا تطلب الأمر قانونًا للقيام بذلك.

13. هل أحتاج إلى التبديل بين النماذج المختلفة بعد الآن؟

لم تعد – ما لم تكن تريد إنشاء فيديو عبر سورا. مع إطلاق GPT-5 ، عبر Openai عن ثقته في إهانة جميع النماذج السابقة.

صممت الشركة GPT-5 للتعامل مع جميع حالات الاستخدام التي كانت تتطلب مسبقًا نماذج متخصصة ، على الرغم من أنه لا يزال بإمكان المستخدمين الاختيار بين GPT-5 و GPT-5 Mini و GPT-5 Nano استنادًا إلى متطلبات السرعة والتكلفة.

شاركها.
Exit mobile version