ذكاء 'أوبن أي آي' الاصطناعي ينهي عصر التخمين ويبدأ عصر التفكير

رائدة تقنية محاكاة العقل البشري تحقق قفزة تاريخية بإطلاق نموذج يكسر حاجز 'الرياضيات البحثية' بنسبة نجاح 40.3 بالمئة متجاوزا الخبراء البشر بالاعتماد على تقنية 'تفكير متأني' تنقل الخوارزميات من مجرد التنبؤ اللغوي إلى الاستدلال المنطقي المعقد وتصحيح الذات.

سان فرانسيسكو (كاليفورنيا) – كشفت شركة "OpenAI"، المدعومة من "Microsoft"، النقاب هذا الأسبوع عن نموذج ذكاء اصطناعي جديد أظهر قدرات غير مسبوقة في حل المعضلات الرياضية المعقدة، في خطوة يرى مراقبون أنها تمثل نقطة تحول مفصلية في السباق العالمي نحو بناء أنظمة ذكاء اصطناعي قادرة على التفكير بدلاً من مجرد معالجة اللغة، مما يوسع الفجوة التنافسية مع منافسيها في وادي السيليكون.

وأظهرت ورقة بحثية تقنية نشرتها الشركة يوم الأربعاء أن النموذج المطور، الذي يحمل اسم "GPT-5.2 Thinking"، تمكن من تحقيق نسبة نجاح بلغت 40.3% في اختبار "FrontierMath" القياسي.

ويُعد هذا الاختبار معياراً حديثاً صممته مؤسسة "Epoch AI" خصيصاً لتعجيز النماذج الحالية، حيث يتضمن مسائل رياضية بحثية أصلية لم يسبق نشرها، وتتطلب عادةً ساعات أو أياماً من العمل المضني من قبل علماء رياضيات يحملون درجة الدكتوراه لحلها.

من التنبؤ إلى الاستدلال

يمثل هذا الإعلان تحولاً جوهرياً في استراتيجية "OpenAI". فبينما كانت النماذج السابقة "LLMs" تعتمد بشكل أساسي على التنبؤ الاحتمالي بالكلمة التالية، يعتمد نموذج "GPT-5.2" الجديد على معمارية تُعرف بـ "Test-Time Compute".

وتسمح هذه التقنية للنموذج بالتوقف للتفكير لفترة تتراوح بين 30 ثانية وعدة دقائق قبل إصدار الإجابة، مما يمكنه من محاكاة "System 2" في التفكير البشري، وهو النمط المسؤول عن العمليات التحليلية البطيئة والعميقة.

وذكر باحثو الشركة في الورقة التقنية أن النموذج يستخدم آلية "Recursive Self-Correction"، حيث يقوم بتوليد مسارات متعددة للحل، ثم يستخدم نموذجاً ناقداً داخلياً لمراجعة صحة كل خطوة منطقية، والتراجع عن الخطوات الخاطئة، في عملية تشبه إلى حد كبير مسودات العلماء البشر أثناء العمل على البراهين الرياضية.

قفزة نوعية في المعايير القياسية

تُبرز البيانات حجم القفزة التقنية التي حققتها "OpenAI". فقبل إطلاق هذا النموذج، كانت أقوى نماذج الذكاء الاصطناعي – بما في ذلك إصدارات سابقة من "GPT-4" و"Gemini Ultra" من "Google" – تكافح لتجاوز نسبة 2% فقط في اختبار "FrontierMath".

وقال محللون في بنك "JPMorgan" في مذكرة للمستثمرين: إن الانتقال من هامش خطأ يقارب 98% إلى نسبة نجاح تتجاوز 40% في غضون عام واحد لا يعد تطوراً تدريجياً، بل هو تغيير جذري في منحنى القدرات الحوسبية، مما يفتح الباب أمام تطبيقات تجارية وعلمية كانت تعتبر خيالاً علمياً حتى وقت قريب.

من هامش خطأ يقارب 98% إلى نسبة نجاح تتجاوز 40%

ويكتسب اختبار "FrontierMath" مصداقيته من كونه محصناً ضد تلوث البيانات؛ إذ إن المسائل المطروحة فيه جديدة تماماً وغير موجودة في مجموعات البيانات التي تدربت عليها النماذج، مما يعني أن "GPT-5.2" كان يحل المسائل عبر الاستدلال المنطقي الصرف.

تداعيات على الأمن والعلوم

أثار الإنجاز ردود فعل متباينة في الأوساط العلمية والأمنية. فمن جهة، يرى علماء في مجالات الفيزياء الحيوية وعلم الجينوم أن قدرة الذكاء الاصطناعي على إجراء استدلالات رياضية معقدة ستسرع بشكل كبير من عمليات نمذجة البروتين واكتشاف الأدوية.

في المقابل، أعرب خبراء في الأمن السيبراني عن مخاوفهم من أن التطور المتسارع في القدرات الرياضية للذكاء الاصطناعي قد يهدد بروتوكولات التشفير الحالية.

وأشار تقرير أمني صدر في لندن إلى أن القدرة على توليد براهين رياضية جديدة قد تُستخدم نظرياً لاكتشاف ثغرات في خوارزميات التشفير التقليدية مثل "RSA" بوتيرة أسرع مما كان متوقعاً في عصر الحوسبة الكلاسيكية.

السوق يتفاعل: "Nvidia" الرابح الأكبر

انعكست الأخبار فوراً على الأسواق المالية. ارتفعت أسهم شركة "Nvidia"، المزود الرئيسي لرقائق الذكاء الاصطناعي، بنسبة 3.5% في تداولات ما بعد الإغلاق، مدفوعة بتوقعات بأن نهج "Test-Time Compute" سيزيد الطلب بشكل هائل على وحدات المعالجة الرسومية "GPUs" ليس فقط أثناء تدريب النماذج، بل أثناء تشغيلها "Inference" أيضاً.

وفي حين لم تعلن "OpenAI" عن موعد الطرح العام الكامل للنموذج لجميع المستخدمين، فإن هذه الخطوة تضع ضغوطاً هائلة على المنافسين، وتحديداً "Google" وشركة "Anthropic"، للرد بتقنيات مماثلة، مما يؤكد أن عام 2026 سيكون عام حرب الاستدلال في وادي السيليكون.