أوبن إيه آي تكشف عن تقنية توظف طرق الاستدلال... مع الصور

طرحت شركة «أوبن إيه آي» في سبتمبر (أيلول) الماضي، تقنية ذكاء اصطناعي مصممة بنظم «الاستدلال» عند تنفيذ مهمات تتضمَّن الرياضيات، والبرمجة، والعلوم. كما طرحت أداةً جديدةً تُساعد مبرمجي الكمبيوتر على استخدام روبوتات الدردشة عند كتابة الرموز البرمجية.
التعامل بـ«ذكاء» مع الصور
والآن، يُمكن لهذه التقنية معالجة مهمات مُماثلة تتضمَّن الصور، بما في ذلك الرسومات التخطيطية، والملصقات، والمخططات، والرسوم البيانية.
وكشفت الشركة، أمس (الأربعاء)، عن نسختين جديدتين من تقنية الاستدلال الخاصة بها، وهما «OpenAI o3»، و«OpenAI o4-mini» يُمكن لكل منهما التعامل مع مهام تتضمَّن الصور والنصوص.
وقال مارك تشين، رئيس قسم الأبحاث في الشركة، عند إعلان النظام الجديد خلال بث مباشر عبر الإنترنت: «يمكن لهذه الأنظمة معالجة الصور، وقصها، وتحويلها لخدمة المهمة التي تريد القيام بها». وأضافت الشركة أيضاً أن هذه الأنظمة يمكنها إنشاء صور، والبحث في الويب، واستخدام أدوات رقمية أخرى.
أنظمة «التفكير... قبل الإجابة»
وعلى عكس الإصدارات المبكرة من روبوت الدردشة «ChatGPT»، تقضي أنظمة التفكير هذه قدراً كبيراً من الوقت في «التفكير» في سؤال قبل الإجابة عنه، بدلاً من تقديم إجابة فورية.
تُعد هذه الأنظمة جزءاً من جهد أوسع لبناء ذكاء اصطناعي يمكنه التفكير في المهام المعقدة. وتعمل شركات مثل «غوغل»، و«ميتا»، و«ديب سيك» الشركة الصينية الناشئة، على تطوير تقنيات مماثلة.
والهدف هو بناء أنظمة يمكنها حل مشكلة من خلال سلسلة من الخطوات، كل منها مبنية على الخطوة السابقة، على غرار طريقة تفكير البشر. يمكن أن تكون هذه التقنيات مفيدةً بشكل خاص لمبرمجي الكمبيوتر الذين يستخدمون أنظمة الذكاء الاصطناعي لكتابة التعليمات البرمجية.
تعتمد أنظمة التفكير على تقنية تُسمى «نماذج اللغة الكبيرة»، أو (L.L.M.s) لبناء أنظمة التفكير المنطقي، وتُخضع الشركات هذه النماذج لعملية إضافية تُسمى «التعلم التعزيزي (reinforcement learning)». خلال هذه العملية، يتعلم النظام السلوك من خلال تجربة وخطأ مكثفين.
على سبيل المثال، من خلال حل مسائل رياضية متنوعة، يُمكنه معرفة أي الطرق تؤدي إلى الإجابة الصحيحة وأيها لا. إذا كرر هذه العملية مع عدد كبير من المسائل، يُمكنه تحديد الأنماط.
التعامل مع الصور والنصوص
تعلمت أحدث أنظمة «أوبن إيه آي» كيفية التعامل مع المسائل التي تتضمَّن كلاً من الصور والنصوص.
ويشير الخبراء إلى أن أنظمة التفكير المنطقي لا تُفكر بالضرورة كالإنسان. ومثل تقنيات الذكاء الاصطناعي الأخرى، يُمكنها أن تُخطئ وتُختلق أشياءً... وهي ظاهرة تُسمى «الهلوسة».
أداة جديدة للبرمجة
كما كشفت الشركة عن أداة جديدة، «Codex CLI»، مُصممة لتسهيل مهام برمجة الحاسوب التي تتضمّن أنظمة مثل «OpenAI o3»، و«OpenAI o4-mini» (المذكورتين أعلاه).
وتُسمى هذه الأداة «وكيل الذكاء الاصطناعي (A.I. agent)»، وتوفر طرقاً لاستخدام أنظمة الذكاء الاصطناعي هذه جنباً إلى جنب مع الرموز الموجودة المُخزنة على جهاز المُبرمج الشخصي. وصرَّحت الشركة بأنها تتيح هذه الأداة مفتوحة المصدر، ما يعني أنها تشارك تقنيتها الأساسية بحرية مع المبرمجين والشركات، مما يسمح لهم بتعديلها وتطويرها.
وأضافت الشركة أنه ابتداءً من يوم أمس (الأربعاء)، ستكون هذه الأنظمة الجديدة متاحة لأي شخص مشترك في خدمة «ChatGPT Plus»، وهي خدمة بقيمة 20 دولاراً شهرياً، أو خدمة «ChatGPT Pro»، وهي خدمة بقيمة 200 دولار شهرياً تتيح الوصول إلى أحدث أدوات الشركة جميعها.
* خدمة «نيويورك تايمز».
aawsat.com