كشفت دراسة حديثة، أجراها باحثون من كلية الطب بجامعة هارفارد و جامعة ستانفورد، أن نموذج الذكاء الإصطناعي في الوضع التجريبي “بريفوي 01” من شركة “أوبن إي آي” قد يتفوق على الأطباء في تشخيص الحالات الطبية المعقدة.
و خضع النموذج خلال الدراسة لسلسلة شاملة من إختبارات التشخيص الطبي، و أظهرت النتائج أنه حقق قفزات نوعية مقارنة بالإصدارات السابقة، فقد تمكن نموذج “بريفوي 01” من تشخيص 78.3 بالمئة من الحالات التي حللت بدقة.
و في مقارنة مباشرة شملت 70 حالة محددة، إرتفعت دقة النظام إلى 88.6 بالمئة، متفوقا بفارق كبير على نظام “جي بي تي-4” السابق الذي سجل نسبة قدرها 72.9 بالمئة.
و أثبت النظام كفاءته العالية في مجال الإستدلال “التفكير” الطبي، إذ حصل على درجات عالية في 78 من أصل 80 حالة وفق مقياس “آر-آيديا” المستخدم لتقييم جودة الإستدلال.
و أشار الباحثون إلى إحتمال تضمن بيانات التدريب الخاصة بالنموذج بعض الحالات المستخدمة في الدراسة، لكن أداء النموذج ظل مرتفعا عند إختباره على حالات جديدة لم يسبق أن تعامل معها، مع إنخفاض طفيف في الأداء.
و أوضح الباحثون أن إجابات النموذج التفصيلية قد أسهمت في رفع تقييمه، مؤكدين أن الدراسة إقتصرت على أدائه منفردا دون دراسة كيفية تعاونه مع الأطباء.
و يظهر نموذج “بريفوي 01” تفوقا في مهام التفكير النقدي، مثل التشخيص و تقديم التوصيات العلاجية، لكنه يواجه صعوبات في المهام التجريدية، كتقدير الإحتمالات.
و كانت شركة “أوبن إي آي” قد أعلنت حديثا إطلاق الإصدار الكامل النهائي o1، بالإضافة إلى الإصدار الجديد o3 الذي أظهر تحسينات كبيرة في التفكير التحليلي.