أبو عبدالعزيز
أبو عبدالعزيز

@syst__em

2 تغريدة Apr 24, 2023
دراسة بحثية تقيس أداء نماذج #الذكاء_الاصطناعي التوليدي في أسئلة الاختبارات الشفهية لجراحة المخ والأعصاب!
الاختبار مكون من 149 سؤال
medrxiv.org
صحيح أن التخصص دقيق ومخيف، لكن النماذج حققت بعض الإنجازات 👇🧵
نموذج #GPT4 حقق: 82.6%
نموذج #GPT3.5 حقق: 62.4%
نموذج #بارد #Bard حقق: 44.2%
أظهر #GPT4 معدلات أقل بكثير في الهلوسة على الأسئلة المتعلقة بالتصوير!

جاري تحميل الاقتراحات...