أطلقت OpenAI مؤخرًا نماذج استدلال جديدة (o3 وo4-mini وo4-high)، لكنها أثارت جدلاً واسعًا بسبب ارتفاع معدلات “الهلوسة”، أي تقديم معلومات خاطئة بطريقة تبدو مقنعة. وكشفت اختبارات داخلية أن نموذج o3 أعطى إجابات غير صحيحة بنسبة 33% في اختبار خاص، بينما وصل معدل الهلوسة في o4-mini إلى 48%، وهي أرقام تفوق بكثير النماذج السابقة مثل o1…
Read Moreنماذج OpenAI الجديدة تثير الجدل بسبب “الهلاوس” وادعاءات مقلقة
