गणितीय तर्क क्षमता में उत्कृष्टता
o4-mini गणित में उत्कृष्ट प्रदर्शन करता है, AIME2024 और AIME2025 बेंचमार्क परीक्षणों में क्रमशः 93.4% और 92.7% स्कोर प्राप्त करता है, o3 के 91.6% और 88.9% स्कोर को पार करता है। Reddit उपयोगकर्ता बताते हैं कि o4-mini विशेष रूप से गणित और कोडिंग के लिए अनुकूलित है, गणितीय क्षमताओं में Gemini 2.5 Pro को मात देता है।