Một nhân viên của OpenAI gần đây đã cáo buộc công ty xAI của Elon Musk rằng kết quả đánh giá của mô hình AI mới nhất Grok3 là gây hiểu lầm. Igor Babushkin, đồng sáng lập xAI, đã khẳng định rằng công ty không sai. Biểu đồ của xAI cho thấy hai phiên bản Grok3 là Grok3 Reasoning Beta và Grok3 mini Reasoning vượt qua mô hình mạnh nhất hiện tại của OpenAI là o3-mini-high trên AIME 2025. Tuy nhiên, nhân viên OpenAI đã nhanh chóng chỉ ra trên nền tảng X rằng biểu đồ của xAI không bao gồm kết quả AIME 2025 của o3-mini-high trong điều kiện “cons@64”.
Igor Babushkin đã phản biện trên nền tảng X rằng OpenAI trước đây cũng đã từng phát hành những biểu đồ đánh giá gây hiểu lầm tương tự. Những biểu đồ này nhằm so sánh hiệu suất của các mô hình của chính họ. Nội dung này chỉ nhằm cung cấp thông tin thị trường và không mang tính chất tư vấn đầu tư.