Vào ngày 6 tháng 2, một báo cáo từ một tổ chức nổi tiếng ghi nhận rằng các nhà nghiên cứu Fei-Fei Li từ Đại học Stanford và Đại học Washington đã huấn luyện một mô hình trí tuệ nhân tạo có tên gọi s1 với chi phí điện toán đám mây chưa đến 50 USD. Mô hình s1 được đánh giá là có khả năng giải quyết các bài toán và mã hóa tương đương với các mô hình hàng đầu như OpenAI’s o1 và DeepSeek’s R1, thu hút sự chú ý rộng rãi. Tuy nhiên, có thông tin tiết lộ rằng mô hình s1 không hoàn toàn được phát triển từ đầu và cơ sở của nó là mô hình “Alitong Yi Qianwen (Qwen)”.
Sau đó, trong một cuộc trao đổi với Alibaba Cloud để xác nhận thông tin, tổ chức đã xác thực rằng các nhà nghiên cứu đã sử dụng mô hình mở Alitong Yi Qianwen Qwen2.5-32B-Instruct làm nền tảng. Họ đã thực hiện tinh chỉnh giám sát trên 16 GPU H100 trong 26 phút để huấn luyện mô hình mới s1-32B. Kết quả là mô hình này đạt được khả năng giải quyết toán học và mã hóa ngang bằng với các mô hình hàng đầu, và thậm chí hiệu suất cao hơn 27% so với o1-preview trong các bài toán toán cạnh tranh.