Alibaba Cloud vừa ra mắt Qwen3-Max — mô hình lớn nhất của hãng với quy mô và hiệu năng được tối ưu để tăng cường sinh mã, xử lý tác vụ agent và tư duy toán học; API đã mở và tương thích với OpenAI.
Qwen3-Max được tiền huấn luyện trên quy mô lớn, phiên bản hướng dẫn xếp hạng toàn cầu cao, trong khi biến thể tăng cường tư duy đạt điểm tối đa ở các bài kiểm tra toán học chuyên sâu.
- Qwen3-Max: hơn 1 nghìn tỷ tham số, tiền huấn luyện 36 nghìn tỷ Token.
- Hiệu năng cải thiện ở sinh mã và tác vụ agent; điểm SWE-Bench 69,6 và Tau2-Bench 74,8.
- Biến thể Qwen3-Max-Thinking đạt điểm tối đa ở AIME 25 và HMMT; API đã mở, tương thích OpenAI.
Quy mô và dữ liệu tiền huấn luyện
Qwen3-Max là mô hình lớn nhất của Alibaba Cloud, được công bố với quy mô hơn 1 nghìn tỷ tham số và tiền huấn luyện trên khoảng 36 nghìn tỷ Token.
Quy mô tham số lớn cùng khối lượng Token đồ sộ cho phép mô hình học biểu diễn ngôn ngữ và kiến thức rộng hơn, cải thiện khả năng tổng quát hóa cho các tác vụ phức tạp như sinh mã và suy luận nhiều bước.
Hiệu năng trên các bài kiểm tra và tác vụ
Phiên bản preview của Qwen3-Max-Instruct xếp hạng thứ 3 trên bảng LMArena về xử lý văn bản; bản chính thức cải thiện sinh mã và tác vụ agent, đạt SWE-Bench 69,6 và Tau2-Bench 74,8.
Điểm số benchmark cho thấy mô hình có bước tiến ở nhiều miền ứng dụng: sinh mã tốt hơn giúp hỗ trợ lập trình viên, còn score agent phản ánh khả năng tương tác và điều phối tác vụ phức tạp.
Biến thể tư duy (Thinking) và năng lực toán học
Qwen3-Max-Thinking là phiên bản tăng cường tư duy, đạt điểm tối đa ở các bài kiểm tra suy luận toán học AIME 25 và HMMT.
Phiên bản này tối ưu cho phép suy luận nhiều bước và phân tích toán học sâu, phù hợp cho nhiệm vụ đòi hỏi logic chặt chẽ, giải bài toán phức tạp và hỗ trợ nghiên cứu khoa học dữ liệu.
Tính khả dụng và tương thích API
API của Qwen3-Max đã được mở, đồng thời tương thích với hệ sinh thái OpenAI, giúp dễ tích hợp vào ứng dụng hiện có.
Sự tương thích này tạo điều kiện cho nhà phát triển chuyển đổi hoặc mở rộng hệ thống với ít thay đổi, đồng thời tận dụng các công cụ và workflow đã dùng cho mô hình OpenAI.
Q: Qwen3-Max có phù hợp cho phát triển phần mềm tự động tạo mã không?
Có, mô hình được cải thiện về sinh mã và thể hiện năng lực tốt trên các benchmark liên quan đến code, phù hợp để tích hợp vào công cụ hỗ trợ lập trình.
Q: Phiên bản Thinking khác gì với bản chuẩn?
Phiên bản Thinking được tối ưu cho năng lực suy luận và toán học nhiều bước, đạt điểm cao ở các bài kiểm tra toán học chuyên sâu hơn bản chuẩn.
Q: API đã mở có tính phí hay miễn phí?
Thông tin về chính sách phí không được nêu rõ tại đây; cần kiểm tra tài liệu chính thức của nhà cung cấp để biết chi tiết về giá và điều khoản.