Xiaomi Ra Mắt Mô Hình Lớn MiMo-7B
Xiaomi đã công bố mô hình lớn đầu tiên MiMo-7B, thiết kế đặc biệt cho khả năng lý luận. Mô hình này vượt qua OpenAI o1-mini và Ali Qwen-32B trong các đánh giá về lý luận toán học AIME và lập trình LiveCodeBench. Khả năng lý luận của MiMo được cải thiện thông qua quá trình tiền huấn luyện từ dữ liệu lý luận quy mô lớn và huấn luyện tăng cường sau đó.
Thuật Toán Đổi Mới
MiMo-7B giới thiệu các thuật toán đổi mới như Test Difficulty Driven Reward, giúp tối ưu hóa tiềm năng huấn luyện tăng cường. Mô hình này đứng đầu về tiềm năng trong số các mô hình 7B tương tự. Việc kết hợp các thuật toán mới làm cho khả năng xử lý của MiMo vượt trội.
Nguồn Mở và Tài Liệu Kỹ Thuật
Toàn bộ loạt mô hình MiMo-7B đã được mở mã trên Hugging Face, cho phép cộng đồng tiếp cận và sử dụng. Các báo cáo kỹ thuật liên quan cũng được công bố, cung cấp cái nhìn sâu hơn về các đổi mới của mô hình. Điều này tạo điều kiện cho các nhà nghiên cứu và phát triển dễ dàng phân tích và ứng dụng những khả năng tiên tiến của MiMo-7B vào thực tế.
Lưu Ý
Nội dung này chỉ nhằm cung cấp thông tin thị trường và không cấu thành lời khuyên đầu tư.