Vào ngày 25 tháng 3, đội ngũ Qwen thông báo rằng mô hình Qwen2.5-VL-32B-Instruct đã chính thức được mở mã nguồn. Mô hình này có quy mô tham số lên tới 32B, thể hiện hiệu suất xuất sắc trong các nhiệm vụ như hiểu hình ảnh, suy luận toán học và tạo văn bản. Qua học tăng cường, mô hình này đã được tối ưu hóa giúp đưa ra phản hồi phù hợp hơn với sở thích của con người, vượt qua mô hình 72B trước đó trong các đánh giá đa phương thức như MMMU và MathVista.
So với các phiên bản trước trong dòng Qwen2.5-VL, mô hình 32B có những cải tiến quan trọng sau:
Thứ nhất, các phản hồi từ mô hình phù hợp với sở thích chủ quan của con người hơn. Định dạng và phong cách xuất ra đã điều chỉnh, đáp ứng các tiêu chí chuẩn mực và chi tiết mà con người mong đợi.
thứ 2, khả năng suy luận toán học đã được cải thiện đáng kể. Mô hình có độ chính xác cao hơn trong việc giải quyết các vấn đề toán học phức tạp.
Cuối cùng, khả năng hiểu và suy luận hình ảnh ở cấp độ chi tiết cũng được nâng cao rõ rệt. Mô hình tỏ ra chính xác hơn trong các nhiệm vụ như phân tích hình ảnh, nhận dạng nội dung và suy luận logic hình ảnh.
Lưu ý rằng nội dung này chỉ nhằm cung cấp thông tin thị trường và không cấu thành tư vấn đầu tư.