Ngày 13 tháng 3, CEO của Google, Sundar Pichai, công bố chính thức ra mắt mô hình lớn đa chiều mã nguồn mở mới nhất, Gemma 3, từ Google DeepMind. Điểm nổi bật của Gemma 3 là hiệu năng cao, chi phí thấp, hỗ trợ cả văn bản, lý luận trực quan và gọi hàm. Các tham số của Gemma 3 bao gồm bốn mức: 1B, 4B, 12B và 27B. Đáng chú ý, mô hình lớn nhất 27B chỉ cần một GPU H100 để vận hành hiệu quả, trong khi các mô hình tương tự cần gấp 10 lần năng lực tính toán để đạt hiệu suất tương tự.
Gemma 3 hỗ trợ 140 ngôn ngữ, sở hữu cửa sổ ngữ cảnh 128K, cải thiện đáng kể khả năng xử lý văn bản dài. Theo kết quả của thử nghiệm tại ChatbotArena của LMSYS, mô hình 27B của Gemma 3 chỉ đứng sau DeepSeek R1-671B và cao hơn nhiều mô hình mã nguồn mở nổi tiếng như o3-mini và Llama3-405B.
Ngoài ra, Google cũng ra mắt ShieldGemma 2, tập trung vào việc phát hiện an ninh hình ảnh, hỗ trợ các nhà phát triển lọc nội dung nhạy cảm. Gemma 3 hiện đã có sẵn để tải về và có thể sử dụng thông qua các nền tảng như Google AI Studio, Hugging Face và Vertex AI.
Nội dung này chỉ nhằm mục đích cung cấp thông tin thị trường và không phải là lời khuyên đầu tư.