Google DeepMind đã ra mắt Gemini Robotics-ER 1.6, mô hình suy luận cho robot, với cải thiện đáng kể ở các tác vụ nhận biết không gian và vật lý như chỉ điểm, định vị, đếm vật thể và phát hiện thành công đa góc nhìn.
Mô hình này cũng bổ sung khả năng đọc thiết bị công nghiệp, đồng thời được giới thiệu như một trung tâm ra quyết định cấp cao cho robot, có thể dùng trực tiếp các công cụ như Google Search và VLA.
Nâng cấp về suy luận và an toàn
Theo công bố, Gemini Robotics-ER 1.6 dùng “academic vision” để phóng đại các vùng quan trọng, sau đó kết hợp thao tác chỉ điểm và tính toán bằng code để đọc chỉ số thiết bị với độ chính xác cao hơn.
Google DeepMind cho biết mô hình này còn vượt các phiên bản trước về tuân thủ lệnh an toàn và đánh giá ràng buộc an toàn vật lý.
Gemini Robotics-ER 1.6 hiện đã उपलब्ध cho nhà phát triển thông qua Gemini API và Google AI Studio.





