Phiên bản Grok AI tiếp theo của Elon Musk sẽ ưu tiên xử lý hình ảnh “thế giới thực”. Grok-1.5 sẽ sớm có sẵn cho người thử nghiệm và khách hàng sử dụng sản phẩm hiện tại.
Tầm nhìn Grok-1.5 của Elon Musk: Tập trung vào sự hiểu biết về không gian trong thế giới thực
Bản phát hành Grok-1.5 rất được mong đợi của chatbot AI của Elon Musk sẽ tập trung vào làm việc với thông tin trực quan: tài liệu, sơ đồ, biểu đồ, ảnh chụp màn hình và ảnh.
Những mục tiêu đầy tham vọng như vậy đã được Elon Musk chia sẻ trong thông báo “Bản xem trước tầm nhìn Grok-1.5” trên X hôm nay, ngày 13 tháng 4 năm 2024.
Grok-1.5 Vision https://t.co/B9LkGwviWs
— Elon Musk (@elonmusk) April 13, 2024
Như đã thông báo trong tài liệu, phiên bản mới của chatbot sẽ được trang bị một mô-đun xử lý hình ảnh mạnh mẽ để hiểu các sự kiện và quy trình trong thế giới thực được đặt tên là RealWorldQA: Chúng tôi đặc biệt vui mừng về khả năng của Grok trong việc hiểu thế giới vật chất của chúng ta.
Elon Musk trước đó đã tuyên bố rằng Grok 1.5 sẽ đọc và tóm tắt X bài đăng rất tốt và thậm chí còn giúp người dùng X tạo chúng.
Bản phát hành đầu tiên của RealWorldQA bao gồm hơn 700 hình ảnh, kèm theo một câu hỏi và câu trả lời dễ kiểm chứng cho mỗi hình ảnh.
Bộ dữ liệu hoàn toàn có nguồn mở và có sẵn cho những người đam mê theo loại giấy phép CC BY-ND 4.0.
Grok-1.5V hoạt động vượt trội hơn GPT4 và Gemini Pro 1.5
Phần lớn, bộ dữ liệu tiên phong bao gồm các hình ảnh ẩn danh được chụp từ các phương tiện, bên cạnh các hình ảnh thực tế khác.
Trong một loạt mẫu đính kèm, Grok-1.5 chuyển đổi sơ đồ khối thành mã Python, tạo câu chuyện trước khi đi ngủ dựa trên bức tranh của một đứa trẻ, tạo tập dữ liệu CSV từ ảnh chụp màn hình, “mở rộng” meme, v.v.
Ngoài ra, nhóm xAI đã chia sẻ ước tính về hiệu suất của Grok-1.5 so với các đối thủ chính của nó, GPT của OpenAI, Gemini Pro 1.5 của Google và Claude 3 của Anthropic.
Báo cáo của xAI cho biết Grok-1.5 vượt trội hơn tất cả các đối thủ trong các nhiệm vụ toán học, đọc văn bản và hiểu thế giới thực.
Tin Tức Bitcoin tổng hợp.