Công ty trí tuệ nhân tạo Anthropic vừa công bố ra mắt phiên bản mới của mô hình Claude AI cùng với bản thử nghiệm beta cho “sử dụng máy tính” vào ngày 22 tháng 10.
Phiên bản beta này sẽ cho phép các nhà phát triển làm việc với API cho phép Claude điều khiển con trỏ chuột, nhấp vào các nút và ô, và tự động chèn văn bản trong môi trường máy tính của người dùng.
Một video trình diễn chức năng sử dụng máy tính của Claude cho thấy khả năng của máy móc trong việc điều hướng nhiều cửa sổ, mở các tab mới để tìm kiếm thông tin, và chuyển dữ liệu từ cửa sổ này sang cửa sổ khác.
Kiểm soát máy tính
Dưới mô hình hiện tại, các mô hình ngôn ngữ lớn do trí tuệ nhân tạo điều khiển như Claude của Anthropic và ChatGPT của OpenAI tương tác với người dùng thông qua một cửa sổ giao diện chuyên dụng. Một số mô hình có thể thực hiện tìm kiếm web hạn chế trong khuôn khổ giao diện của chúng, nhưng các tương tác bên ngoài thường chỉ giới hạn ở cho phép người dùng tải lên tài liệu để AI xử lý.
Với phiên bản beta sử dụng máy tính mới của Anthropic, công ty hy vọng các nhà phát triển cuối cùng sẽ có thể tự động hóa mọi chức năng mà con người ngồi tại máy trạm có thể thực hiện được.
Theo một bài đăng trên blog của công ty:
“Các nhà phát triển có thể chỉ đạo Claude sử dụng máy tính theo cách mà con người làm—bằng cách nhìn vào màn hình, di chuyển con trỏ, nhấp các nút, và gõ văn bản. Claude 3,5 Sonnet là mô hình AI tiên phong đầu tiên cung cấp khả năng sử dụng máy tính trong giai đoạn beta công khai. Ở giai đoạn này, nó vẫn còn thực nghiệm—đôi khi rườm rà và có khuynh hướng sai sót.”
Phiên bản beta sử dụng máy tính chỉ dành cho các nhà phát triển thông qua Claude API; tuy nhiên, Anthropic cho biết họ đang phát hành sớm để nhận phản hồi từ các nhà phát triển. Công ty kỳ vọng tính năng này sẽ “cải thiện nhanh chóng theo thời gian”.
Quyền riêng tư và bảo mật
Anthropic đề cập đến một số lo ngại về quyền riêng tư và bảo mật trong bài đăng trên blog, nêu rõ rằng “vì việc sử dụng máy tính có thể cung cấp một hướng tấn công mới cho các mối đe dọa quen thuộc như spam, thông tin sai lệch hoặc gian lận,” công ty đang có cách tiếp cận “chủ động để thúc đẩy sự triển khai an toàn của nó” và có thể xác định khi nào việc sử dụng máy tính bị triển khai không đúng cách.