OpenAI vừa công bố công cụ “GPTBot” mới nhất của mình, có khả năng cải thiện các phiên bản AI ChatGPT trong tương lai.
Công ty tin rằng việc thu thập dữ liệu từ các trang web có thể được sử dụng để cải thiện độ chính xác và mở rộng khả năng của các mô hình AI sắp tới.
Các trình thu thập dữ liệu trên web, còn được gọi là web spiders, là các bot được sử dụng để chỉ mục nội dung trang web trên Internet. Các công cụ tìm kiếm như Google và Bing sử dụng các trình thu thập này để đảm bảo các trang web xuất hiện trong kết quả tìm kiếm.
OpenAI đã làm rõ rằng GPTBot chỉ thu thập dữ liệu công khai từ trên web, tránh các nguồn có nội dung đòi tiền, thông tin cá nhân hoặc văn bản vi phạm chính sách của họ.
Chủ sở hữu trang web có thể ngăn GPTBot thu thập dữ liệu từ trang của họ bằng cách thêm lệnh “disallow” vào một tệp tiêu chuẩn trên máy chủ của họ.
Tính năng này cho phép họ kiểm soát việc xem liệu nội dung web của họ có được bao gồm trong quá trình thu thập dữ liệu hay không.
Thú vị là OpenAI đã nộp đơn đăng ký thương hiệu cho “GPT-5”, phiên bản kế tiếp được mong đợi của mô hình GPT-4 hiện tại.
Tuy nhiên, CEO Sam Altman đã làm rõ rằng việc đào tạo GPT-5 không thể xảy ra ngay lập tức, vì công ty cần tiến hành một số cuộc kiểm tra đảm bảo an toàn trước khi bắt đầu quá trình này.
Gần đây, có những lo ngại về việc thu thập dữ liệu của OpenAI, đặc biệt là về bản quyền và sự đồng ý.
Vào tháng 6, cơ quan bảo vệ quyền riêng tư của Nhật Bản đã cảnh báo OpenAI vì thu thập dữ liệu nhạy cảm mà không có sự cho phép đúng đắn.
Tương tự, Ý đã tạm ngừng sử dụng ChatGPT do vi phạm luật quyền riêng tư của Liên minh châu Âu.
Ngoài ra, một vụ kiện tập thể đã được đệ trình chống lại OpenAI bởi 16 nguyên đơn, cáo buộc công ty truy cập thông tin riêng tư từ các tương tác người dùng với ChatGPT. Microsoft, được đề cập là một đơn định, cũng có thể bị liên quan.
Nếu những cáo buộc này được chứng minh là đúng, OpenAI và Microsoft có thể bị coi là vi phạm Đạo luật Lạm dụng và Lừa đảo Máy tính, một luật đã từng giải quyết các trường hợp liên quan đến thu thập dữ liệu trên web.
Tóm lại, công cụ thu thập dữ liệu trên web mới của OpenAI, GPTBot, mang lại tiềm năng hứa hẹn để cải thiện các mô hình ChatGPT trong tương lai.
Tuy nhiên, các vấn đề liên quan đến việc thu thập dữ liệu phải được giải quyết để đảm bảo tuân thủ các luật quyền riêng tư và ngăn chặn các hậu quả pháp lý có thể xảy ra.
Khi công ty chuẩn bị phát triển GPT-5, rất quan trọng để ưu tiên các cuộc kiểm tra an toàn và tuân thủ các tiêu chuẩn đạo đức trong nghiên cứu và phát triển trí tuệ nhân tạo.
Tin Tức Bitcoin tổng hợp