Mâu thuẫn Nghiêm Trọng Giữa BBC Và Startup AI Về Việc Thu Thập Nội Dung Tiền Điện Tử
BBC phản đối hành vi scraping nội dung không cho phép
Đài phát thanh BBC của Vương quốc Anh đã chính thức gửi thư kiện đến startup trí tuệ nhân tạo Perplexity, cáo buộc họ thu thập dữ liệu nội dung của BBC mà không có sự đồng ý. Trong thư, BBC yêu cầu Perplexity ngừng mọi hoạt động scrape dữ liệu từ các bài báo của BBC, xóa bỏ tất cả nội dung sao chép và đề xuất “bồi thường tài chính”.
Nếu không tuân thủ, nhà đài cảnh báo sẽ đệ đơn yêu cầu phán quyết chặn vĩnh viễn việc sử dụng dữ liệu của BBC để bảo vệ quyền sở hữu trí tuệ của mình.
Yêu cầu chặn hoạt động scrape của Perplexity
Đây là lần đầu tiên BBC bước chân vào cuộc chiến pháp lý để bảo vệ nội dung của mình trước một nền tảng trí tuệ nhân tạo. Perplexity, có trụ sở tại San Francisco, không xây dựng mô hình ngôn ngữ riêng mà chỉ khai thác các mô hình có sẵn, như một phần mềm front-end, thu thập dữ liệu từ các trang web một cách ồ ạt.
BBC chỉ rõ rằng, mô hình AI của Perplexity đã được huấn luyện dựa trên hàng loạt bài báo của BBC — điều này vượt qua giới hạn của đổi mới hợp pháp, tiến gần hơn tới hành vi xâm phạm bản quyền.
“Công cụ của Perplexity cạnh tranh trực tiếp với dịch vụ của BBC, giúp người dùng truy cập nhanh, giảm bớt bước truy cập chính thống,” BBC nhấn mạnh trong thư gửi Perplexity.
BBC còn cung cấp bằng chứng cho thấy hành vi sao chép toàn bộ nội dung của họ vào các mô hình huấn luyện AI của startup này. Nhà phát hành yêu cầu dừng hoạt động scrape ngay lập tức và xóa sạch các dữ liệu BBC đã bị thu thập bất hợp pháp.
Nếu không, BBC sẽ theo đuổi các biện pháp pháp lý, có thể là lệnh cấm sử dụng nội dung trái phép hoặc bồi thường thiệt hại về sở hữu trí tuệ.
Phản pháo của Perplexity và tranh chấp ngày càng leo thang
Perplexity đã phản ứng, gọi các cáo buộc của BBC là “fully thông tin sai lệch và dựa trên cơ sở chính trị”. Họ cho rằng, bản chất của dịch vụ chỉ là giao diện truy cập các mô hình dữ liệu đã có chứ không tự xây dựng hay huấn luyện AI riêng.
Trong phát biểu với Financial Times, startup này cáo buộc BBC chưa hiểu rõ về công nghệ, luật sở hữu trí tuệ và phạm vi thu thập dữ liệu trên internet.
Giới truyền thông Anh quốc và cuộc chiến về quyền sở hữu nội dung tiền điện tử
Hành động pháp lý của BBC diễn ra khi các nhà quản lý tại Vương quốc Anh đang xem xét quy định “tự chọn” trong đó các nền tảng AI có thể scrape dữ liệu bản quyền trừ khi nhà xuất bản có phản đối rõ ràng. Các bên truyền thông lớn, như BBC, cảnh báo rằng, nếu mất kiểm soát, ngành công nghiệp sáng tạo trị giá 125 tỷ GBP sẽ bị xói mòn toàn bộ.
“Chúng ta phải bảo vệ quyền sở hữu trí tuệ quốc gia,” ông Tim Davie, Giám đốc điều hành BBC, nhấn mạnh.
Thêm vào đó, các tập đoàn truyền thông như The New York Times, Dow Jones, và News Corp đã đệ đơn kiện, yêu cầu các startup AI ngưng khai thác nội dung của họ. Một số công ty lớn đã ký kết hợp đồng cấp phép, trong khi Perplexity vẫn chưa đạt được thỏa thuận nào.
Vấn đề quan trọng của việc thu thập dữ liệu trong kỷ nguyên tiền điện tử AI
Trong bối cảnh hiện tại, câu hỏi trung tâm là: liệu các nhà phát triển AI có quyền tự do khai thác dữ liệu trực tuyến hay phải trả phí cho từng byte nội dung được bảo vệ bản quyền? Các nhà ủng hộ xem việc tự do scrape như một yếu tố then chốt để thúc đẩy tiến bộ công nghệ AI, trong khi các nhà phê bình cảnh báo về nguy cơ làm suy yếu ngành báo chí và truyền thông chuyên nghiệp.
Trong khi cuộc chiến pháp lý giữa BBC và Perplexity diễn ra, kết quả có thể thay đổi toàn bộ quy tắc khai thác dữ liệu, ảnh hưởng tới các nhà phát triển và chủ sở hữu nội dung trong lĩnh vực tiền điện tử và công nghệ số.