Nổi tiếng bất ngờ của DeepSeek đã gây ra lo ngại toàn cầu về dữ liệu, khi các cơ quan quản lý và chuyên gia bảo mật lo ngại về rủi ro an ninh quốc gia của ứng dụng AI Trung Quốc này.
Chiến dịch cấm đầu tiên của Ý và phản ứng quốc tế
Ý, nền kinh tế lớn thứ 3 của Liên minh châu Âu, đã tiên phong cấm DeepSeek khi chính quyền yêu cầu các chi tiết về thực hành dữ liệu của ứng dụng. Cơ quan giám sát bảo mật của Ý đã chỉ trích các biện pháp bảo vệ dữ liệu của startup Trung Quốc này là “không đủ.” Không chỉ trong EU, Hàn Quốc cùng chuẩn bị đặt câu hỏi tương tự như Ý, trong khi Bộ trưởng Tài chính Úc, Jim Chalmers, đã công khai cảnh báo người dân nên thận trọng khi sử dụng ứng dụng này.
Vấn đề bảo mật của DeepSeek không nằm ngoài áp lực ngày càng tăng đối với các công ty công nghệ Trung Quốc. Hoa Kỳ đã cấm TikTok với lý do an ninh quốc gia, với việc Tổng thống Donald Trump ban hành sắc lệnh hành pháp khôi phục dịch vụ của ứng dụng này trong vài giờ.
TinTucBitcoin đã yêu cầu DeepSeek làm rõ cách họ xử lý dữ liệu người dùng nhưng chưa nhận được phản hồi.
Vấn đề bảo mật và xử lý dữ liệu của DeepSeek
DeepSeek đang cố gắng sửa chữa các lỗ hổng bảo mật một cách khẩn trương. Các nhà nghiên cứu tại công ty bảo mật đám mây Wiz nói rằng họ đã phát hiện một lỗ hổng cho phép truy cập vào dữ liệu nội bộ, gồm thông tin nhạy cảm như lịch sử trò chuyện và API key. Lỗi này được báo cáo ngay lập tức và “đã được bảo mật nhanh chóng,” theo Wiz.
DeepSeek hay điệp viên ngầm?
Hoa Kỳ và Trung Quốc đang so kè quyết liệt trên nhiều mặt trận, bao gồm cả sự thống trị của AI. Trung Quốc được cho là chậm hơn Hoa Kỳ ít nhất sáu tháng trong phát triển AI cho đến khi DeepSeek đạt được đỉnh cao trên App Store của Apple, thách thức giả định này. Giờ đây, ứng dụng lại đối mặt với các lo ngại về quyền riêng tư dữ liệu giống như TikTok và công ty mẹ ByteDance.
Phân tích của công ty bảo mật Privado cho thấy DeepSeek thu thập và chia sẻ dữ liệu nhạy cảm của người dùng, gồm ID duy nhất, chi tiết thiết bị, vị trí, ngôn ngữ, và lịch sử trò chuyện, với ByteDance. Phân tích cũng cho thấy thông tin này được chia sẻ với tập đoàn công nghệ Hoa Kỳ Google.
DeepSeek cũng tích hợp bộ công cụ phát triển phần mềm (SDK) của ByteDance, tập đoàn công nghệ Trung Quốc Tencent và Google.
Mặc dù Privado ghi nhận sự lệch lạc giữa việc thu thập dữ liệu của DeepSeek và chính sách bảo mật của ứng dụng, công ty lưu ý rằng ứng dụng thực sự thu thập ít dữ liệu hơn so với tuyên bố. Privado cho biết, “Tuy nhiên, có luồng dữ liệu rõ ràng tới Trung Quốc.”
Sean O’Brien, sáng lập Yale Privacy Lab, đã đăng trên mạng social rằng DeepSeek truyền dữ liệu cơ bản về mạng và hồ sơ thiết bị đến ByteDance và các trung gian, nhưng đã giảm nhẹ rủi ro về quyền truy cập ứng dụng.
“Nói rõ hơn—các ứng dụng như DeepSeek và ChatGPT không tốt cho quyền riêng tư. Nhưng mô hình đe dọa của bạn phụ thuộc vào bối cảnh bạn sử dụng ứng dụng. Hầu hết các ứng dụng phổ biến hiện nay đều không tốt cho quyền riêng tư,” O’Brien thêm vào.
Cách Trung Quốc có thể truy cập dữ liệu của DeepSeek
Tháng 3 năm 2023, CEO của TikTok, Shou Zi Chew, đã ra điều trần trước Quốc hội Hoa Kỳ, trả lời các lo ngại về thực hành bảo mật dữ liệu của nền tảng và mối quan hệ của nó với chính phủ Trung Quốc. Trong buổi điều trần, các nhà lập pháp đã chất vấn giám đốc điều hành người Singapore về ảnh hưởng của Trung Quốc đối với nền tảng và an ninh dữ liệu người dùng Hoa Kỳ.
“DeepSeek sẽ nêu lên những lo ngại [an ninh quốc gia] giống như TikTok nếu nó trở nên phổ biến như vậy. Có một lịch sử khá sâu sắc của chính phủ Hoa Kỳ trong việc cấm công nghệ và truyền thông của những đối thủ, và tôi nghĩ rằng DeepSeek chắc chắn là một ứng viên tiềm năng cho điều đó trong thời gian trung hạn,” Aaron Brogan, người sáng lập Brogan Law, nói với TinTucBitcoin.
Tuy nhiên, quy định pháp lý của Trung Quốc chỉ ra rằng chính phủ thực tế có quyền truy cập dữ liệu người dùng dưới các điều kiện nhất định:
- Điều 37 của Luật An Ninh Mạng Trung Quốc yêu cầu tất cả dữ liệu cá nhân do các công ty Trung Quốc thu thập phải được lưu trữ trong đất liền Trung Quốc.
- Điều 7 của Luật Tình Báo Quốc Gia yêu cầu tất cả công dân và tổ chức phải hỗ trợ, giúp đỡ và hợp tác với các nỗ lực tình báo quốc gia.
- Điều 35 của Luật Bảo Vệ Thông Tin Cá Nhân (PIPL) nhấn mạnh rằng nhà nước có quyền xử lý dữ liệu cá nhân nhưng yêu cầu các cơ quan nhà nước phải hoàn thành nghĩa vụ thông báo trừ khi cản trở nghĩa vụ pháp lý của họ.
- Điều 13 của PIPL cho phép xử lý thông tin cá nhân mà không cần sự đồng ý của cá nhân trong một số điều kiện, kể cả lợi ích an ninh quốc gia.
Những điều khoản này hiệu quả trong việc trao cho chính phủ Trung Quốc một con đường pháp lý để truy cập dữ liệu người dùng dưới bóng an ninh quốc gia hoặc tuân thủ quy định.
Trong một buổi họp báo gần đây, Phát ngôn viên Bộ Ngoại giao Trung Quốc Mao Ning bác bỏ việc các công ty phải thu thập và giao nộp dữ liệu trái phép trong khi trả lời các câu hỏi từ phóng viên nước ngoài.
“Chúng tôi tin rằng các công ty Internet cần tuân thủ pháp luật và quy định địa phương. Đối với chính phủ Trung Quốc, chúng tôi cực kỳ coi trọng bảo mật và an ninh dữ liệu và bảo vệ theo pháp luật. Chính phủ Trung Quốc chưa từng và sẽ không bao giờ yêu cầu bất kỳ công ty hay cá nhân nào thu thập hoặc cung cấp dữ liệu đặt tại nước ngoài vi phạm pháp luật địa phương.”
Phụ thuộc vào DeepSeek và AI có thể làm lan truyền thông tin sai lệch
NewsGuard, một tổ chức giám sát truyền thông, đã kiểm tra chatbot của DeepSeek và nhận thấy nó đưa ra câu trả lời không chính xác hoặc hoàn toàn không phản hồi 83% thời gian khi được hỏi về các chủ đề liên quan đến tin tức.
Ngay cả khi đối diện với những tuyên bố sai lệch rõ ràng, chatbot chỉ thành công trong việc phản bác chúng vào 17% trường hợp. Điều này đưa mô hình R1 của DeepSeek gần cuối danh sách trong số 11 chatbot AI mà NewsGuard đã kiểm tra, xếp thứ 10 tổng thể.
Tại Hoa Kỳ, Bộ An ninh Nội địa và Cục Điều tra Liên bang đã phân loại thông tin sai lệch như một nguy cơ an ninh quốc gia. Liên minh châu Âu cũng đã xác định thông tin sai lệch như một mối đe dọa, chỉ ra các chiến dịch truyền thông social và truyền thông ủng hộ Nga.
Một trong những trường hợp nổi bật gần đây đã diễn ra tại Romania, nơi các thông tin sai lệch được cho là có hậu quả trực tiếp đến bầu cử trong cuộc bầu cử tổng thống năm 2024. Sự gia tăng đột ngột trong độ phổ biến của ứng cử viên cực hữu Călin Georgescu đã được liên kết với một chiến dịch thông tin sai lệch phối hợp trên TikTok, được cho là từ các nhóm nước ngoài để thao túng công chúng.
Điều tra đã tiết lộ những điểm tương đồng rõ rệt giữa chiến dịch của Georgescu và các hoạt động ảnh hưởng do Nga hậu thuẫn trong các nước láng giềng. Trong hậu quả đó, Tòa án Hiến pháp Romania đã hủy bỏ vòng đầu tiên của cuộc bầu cử, xem xét sự can thiệp nước ngoài và thông tin sai lệch như là mối đe dọa trực tiếp đến tính toàn vẹn của bầu cử.
Nghi ngờ về sự thành công của DeepSeek
Sự gia tăng nhanh chóng của DeepSeek đã gây chấn động Phố Wall, thách thức sự phụ thuộc của ngành công nghiệp AI vào tập đoàn chip Hoa Kỳ Nvidia. Công ty khởi nghiệp Trung Quốc tuyên bố đã phát triển mô hình AI của mình với chi phí thấp hơn nhiều, sử dụng các chip kém hiệu quả hơn — điều này mâu thuẫn trực tiếp với cách tiếp cận sử dụng các sản phẩm mạnh mẽ do Nvidia cung cấp mà các công ty Hoa Kỳ như Meta và OpenAI ưa chuộng.
Việc tiếp cận của Trung Quốc với chip tốt nhất của Nvidia bị hạn chế do lệnh cấm xuất khẩu của Hoa Kỳ, nghĩa là các công ty Trung Quốc phải dựa vào phiên bản kém hơn so với phiên bản mà công ty Hoa Kỳ có thể sử dụng. Tuy nhiên, một số nhà phân tích nghi ngờ tuyên bố của DeepSeek, đặt câu hỏi làm thế nào nó có thể đạt được những tiến bộ như vậy với chỉ 5,5 triệu USD tiền đào tạo — một phần không đáng kể so với số tiền mà các phòng thí nghiệm AI ở phương Tây chi tiêu.
Hoa Kỳ đã được cho là đã mở một cuộc điều tra về việc liệu DeepSeek có truy cập vào các sản phẩm hàng đầu của Nvidia qua các con đường sau không.
Trong khi đó, Microsoft và OpenAI đã mở một cuộc điều tra liệu DeepSeek có truy cập trái phép dữ liệu sở hữu của OpenAI hay không. Cuộc điều tra tập trung vào nghi ngờ rằng một nhóm liên quan đến DeepSeek có thể đã trích xuất một lượng lớn dữ liệu từ API của OpenAI mà không có sự cho phép.