Trong khi các tiến bộ về trí tuệ nhân tạo mở ra cơ hội ở nhiều ngành công nghiệp, các đổi mới cũng có thể trở thành mục tiêu của hacker, đánh dấu tiềm năng đáng lo ngại cho việc lạm dụng AI.
Bộ phận tình báo đe dọa của Google đã phát hành tài liệu với tiêu đề Sử dụng Sai Trái Của AI Tạo Sinh, tiết lộ cách mà các diễn viên đe dọa đã tiếp cận chatbot trí tuệ nhân tạo, Gemini.
Theo Google, các diễn viên đe dọa đã cố gắng sử dụng lỗ hổng để phá vỡ AI bằng cách sử dụng các gợi ý. Ngoài ra, các nhóm đe dọa dai dẳng tiên tiến, được chính phủ hỗ trợ cũng đã thử sử dụng Gemini để hỗ trợ họ trong các hoạt động xấu.
Google báo cáo các nỗ lực phá vỡ không thành công đối với Gemini
Google cho biết, mặc dù đã có những nỗ lực phá vỡ Gemini, hãng không thấy có sự nỗ lực nâng cao trong phương hướng tấn công này.
Theo Google, các hacker chỉ sử dụng các biện pháp cơ bản như thay đổi cách diễn đạt hoặc gửi đi gửi lại cùng một gợi ý. Google cho biết các nỗ lực đó đã thất bại.
Các cuộc tấn công phá vỡ AI là các cuộc tấn công tiêm đầu vào nhằm yêu cầu mô hình AI thực hiện các nhiệm vụ đã bị cấm, bao gồm cả việc làm rò rỉ thông tin nhạy cảm hoặc cung cấp nội dung không an toàn.
Google cho biết, trong một trường hợp, một diễn viên APT đã dùng các gợi ý công khai để lừa Gemini thực hiện các nhiệm vụ mã hóa xấu. Tuy nhiên, Google cho biết nỗ lực đó không thành công vì Gemini đã cung cấp một phản hồi có lớp lọc an toàn.
Cách các diễn viên đe dọa được chính phủ hỗ trợ sử dụng Gemini
Ngoài các nỗ lực phá vỡ đơn giản, Google đã báo cáo cách các nhóm APT được chính phủ hỗ trợ tiếp cận Gemini.
Google cho biết những kẻ tấn công này đã cố gắng sử dụng Gemini để hỗ trợ trong các hoạt động xấu, bao gồm thu thập thông tin về mục tiêu của họ, nghiên cứu các lỗ hổng được công khai và các nhiệm vụ mã hóa và thiết kế. Ngoài ra, Google cho biết có những nỗ lực để hỗ trợ các hoạt động sau khi xâm nhập như né tránh phòng thủ.
Google báo cáo rằng các diễn viên APT có trụ sở tại Iran tập trung vào việc dùng AI để tạo ra các chiến dịch lừa đảo. Họ cũng đã sử dụng mô hình AI để thực hiện các cuộc trinh sát trên các chuyên gia và tổ chức phòng thủ. Các diễn viên APT ở Iran cũng đã sử dụng AI để tạo nội dung an ninh mạng.
Trong khi đó, các diễn viên APT Trung Quốc đã sử dụng Gemini để khắc phục lỗi mã hóa, lập trình và phát triển. Ngoài ra, họ đã sử dụng AI để nghiên cứu cách thâm nhập sâu hơn vào các mạng mục tiêu của họ.
Các diễn viên APT ở Bắc Triều Tiên cũng đã sử dụng Gemini cho các giai đoạn khác nhau trong chu kỳ tấn công của họ, từ nghiên cứu đến phát triển. Báo cáo cho biết:
“Họ cũng đã sử dụng Gemini để nghiên cứu các chủ đề có lợi ích chiến lược cho chính phủ Bắc Triều Tiên, chẳng hạn như quân đội Hàn Quốc và tiền điện tử.”
Trong năm 2024, các hacker Bắc Triều Tiên đã đánh cắp 1,3 tỷ USD tài sản kỹ thuật số, theo Chainalysis.