Một nghiên cứu đăng trên Science cảnh báo các chiến dịch gây ảnh hưởng trực tuyến sẽ chuyển từ bot dễ nhận diện sang bầy AI gồm nhiều tác nhân tự trị, có thể phối hợp thao túng dư luận với rất ít can thiệp của con người.
Nghiên cứu cho rằng bầy AI có thể bắt chước hành vi người dùng, tự điều chỉnh thông điệp trên nhiều tài khoản và nền tảng, đồng thời duy trì các câu chuyện theo mục tiêu trong thời gian dài, khiến hệ thống kiểm soát rủi ro hiện tại khó phát hiện.
- Bầy AI gồm nhiều tác nhân tự trị có thể phối hợp thao túng dư luận.
- Khả năng thích nghi đa nền tảng làm suy yếu bộ lọc nhắm vào spam/vi phạm đơn lẻ.
- Thiếu xác minh danh tính, giám sát lạm dụng và cơ chế minh bạch/kiểm toán.
Cảnh báo chính của nghiên cứu
Nghiên cứu nhận định các chiến dịch gây ảnh hưởng đang tiến hóa thành bầy tác nhân AI tự trị, hoạt động phối hợp và khó truy vết hơn botnet hoặc tài khoản troll truyền thống.
Theo nhóm học giả, bầy AI có thể mô phỏng hành vi con người và tự điều chỉnh lập luận giữa các tài khoản và nền tảng khác nhau. Thay vì phát tán nội dung rời rạc, các tác nhân có thể cùng duy trì một tường thuật cụ thể trong thời gian dài, tạo cảm giác như sự đồng thuận tự nhiên.
Điểm rủi ro cốt lõi là mức độ tự động hóa cao: bầy tác nhân có thể vận hành với tối thiểu can thiệp của con người, làm tăng tốc độ thử nghiệm thông điệp, thay đổi chiến thuật và tối ưu hóa tác động. Mô hình này khiến các dấu hiệu nhận diện truyền thống (mẫu spam, hành vi đơn tuyến) trở nên kém hiệu quả.
Vì sao hệ thống kiểm duyệt hiện tại bị đánh giá là недостат đủ
Nghiên cứu cho rằng các cơ chế kiểm soát và kiểm duyệt vốn tập trung vào spam và vi phạm đơn điểm sẽ khó phát hiện hành vi phối hợp bất thường của bầy AI.
Các học giả nêu hạn chế đáng kể của nền tảng ở ba mảng: xác minh danh tính, giám sát lạm dụng tài khoản, và mức minh bạch cùng khả năng kiểm toán bên ngoài đối với các hành vi cộng tác bất thường. Khi thiếu các lớp phòng vệ này, việc chỉ dựa vào kiểm duyệt nội dung không tạo thành một hệ thống phòng thủ hiệu quả.
Hệ quả là bầy AI có thể phân tán rủi ro qua nhiều tài khoản, chuyển giọng điệu theo bối cảnh từng nền tảng và duy trì nhịp độ kể chuyện liên tục. Điều này làm giảm hiệu quả của các biện pháp phát hiện dựa trên nội dung riêng lẻ, đồng thời tăng nhu cầu theo dõi mức độ phối hợp và hành vi ở cấp hệ thống.





