Công cụ AI như agentsmd, skillsmd và mcp đang bị cảnh báo rủi ro tấn công từ khóa độc hại; nếu bật danger mode, công cụ có thể tự động điều khiển máy tính người dùng mà không cần xác nhận.
Ngày 29/12, Yu Xian (nhà sáng lập SlowMist) nhấn mạnh các vụ việc liên quan đã xuất hiện, yêu cầu người dùng cảnh giác khi dùng AI tools có khả năng thực thi hành động trên thiết bị.
- Cảnh báo tấn công keyword độc hại nhắm vào AI tools.
- Danger mode có thể cho phép tự động điều khiển máy tính.
- Tắt danger mode: mỗi thao tác cần xác nhận, giảm hiệu suất.
Cảnh báo bảo mật từ SlowMist
Yu Xian cảnh báo người dùng cần đề phòng các cuộc tấn công bằng từ khóa độc hại trong các công cụ AI như agentsmd, skillsmd và mcp.
Theo thông tin ngày 29/12, các trường hợp liên quan đã xuất hiện, cho thấy rủi ro không còn mang tính lý thuyết. Dạng tấn công này có thể lợi dụng đầu vào (keyword/prompt) để khiến công cụ AI thực hiện hành vi ngoài ý muốn của người dùng.
Với bối cảnh nhiều người dùng tiền điện tử sử dụng AI để tự động hóa thao tác, cảnh báo tập trung vào việc kiểm soát quyền thực thi trên thiết bị, thay vì chỉ rủi ro về nội dung hoặc sai lệch thông tin.
Danger mode và mức độ kiểm soát máy tính
Khi danger mode được bật, công cụ AI có thể tự động kiểm soát máy tính người dùng mà không cần bất kỳ xác nhận nào.
Điều này làm gia tăng rủi ro nếu AI tool bị lợi dụng bởi keyword độc hại, vì chuỗi hành động có thể được thực thi tự động, nhanh và khó can thiệp kịp thời. Ngược lại, nếu danger mode không được bật, người dùng phải xác nhận cho từng thao tác.
Cơ chế xác nhận theo từng bước giúp giảm khả năng bị điều khiển ngoài ý muốn, nhưng sẽ ảnh hưởng hiệu suất vận hành. Người dùng cần cân nhắc giữa tốc độ tự động hóa và mức độ an toàn khi cấp quyền điều khiển cho AI tools.