AI chatbot Claude bị hacker khai thác để xâm nhập vào hàng loạt cơ quan chính phủ Mexico, làm rò rỉ 150 GB số liệu về thuế và thông tin cá nhân của các cử tri.
Một tên hacker đã khai thác chatbot trí tuệ nhân tạo Claude của Anthropic PBC để ra tay thực hiện hàng loạt cuộc tấn công nhằm vào các cơ quan thuộc chính phủ Mexico, dẫn đến việc lấy cắp một số lượng lớn số liệu về thuế và thông tin cá nhân nhạy cảm. Thông tin này được công bố ra từ công ty an ninh mạng Israel
Gambit Security trong một bản báo cáo nghiên cứu cho phát hành ra hôm thứ Tư 25/2/2026.
Theo các chuyên gia nghiên cứu, một kẻ sử dụng chatbot Claude chưa xác định ra danh tính đã sử dụng các câu qua tiếng Tây Ban Nha, yêu cầu chatbot đóng vai một hacker cao cấp. Claude được yêu cầu tìm ra lỗ hổng trong mạng lưới chính phủ, viết ra mã khai thác và đề xuất cách tự động hóa quá trình đánh cắp số liệu. Hoạt động này đã được bắt đầu từ tháng 12/2025 và kéo dài khoảng một tháng.

Tòa nhà Torre del Caballito, nơi đặt trụ sở cơ quan thuế liên bang, tại Thành phố Mexico. (Ảnh: Yuri Cortez/AFP/Getty Images)
Tổng cộng, có khoảng 150 GB số liệu của chính phủ Mexico đã bị lấy cắp. Số dữ kiện này bao gồm các tài liệu có liên quan đến 195 triệu hồ sơ người dân nộp thuế, hồ sơ cử tri, thông tin đăng nhập của nhân viên chính phủ và các tập tin từ cơ quan đăng ký dân sự.
Các mục tiêu bị xâm nhập bao gồm cơ quan thuế liên bang Mexico và Viện Bầu cử Quốc gia. Ngoài ra, chính quyền các bang Jalisco, Michoacán và Tamaulipas, cơ quan đăng ký dân sự của Mexico City cùng đơn vị cấp nước tại Monterrey cũng bị ảnh hưởng lây.
Tòa nhà Torre del Caballito tại Mexico City, nơi đặt văn phòng cơ quan thuế liên bang, được xác định là một trong những mục tiêu của cuộc tấn công này.
Báo cáo cho biết chatbot Claude ban đầu đã cảnh cáo người sử dụng về ý định độc hại trong quá trình trao đổi. Tuy nhiên, sau nhiều lần cho thử nghiệm và điều chỉnh các câu lệnh, tên hacker đã thành công trong việc
"bật mí" ("jailbreak") hệ thống, tức là vượt qua các cơ chế kiểm soát an toàn. Khi đó, Claude đã cho thực thi hàng ngàn lệnh trên mạng máy tính của chính phủ. Dù vậy, theo đại diện Anthropic, trong suốt chiến dịch tấn công, chatbot vẫn có những thời điểm từ chối vài lệnh yêu cầu.
Anthropic cho biết đã cho điều tra các cáo buộc, ngăn chặn hoạt động và cấm các tài khoản có liên quan. Công ty cũng bổ sung rằng những ví dụ về hành vi lạm dụng sẽ được đưa vào số liệu huấn luyện nhằm cải thiện khả năng phòng vệ của các phiên bản mới, trong đó có Claude Opus 4.6 với cơ chế phát hiện và ngăn chặn việc lạm dụng được tăng cường.
Trong quá trình khai thác, tên hacker đã tìm cách thuyết phục AI Claude rằng mình đang tham gia một chương trình
"bug bounty" nhằm phát hiện ra lỗ hổng để nhận tiền thưởng hợp pháp. Tuy nhiên, khi yêu cầu cho xóa nhật ký hoạt động và lịch sử lệnh, Claude đã cảnh cáo rằng, việc che giấu hành động là dấu hiệu đáng ngờ trong bối cảnh kiểm tra hợp pháp. Sau đó, tên hacker đã thay đổi chiến thuật, cung cấp cho AI một kịch bản tấn công chi tiết để vượt qua rào cản bảo mật.
Khi gặp khó khăn hoặc cần thêm thông tin, tên hacker còn tìm đến ChatGPT của OpenAI để xin góp ý bổ sung, bao gồm cách di chuyển ngang trong mạng nội bộ, xác định thông tin đăng nhập cần thiết và ước tính khả năng bị phát hiện. Phía OpenAI cho biết đã phát hiện các nỗ lực sử dụng mô hình cho mục đích vi phạm chính sách và đã từ chối không đáp ứng lại. Các tài khoản có liên quan cũng đã bị cấm.
Công ty an ninh mạng
Gambit cho biết, họ chưa quy ra trách nhiệm cuộc tấn công cho nhóm hacker cụ thể nào và không tin rằng các đối tượng này có dính líu sâu với chính phủ nước ngoài. Theo ông Curtis Simpson, Giám đốc chiến lược của
Gambit, AI đã tạo ra hàng ngàn báo cáo chi tiết với kế hoạch sẵn sàng thực thi, hướng dẫn cụ thể mục tiêu nội bộ cần tấn công tiếp theo và thông tin xác thực cần đem ra sử dụng.
Đáng chú ý, trước đó trong tháng 11, Anthropic từng thông báo đã ngăn chặn một chiến dịch gián điệp mạng được điều phối bởi AI, liên quan đến các hacker bị nghi có hậu thuẫn từ Trung Quốc, nhắm vào 30 mục tiêu toàn cầu và một số vụ đã thành công.
Các vụ xâm nhập tại Mexico được xem là ví dụ mới nhất cho xu hướng tội phạm mạng đang tận dụng AI để mở rộng quy mô và tăng hiệu quả tấn công xâm nhập. Trong bối cảnh các công ty kỹ nghệ như Anthropic và OpenAI đẩy mạnh phát minh ra thêm nhiều ứng dụng lập trình dựa trên AI, còn các hãng an ninh mạng cũng đầu tư vào việc phòng thủ qua AI, giới tội phạm và gián điệp mạng cũng đang tìm ra những phương thức mới để khai thác triệt để kỹ thuật mới mẽ này.
Phía chính phủ Mexico cho biết đang điều tra các vụ xâm nhập vào nhiều tổ chức công. Tuy nhiên, Viện Bầu cử Quốc gia khẳng định chưa phát hiện ,thấy có truy cập trái phép trong những tháng gần đây và đã tăng cường chiến lược về an ninh mạng. Chính quyền bang Jalisco phủ nhận việc hệ thống của bang bị xâm nhập, cho rằng chỉ có mạng lưới liên bang bị ảnh hưởng. Một số cơ quan khác chưa đưa ra lời bình luận chính thức nào.