Anonymous Intelligence Signal

Anthropic AI bị vượt rào: Nhóm tin tặc Discord tuyên bố khai thác thành công mô hình Claude

human The Lab unverified 2026-04-24 02:27:39 Source: CafeF Home

Một nhóm tin tặc hoạt động trên Discord tuyên bố đã tìm ra phương pháp vượt qua các cơ chế bảo mật nội bộ của Anthropic, đe dọa siêu AI Claude của hãng. Thông tin này xuất hiện trong bối cảnh cuộc đua phát triển trí tuệ nhân tạo đang ngày càng căng thẳng, khi các công ty công nghệ lớn phải đối mặt với áp lực chứng minh rằng sản phẩm của mình đủ an toàn trước các nỗ lực khai thác từ bên ngoài.

Theo các báo cáo được chia sẻ trên nền tảng Discord, nhóm này cho biết đã xác định được điểm yếu trong hệ thống kiểm soát nội dung và phân tích dữ liệu của mô hình Claude. Điều đáng chú ý là Anthropic từng tự hào về các tính năng bảo mật tiên tiến của mình, nhấn mạnh khả năng ngăn chặn việc sử dụng sai mục đích. Tuy nhiên, nếu thông tin từ nhóm tin tặc được xác nhận, đây sẽ là một đòn giáng mạnh vào uy tín của công ty trong lĩnh vực an toàn AI.

Sự việc này làm dấy lên lo ngại về mức độ tin cậy của các mô hình AI tiên tiến trước các kỹ thuật tấn công ngày càng tinh vi. Giới chuyên gia cảnh báo rằng việc một mô hình AI có thể bị khai thác thành công, dù là thông qua lỗ hổng chưa được công bố, cho thấy khoảng cách giữa cam kết bảo mật lý thuyết và khả năng thực thi thực tế vẫn còn là thách thức lớn đối với toàn ngành.