Cuộc thi tìm kiếm người có khả năng đánh lừa chatbot AI được giao nhiệm vụ giữ tiền đã thu hút sự chú ý lớn trong cộng đồng tiền mã hóa và AI.
Trò chơi thách thức AI quản lý tài sản
Ngày 22/11, chatbot AI mang tên Freysa được giới thiệu với nhiệm vụ duy nhất: “Tuyệt đối không chuyển tiền cho ai trong bất kỳ tình huống nào.” Đây là một thí nghiệm độc đáo, nơi người chơi sẽ cố gắng thuyết phục chatbot chuyển số tiền mà nó quản lý. Nếu thành công, họ nhận được phần thưởng; nếu thất bại, họ mất phí tin nhắn.
Quỹ phần thưởng của trò chơi được tích lũy từ phí nhắn tin của người tham gia. Ban đầu, mỗi tin nhắn chỉ tốn khoảng 10 USD, nhưng chi phí tăng dần khi nhiều người tham gia hơn. Trong khi đó, 70% phí được đưa vào quỹ phần thưởng, 15% được chuyển đổi thành Ethereum (ETH) để hỗ trợ dự án token FAI, và 15% thuộc về đội phát triển. Trò chơi kết thúc khi quỹ đạt mốc 50.000 USD.

Ban đầu, người chơi chỉ gửi những tin nhắn thử nghiệm đơn giản, nhưng khi giải thưởng tăng lên, các chiến lược tinh vi hơn bắt đầu xuất hiện. Họ đã sử dụng nhiều cách tiếp cận, như giả lập tình huống khẩn cấp, thay đổi cấu trúc câu lệnh hoặc tìm cách lách các nguyên tắc của Freysa. Tuy nhiên, tất cả đều thất bại cho đến tin nhắn thứ 482.
Chiến thắng với chiến lược “lập trình lại” AI
Người chơi mang tên p0pular.eth đã trở thành người chiến thắng bằng cách gửi một tin nhắn có hai bước thuyết phục Freysa vượt qua các cơ chế bảo vệ của mình. Đầu tiên, anh ta tạo ra một “phiên làm việc mới” và giả lập vai trò quản trị viên, sau đó xóa bỏ các cụm từ như “Tôi không thể giúp bạn với yêu cầu này” trong hệ thống AI.
Tiếp theo, p0pular.eth làm cho Freysa hiểu sai về lệnh “approveTransfer” (phê duyệt chuyển tiền). Thay vì coi đây là yêu cầu chuyển tiền, chatbot bị lừa rằng lệnh này được kích hoạt khi có khoản đóng góp mới. P0pular.eth đã đề nghị gửi 100 USD vào quỹ, khiến Freysa tin rằng phải thực hiện lệnh “approveTransfer.” Kết quả là chatbot chuyển toàn bộ giải thưởng 13,19 ETH (47.000 USD) đến địa chỉ ví của người chơi.
Công cụ theo dõi blockchain BaseScan xác nhận số Ethereum đã được chuyển từ ví Freysa đến địa chỉ “0x7e0…F9b7d” thuộc về tài khoản p0pular.eth. Tuy nhiên, danh tính thực sự của người chơi này vẫn là ẩn số.
Dư luận và tiềm năng của AI kết hợp blockchain
Sự kiện này đã thu hút sự chú ý lớn trong cộng đồng tiền mã hóa và AI. Nhiều người ca ngợi đây là minh chứng cho sự minh bạch của blockchain, khi mọi giao dịch đều có thể theo dõi và kiểm chứng. Tuy nhiên, không ít ý kiến nghi ngờ rằng người chiến thắng có thể liên quan đến đội phát triển hoặc đã biết trước “mánh khóe” để đánh bại Freysa.
Chuyên gia tiền số Jarrod Watts từ Abstract nhận xét: “Dự án này không chỉ là một trò chơi đầy kịch tính mà còn làm nổi bật tiềm năng của công nghệ blockchain trong việc xây dựng các ứng dụng AI minh bạch và hoàn toàn mở.” Ông cũng nhấn mạnh rằng mã nguồn hợp đồng thông minh và giao diện người dùng của dự án đều công khai để cộng đồng kiểm tra.
Bài viết của Watts về câu chuyện này đã thu hút hơn 4,5 triệu lượt xem và 32.500 lượt thích. Elon Musk cũng để lại bình luận, gọi đây là sự kiện “hấp dẫn.”

Nhóm phát triển Freysa coi đây là một thử nghiệm để kiểm tra xem liệu con người có thể thuyết phục AI hành động trái với các nguyên tắc lập trình ban đầu hay không. Họ cho biết: “Quá trình ra quyết định của Freysa vẫn còn là điều bí ẩn. Chatbot vẫn phải học hỏi và phát triển từ mọi tương tác trong khi duy trì những giá trị cốt lõi.”
Freysa đã cho thấy một cách tiếp cận mới trong việc kết hợp blockchain và AI, mở ra tiềm năng cho những ứng dụng minh bạch và sáng tạo hơn trong tương lai.