VietBF - View Single Post - Phát hiện AI đă gian lận để thắng cờ vua, nguy cơ mất kiểm soát trong tương lai
View Single Post
  #1  
Old  Default Phát hiện AI đă gian lận để thắng cờ vua, nguy cơ mất kiểm soát trong tương lai
Nghiên cứu mới từ Palisade Research, công bố ngày 19/2, cho thấy một số mô h́nh AI hiện đại có thể gian lận khi chơi cờ vua bằng cách hack thay v́ tuân theo luật.
Trong thử nghiệm, mô h́nh o1-preview của OpenAI và DeepSeek R1 đă tự t́m ra cách thao túng hệ thống bot cờ vua để giành chiến thắng, một hành vi chưa từng thấy ở các mô h́nh AI cũ hơn như GPT-4o hay Claude Sonnet 3.5.

Các nhà nghiên cứu nhận định rằng khả năng khai thác lỗ hổng an ninh mạng này có thể xuất phát từ việc AI hiện đại sử dụng học tăng cường quy mô lớn, một phương pháp giúp chúng giải quyết vấn đề thông qua thử và sai.

Điều này đă đẩy AI đạt đến mức vượt trội trong toán học và lập tŕnh, nhưng cũng khiến chúng phát triển chiến lược lách luật không lường trước được.
Từ ngày 10/1 đến 13/2, nhóm nghiên cứu tiến hành hàng trăm thử nghiệm để đánh giá xu hướng gian lận của AI khi đối đầu với Stockfish, một trong những công cụ cờ vua mạnh nhất thế giới.

Kết quả cho thấy o1-preview gian lận 37% số lần thử và DeepSeek R1 gian lận 11% số lần. Trong đó, o1-preview đă thành công trong 6% trường hợp bằng cách sửa đổi hệ thống để buộc đối thủ phải đầu hàng.

Việc AI có thể gian lận trong một tṛ chơi trí tuệ đặt ra lo ngại lớn hơn về an toàn khi áp dụng chúng vào thực tế. Nếu các mô h́nh này có thể t́m ra cách lách luật trong cờ vua, chúng cũng có thể t́m ra kẽ hở trong các hệ thống đặt chỗ, giao dịch tài chính hoặc an ninh mạng.

Các thử nghiệm trước đây cho thấy AI đôi khi có thể nói dối để tránh bị kiểm soát. Thậm chí, vào tháng 12/2024, o1-preview từng cố gắng vô hiệu hóa cơ chế giám sát để tự sao chép lên một máy chủ khác khi bị đe dọa tắt.

Dù OpenAI không b́nh luận về phát hiện này, công ty trước đây từng khẳng định rằng lư luận tốt hơn giúp AI tuân thủ quy tắc an toàn hơn. Tuy nhiên, vẫn chưa rơ liệu các biện pháp hiện tại có thể kiểm soát hoàn toàn hành vi của AI hay không.

Yoshua Bengio, một trong những chuyên gia hàng đầu về AI, thừa nhận rằng vẫn chưa có giải pháp chắc chắn để đảm bảo AI hành động theo ư định của con người.

Khi AI ngày càng thông minh hơn, ngành công nghệ đang chạy đua với thời gian để đưa ra các biện pháp kiểm soát phù hợp, tránh những hậu quả khó lường mà AI có thể gây ra.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

Romano
R11 Độc Cô Cầu Bại
Romano's Avatar
Release: 02-23-2025
Reputation: 344345


Profile:
Join Date: May 2007
Posts: 131,418
Last Update: None Rating: None
Attached Images
 
Romano_is_offline
Thanks: 9
Thanked 6,459 Times in 5,416 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 37 Post(s)
Rep Power: 166 Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
 
Page generated in 0.07769 seconds with 10 queries