Thành công của DeepSeek và mô hình AI mới càng khiến cho cộng đồng AI đặt câu hỏi về tính hiệu quả trong ngân sách dành cho nghiên cứu AI của Thung lũng Silicon, California, Mỹ
Trong thời gian gần đây, startup
AI DeepSeek đã gây ra sóng gió khi giới thiệu úng dụng R1, một mô hình AI có hiệu năng tương đương của ChatGPT và những hệ thống đắt đỏ khác với chi phí huấn luyện chỉ bằng một phần nhỏ bé so với mức tốn kém điển hình ở Thung lũng Silicon (Mỹ). Điều này đã trở thành hiện thực nhờ vào hàng loạt đột phá về khả năng tối ưu hóa phần cứng cũng như phần mềm để giúp việc huấn luyện cũng như vận hành trở nên tiết kiệm hơn, rẻ tiền hơn.
Nhưng một nhóm các chuyên gia nghiên cứu tại Đại học ở Berkeley, California, cho biết, họ có thể thực hiện điều đó với một giá rẻ hơn nữa: chỉ với 30 USD. Dưới sự dẫn dắt của nghiên cứu sinh Jiayi Pan, các chuyên gia đã cho sao chép thành công kỹ thuật cốt lõi của
DeepSeek để tạo ra một phiên bản với quy mô nhỏ hơn, được gọi là
"TinyZero", và cho công bố trên
GitHub, một nguồn mã mở rộng và miễn phí để cho thử nghiệm công khai.
Dù chỉ có sở hữu quy mô khiêm tốn so với mô hình tham số gốc 671 tỷ,
TinyZero được cho là mô phỏng chính xác kỹ thuật cốt lõi của
DeepSeek nhờ phương pháp
"học tăng cường" (reinforcement learning).
Mô hình TinyZero được hình thành dựa trên kỹ thuật cốt lõi của DeepSeek với chi phí siêu rẻ
Cách tiếp cận của nghiên cứu sinh Pan tập trung vào
"học tăng cường" (reinforcement learning), một kỹ thuật mà trong đó AI, bắt đầu với những sự phỏng đoán gần như ngẫu nhiên, dần dần cho chỉnh sửa lại câu trả lời bằng cách sửa đổi và tìm kiếm các giải pháp khả thi. Trong một bài đăng mô tả về dự án này, anh đã nêu bật trò chơi
Countdown, một câu đố truyền hình của Anh nơi mà người chơi kết hợp các con số đã được đưa ra, nhằm đạt được giá trị mục tiêu.
"Sau nhiều lần được thử và gặp sai sót, nó tự sửa lỗi và đạt được đáp án đúng", Pan chia sẻ thêm.
Thành công của
TinyZero đặt ra câu hỏi lớn: Tại sao các tập đoàn như
OpenAI hay
Google lại bỏ ra hàng tỷ USD cho AI trong khi một nhóm nghiên cứu nhỏ có thể đạt kết quả tương tự với ngân sách như
"hạt dẻ"?
DeepSeek từng gây ra sốc khi tuyên bố chi phí đào tạo mô hình R1 chỉ tốn có vài triệu USD, nhưng
TinyZero còn đi xa hơn: chỉ tốn 30 USD cho phiên bản thu nhỏ nói trên.
Dù có quy mô tham số nhỏ hơn, TinyZero cũng tái tạo được khả năng của DeepSeek khi xử lý các thao tác
Các con số này đi ngược lại quan niệm thông thường cho rằng, những bước đột phá lớn trong AI đòi hỏi hệ thống trung tâm số liệu to lớn, GPU ngốn nhiều điện năng, và hàng triệu thậm chí phải chi tiêu đến hàng tỷ USD để vận hành.
Tuy nhiên, nhiều ý kiến vẫn tỏ ra hoài nghi. Họ cho rằng, con số mà
DeepSeek công bố ra chưa phản ảnh toàn bộ sự thật, vì có khả năng công ty khởi nghiệp này đang hưởng lợi từ các nguồn lực hay kỹ thuật khác được giữ kín. Dù
TinyZero là minh chứng cho việc
học tăng cường hiệu quả có thể được triển khai với ngân sách eo hẹp, nó không hoàn toàn tương xứng để so sánh năng lực với
DeepSeek.
TinyZero giống một phiên bản mẫu, đơn giản hóa hơn là mội đối trọng thực sự.
Dù vậy, thí nghiệm của UC Berkeley hé lộ một xu hướng mới: AI mã nguồn mở và tiết kiệm tài nguyên. Nếu các chuyên gia nghiên cứu độc lập có thể tạo ra kỹ thuật tương tự với ngân sách hạn chế, áp lực cạnh tranh lên các tập đoàn kỹ nghệ là không nhỏ.
"TinyZero cho thấy sự sáng tạo không nhất thiết là phải đắt đỏ, tốn kém quá cao. Một người sinh viên tài ba xuất sắc hoặc một startup nhỏ cũng có thể làm nên điều khác biệt", một chuyên gia phân tích đưa ra nhận định.
Thành công của
TinyZero và
DeepSeek R1 cho thấy nhu cầu ngày càng lớn đối với các mô hình AI gọn nhẹ, giúp tiết kiệm nguồn năng lượng. Điều này mở ra cánh cửa cho những quốc gia hoặc tổ chức thiếu thốn ngân sách để tiếp cận kỹ thuật cao, đồng thời thúc đẩy sự cạnh tranh trong ngành. Tuy nhiên, thách thức vẫn còn tồn tại. Các mô hình quy mô nhỏ như
TinyZero dù có tạo ra ấn tượng lớn nhỏ, nhưng chưa thể xử lý nhiều chức năng phức tạp như phiên bản đầy đủ. Hơn nữa, việc sao chép kỹ thuật có thể dẫn đến rủi ro về tranh chấp bản quyền và chất lượng.
Theo nhóm nghiên cứu ở UC Berkeley, mục tiêu của họ là
"giải mã xu hướng mở rộng AI dựa trên nền học tăng cường" và khuyến khích mọi người cùng hợp tác tham gia. Với làn sóng quan tâm từ khắp thế giới,
TinyZero đã chứng minh rằng cuộc cách mạng AI không chỉ thuộc về những ai có ví tiền dày cộm, mà còn mở ra cho những ý tưởng táo bạo và sáng tạo không biên giới. Liệu đây có phải bước khởi đầu cho
kỷ nguyên AI "bình dân"? Câu trả lời phụ thuộc vào cách thức mà ngành kỹ nghệ mới mẽ này sẽ thích ứng với làn sóng mới ra sao.