Mô hình AI với hiệu suất cao và giá rẻ bèo của TQ từng gây ra sốt hồi đầu năm, nhưng giờ đây không còn nhận được sự chú ý nữa.
Liệu có ai đó còn nhớ đến DeepSeek? Bạn có biết rằng,DeepSeek vừa cho cập nhật mô hình AI R1 mới của họ cách đây chỉ có vài ngày?
Sản phẩm đến từ TQ tuy vẫn còn giữ danh hiệu hoạt động tốt và rẻ hơn hầu hết các mô hình AI hàng đầu khác, nhưng có vẻ như chúng ta đã bỏ lỡ thông tin mới hoặc có thể đã đọc ở đâu đó rồi lại quên mất đi.
Bạn không hề cô độc đâu, bởi vì hầu hết ngành kỹ thuật AI và giới đầu tư đều chào đón sự ra mắt nói trên qua một cái nhún vai.

(Ảnh minh họa)
Đó là sự tương phản khá rõ nét so với hồi đầu năm 2025 khi mô hình R1 của
DeepSeek từng khiến cho dân tình thấy bàn tán xôn xao. Cổ phiếu trên thị trường chứng khoán ở Mỹ bị lao dốc thê thảm và sự bùng nổ về mức chi tiêu khổng lồ cho AI đã bị đặt một dấu hỏi nghiêm trọng.
Nhưng lần này,
"Bản cập nhật mới của DeepSeek này đã được tung ra mà không gây ra bất cứ một sự xáo trộn nào", Ross Sandler, một chuyên gia phân tích kỹ nghệ hàng đầu tại
Barclays, viết trong một bản lưu ý gửi đến giớinhà đầu tư.
"Thị trường chứng khoán không hề bận tâm", ông cho biết thêm.
"Điều này cho chúng ta biết rằng mức độ hiểu biết của cộng đồng đầu tư về giao dịch AI đã được cải thiện đáng kể chỉ trong 5 tháng ngắn ngủi vừa qua".
Trang
Business Insider đã hỏi các biên tập viên kỹ nghệ để xem họ có bỏ lỡ sự kiện mới nhất đến từ
DeepSeek chỉ vì mải mê xem Elon Musk và Donald Trump tranh cãi trên mạng xã hội hay không.
Một biên tập viên cho biết, anh không để ý đến bản cập nhật của
DeepSeek, nhưng cảm thấy khá tiếc nuối vì không biết về nó, đặc biệt khi bản thân anh đang làm trong lĩnh vực tin tức kỹ nghệ.
Một người khác nói, có nhìn thấy bài viết về chủ đề này nhưng không muốn tìm hiểu sâu thêm. Một phóng viên kỹ nghệ khác có thấy thông tin trên mạng xã hội nhưng đã lướt bỏ qua và không nghĩ gì về nó. Một phóng viên khác cho biết, anh đã bỏ lỡ hoàn toàn và một biên tập viên hờ hững khi trả lời:
"Thành thật mà nói thì tôi không hề để ý đến!"
Hóa ra, bản nâng cấp mới nhất đến từ
DeepSeek không được dư luận chú ý đến nhiều , ngay cả với những người vốn dán mắt vào tin tức kỹ nghệ từng giây phút trong ngày.
Vì sao mà DeepSeek giờ đây không có một ai quan tâm hết?
Mô hình R1 cải tiến mới nhất của
DeepSeek có lẽ là mô hình tốt thứ ba trên thế giới hiện nay, vậy thì, tại sao nó lại không tạo ra tiếng tăm vang dội như lúc trước đây?
Sandler, chuyên gia phân tích của
Barclays, lưu ý rằng, sản phẩm mới nhất của
DeepSeek đã không còn rẻ như trước nữa, xét về mặt tương đối.
Trước đây từng có giá chỉ dưới 1 USD cho một triệu token, rẻ hơn khoảng 27 lần so với mô hình o1 của
OpenAI vào đầu năm nay. Nhưng hiện tại, R1 của
DeepSeek chỉ rẻ hơn mô hình trên khoảng 17 lần, theo nghiên cứu của
Barclays và số liệu từ Chỉ số AI của
Artificial Analysis.
Điều này đã minh họa cho một kết luận tổng quát và quan trọng hơn. Hầu hết các mô hình AI hàng đầu đều có mức hiệu suất tương tự với nhau vì chúng chủ yếu được đào tạo trên cùng một nguồn dữ kiện khổng lồ từ internet.
Do đó, sẽ khó cho mô hình nào có thể trở nên nổi bật giữa đám đông chỉ dựa trên mức hiệu suất. Thậm chí, ngay cả khi đã vượt trội, những phát minh và thành quả của bạn tìm ra sẽ nhanh chóng được đưa vào sản phẩm của người khác.
Chi phí và giá cả là yếu tố quan trọng. Nhưng cách thức phân phối đang trở thành yếu tố được xem trọng hơn. Ví dụ, nếu công ty của bạn có tài khoản ChatGPT kinh doanh, bạn rất có thể sẽ sử dụng các mô hình của
OpenAI tại nơi làm việc.
Nếu bạn có điện thoại thông minh chạy Android, có thể bạn sẽ nói chuyện với chatbot
Gemini của Google và nhận được phản hồi từ các mô hình AI của gã khổng lồ tìm kiếm.
DeepSeek hiện chưa có sự phân phối rộng rãi như vậy, ít nhất là ở thế giới các quốc gia phương Tây.
Từng có nhận thức rằng các mô hình về mặt
"lý luận", chẳng hạn như
R1 của DeepSeek và o3 của OpenAI, đòi hỏi một lượng lớn sức mạnh tính toán để chạy. Nhưng điều đó đến từ khả năng chia nhỏ các yêu cầu thành nhiều bước
"suy nghĩ". Mỗi bước là một loại câu lệnh mới được chuyển thành một số lượng lớn các yêu cầu cần được xử lý nhanh chóng.
Sự bùng nổ của
DeepSeek hồi tháng 1/2025 chủ yếu là vì ngành kỹ nghệ lo ngại rằng TQ đã tìm ra các mô hình cớ mức hiệu quả cao hơn hơn mà không cần đến nhiều cơ sở hạ tầng về điện năng và điện toán.
Trên thực tế, công ty TQ này chỉ giúp phổ biến loại mô hình lý luận mới, vốn đòi hỏi nhiều GPU và thiết bị điện toán để chạy hơn. Và có tin đồn cho thấy DeepSeek này đã tìm cách lấy cắp trái phép nguồn số liệu của các chatbot khác để tạo ra mô hình riêng của mình, một hành vi đáng bị lên án và tẩy chay!