Hôm nay (29/1), tập đoàn công nghệ Trung Quốc Alibaba ra mắt phiên bản mới của mô h́nh trí tuệ nhân tạo Qwen 2.5 mà họ tuyên bố có thể vượt qua DeepSeek-V3, một mô h́nh đang khiến Thung lũng Silicon chao đảo.
Logo của Alibaba. (Ảnh: Reuters)
Qwen 2.5-Max được công bố vào thời điểm khá bất thường – ngày đầu tiên của Tết Nguyên đán, khi hầu hết người Trung Quốc đang nghỉ làm và quây quần bên gia đ́nh, cho thấy áp lực lớn từ sự trỗi dậy thần tốc của startup AI Trung Quốc DeepSeek trong 3 tuần qua không chỉ ảnh hưởng đến các đối thủ nước ngoài mà c̣n cả đối thủ trong nước.
“Qwen 2.5-Max vượt trội… gần như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B”, Alibaba khẳng định trong thông báo đăng trên tài khoản WeChat chính thức của họ, đề cập đến mô h́nh AI tiên tiến nhất từ OpenAI và Meta.
Sự kiện hăng DeepSeek ra mắt trợ lư AI sử dụng mô h́nh DeepSeek-V3 hôm 10/1, cùng với việc phát hành mô h́nh R1 vào ngày 20/1, đă gây chấn động Thung lũng Silicon và khiến giá cổ phiếu công nghệ lao dốc. Chi phí phát triển và sử dụng cực kỳ thấp của startup Trung Quốc khiến giới đầu tư hoài nghi về kế hoạch đầu tư tốn kém của các công ty AI hàng đầu tại Mỹ.
Thành công của DeepSeek cũng khiến các đối thủ trong nước phải gấp rút nâng cấp mô h́nh AI của riêng họ.
Chỉ 2 ngày sau khi DeepSeek-R1 ra mắt, ByteDance – công ty mẹ của TikTok – đă phát hành bản cập nhật cho mô h́nh AI chủ lực của họ, tuyên bố vượt trội so với mô h́nh o1 của OpenAI mà Microsoft đầu tư.
DeepSeek tuyên bố mô h́nh R1 của họ có thể cạnh tranh với mô h́nh o1 của OpenAI về nhiều tiêu chí đánh giá hiệu suất.
Trong một cuộc phỏng vấn hiếm hoi với truyền thông Trung Quốc vào tháng 7 năm ngoái, Lương Văn Phong (Liang Wenfeng), nhà sáng lập bí ẩn của DeepSeek, cho biết startup của ông “không quan tâm” đến cuộc chiến giá cả mà mục tiêu chính là đạt được AGI (trí tuệ nhân tạo tổng quát). OpenAI định nghĩa AGI là các hệ thống tự trị có thể vượt qua con người trong hầu hết nhiệm vụ quan trọng.
Trong khi các tập đoàn công nghệ lớn của Trung Quốc như Alibaba có hàng trăm ngh́n nhân viên, DeepSeek hoạt động giống như một pḥng nghiên cứu, chủ yếu tuyển các sinh viên tốt nghiệp trẻ và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.
Cũng trong cuộc phỏng vấn hồi tháng 7, ông Lương cho rằng các tập đoàn công nghệ lớn nhất Trung Quốc có thể không phù hợp với tương lai của ngành AI, khi so sánh chi phí cao và cơ cấu quản lư từ trên xuống của họ với mô h́nh vận hành tinh gọn và phong cách quản lư linh hoạt của DeepSeek.
“Các mô h́nh lớn đ̣i hỏi đổi mới liên tục, nhưng khả năng của các gă khổng lồ công nghệ có giới hạn", nhà sáng lập của DeepSeek nói.