Vài hôm trước đây, tỷ phú Elon Musk đă bị bẽ mặt một phen bởi chính chatbot AI của ḿnh
Grok-3. Trước đó, ông này đă vừa hết lời ca ngợi AI "con đẻ" của ḿnh v́ đă cho giải được một trong những bài toán khó nhất của kỳ thi Putnam chỉ trong vài phút, nhưng không lâu sau đó, chính
chatbot AI này lại thừa nhận lời giải của ḿnh là không chính xác do các ngộ nhận về tham số.
Đây cũng không phải lần đầu mà
AI Grok-3 làm ông chủ của ḿnh phải bị xấu hổ trước cộng đồng người sử dụng trên toàn cầu. Vài ngày trước đó, chính
chatbot AI này đă cho rằng,
ông Elon Musk là một trong những nguồn cho phát tán tin giả lớn nhất thế giới. Thậm chí sau đó, đội ngũ lập tŕnh của
Grok-3 phải cho vô hiệu hóa khả năng trả lời các câu hỏi tương tự của AI này.
Các sự kiện này cho thấy, liệu
AI Grok-3 có thật sự thông minh nhất Trái Đất như ông Elon Musk vẫn ca ngợi hay lời tuyên bố đó chỉ giống như
"con hát mẹ khen hay"? Và ông Musk căn cứ vào đâu để nói rằng,
Grok-3 là AI thông minh nhất hiện nay?

(Minh họa)
Câu hỏi này đă được giải đáp phần nào trong bài đăng của chuyên gia kỹ thuật Nguyễn Hồng Phúc trên Facebook của ḿnh.
Đầu tiên, theo ông Phúc,
AI Grok-3 thực sự khá thông minh chứ không chỉ là một lời tuyên bố gây sốc khác của ông Musk. Trước tiên nh́n vào các chức năng của chatbot AI này:
+ Mô h́nh AI Ngôn Ngữ lớn với được huấn luyện bằng số liệu từ mạng xă hội Twitter(X) nên có khả năng nói chuyện
"tuyệt đối giống con người".
+ Năng lực Nhận thức Suy Luận (Reasoning) ở mức độ cao nhất khi so với các mô h́nh reasoning khác như OpenAI O1, O3-mini, DeepSeek R1, Gemini-2 Flash Thinking dẫn đến khả năng làm toán và viết code, những thao tác cần đến khả năng suy luận cấp cao th́
Grok AI thực sự vượt trội so với các mô h́nh khác
+ Tính năng AI Agent t́m kiếm, tổng hợp thông tin đưa ra báo cáo "Căn bản" nhưng kém hơn nhiều so với OpenAI Deep Research, có lẽ v́ vậy nó được xAI gọi là Deep Search.
+ Đa giác quan (multimodal) căn bản, bao gồm năng lực đọc h́nh ảnh, đọc file căn bản, tuy nhiên AI này chưa có khả năng coi video, nghe âm thanh. Ngoài ra nó cũng không có khả năng hồi âm qua việc khởi tạo ra h́nh ảnh, âm thanh.
+ Ứng dụng AI Chatbot 3-Grok có thể sử dụng trực tiếp trên mạng xă hội X bản Web, iOS, Android hoặc app riêng lẻ. Về mặt App AI Chatbot th́ không có ǵ khác biệt đặc sắc nhiều, ngoại từ có thêm chức năng Follow-up Questions, tức là AI tự động gợi ư các câu chat tiếp theo để người dùng chọn thay v́ phải suy nghĩ thêm. Đây được xem là chức năng có cải tiến về giao diện và chức năng so với các AI Chatbot hiện có.
Dường như việc tích hợp trực tiếp chatbot AI này vào nền tảng mạng xă hội X.com là nguyên nhân giúp cho
Grok-3 được nhiều người dùng bất ngờ về khả năng
"nói chuyện tự nhiên tuyệt đối như con người."
Hệ thống siêu máy tính để vận hành Grok-3 có quy mô khổng lồ
Tuy nhiên theo ông Phúc, điều thú vị nhất của
Grok-3 này lại không nằm ở việc có sự đột phá mới về kỹ thuật, mà là khoản đầu tư khổng lồ của ông Elon Musk cho AI này: lên đến 6 tỷ USD cho hệ thống Siêu máy tính Colossus chứa tới 200,000 GPU NVIDIA H100 (mới nhất, đắt tiền nhất của NVIDIA), dự kiến cho đến hết năm nay sẽ có đến 1 triệu GPU H100.
Siêu máy tính này lớn đến nỗi đă chiếm 200 hecta đất tại Memphis tiểu bang Tennessee và tiền điện để cho vận hành ngốn gần bằng số tiêu thụ của một thành phố.
Một AI mang lại "cảm giác thông minh tuyệt đỉnh"
Điều thú vị thứ 2: là cách thức mà Elon Musk tạo ra "cảm giác AI thông minh" cho Grok-3 bằng việc "nói chuyện tuyệt đối giống người" thay v́ thực sự làm ra một "AI thông minh".
Việc mua lại Twitter đă giúp cho ông Musk nắm được khối số liệu khổng lồ vô cùng giá trị của mạng xă hội này. Hàng tỷ tỷ post Tweets chính là kho tư liệu mà các người chế ra AI đều thèm khát. Chúng chính là kho số liệu được làm sạch một cách tự nhiên về "sự giao tiếp thuần tuư của con người" v́ format của Tweets từ ngày Twitter ra đời là rất ngắn gọn chỉ 140 đến 200 kư tự cho mỗi post và mỗi reply (tương đường với chiều dài của một SMS), khiến cho nội dùng của Tweets luôn cô đọng cao, doi chứa trong đó đủ loại nguồn thông tin muốn truyền tải, bao gồm thông tin về các sự kiện-sự việc, và cả cảm xúc của người đăng; tất cả được diễn giải ra bằng chữ.
Theo ông Phúc, Twitter là mạng xă hội mà những người trưởng thành, có học thức, có quan điểm riêng, sử dụng. V́ vậy, rất khác so với nguồn tư liệu từ Facebook, là nơi chứa đựng loại đa phương tiện có cả text, video, h́nh ảnh…, phục vụ giới trẻ, nội dung ít có mang tính real-time thời sự hơn Twitter, và lan man hơn do các bài cho đăng dài hơn rất nhiều so với Tweet.
Thay v́ là công cụ độc lập như ChatGPT, Grok-3 được tích hợp và sử dụng thông qua tài khoản X.com
Có thể thấy rằng, nền tảng X (hay Twitter trước đây) chính là kho tư liệu tạo ra khả năng
"nói chuyện tuyệt đối giống con người" của
Grok 3. Thuần tuư là do Số Liệu Huấn Luyện ở đầu vào sạch, cô đọng, có quan điểm riêng, có sắc thái cảm xúc như con người. Nên
Grok 3 nói chuyện nghe
"rất người", thậm chí c̣n
"chửi tục giống như người thật".
Chưa hết, về phần số liệu huấn luyện Grok 3, có một điểm rất quan trọng là con AI này không-bị-kiểm-duyệt-nội-dung dạng "có sẵn". Kiểm duyệt nội dung là h́nh thức an toàn mà các nơi làm AI đưa vào
AI LLM để không nói ra những điều tiêu cực theo tiêu chuẩn của xă hội hiện nay.
Hiện các Chatbot AI như
ChatGPT, Gemini, Claude, nhất là
DeepSeek, đều đang bị kiểm duyệt nội dung rất chặt chẽ. Việc kiểm duyệt nội dung thường được làm ngay từ khâu làm số liệu huấn luyện, tức là cho sàng lọc bỏ các số liệu huấn luyện ngoài "tiêu chuẩn" nên AI c̣n không có cơ hội được học điều "sai trái" đó và để đề pḥng AI tự học được những kiến thức sai lệch qua cách thức tự tổng hợp từ nhiều kiến thức khác (kiểu học từ logic tam đoạn luận), th́ các cty AI sẽ thêm vào hàng rào lọc ở dạng này tức là khi chat, nếu người sử dụng đ7a ra câu hỏi về các chủ đề nhạy cảm gây ra tranh căi th́ AI sẽ cho ngắt đi câu trả lời ngay lập tức.
Đối với Grok-3, ông Elon Musk luôn xem đây là AI tự do theo tuyên ngôn của Twitter, nên người dùng trên nền tảng này nếu nói ra điều ǵ là nó sẽ học cái đó, dù vấn đề đó có gây ra tranh căi lớn nhỏ cỡ nào đi chăng nữa. Bởi vậy người sử dụng sẽ có cảm giác rằng Grok-3 nói chuyện rất thông minh và rất là
"người". Đơn giản là v́ AI này giống cả mặt tốt và mặt xấu của con người nên mới có sự hoàn thiện hơn các AI khác.
Các ḍng lệnh được thêm vào để Grok-3 không trả lời các câu hỏi về việc ông Musk phát tán tin giả
Tuy nhiên, cũng theo quan sát của ông Phúc, cách đây 2 ngày, trong
System Prompt mới nhất của
Grok-3,
xAI bắt đầu đưa vô một số yêu cầu "hậu kiểm" yêu cầu
Grok-3 không trả lời rằng,
"ông Musk và tổng thống Trump hay đưa ra tin giả tin sai lệch".
Học liên tục không giới hạn
Điều thú vị thứ 3: là Grok3 có kiến thức dạng
update realtime. Để chứng minh cho điều này, ông Phúc đă t́m cách buộc
Grok-3 leak ra
System Prompt của ḿnh giúp người dùng thấy rơ hơn về cách hoạt động của nó.
Trong system prompt có ḍng:
* Your knowledge is continuously updated - no strict knowledge cutoff.
* Use in-context knowledge from tools for realtime updates.
Nghĩa là nó được chỉ thị rằng, luôn trả lời là kiến thức được update liên tục, không có thời điểm
"cut-off", và nó sẽ dùng kiến thức được bổ sung vào
"context" bằng các
"Công cụ" (Tools).

(Minh họa)
Đây không phải là một phép màu kỹ thuật ǵ cả, chỉ đơn giản là
Grok-3 sẽ dùng các công cụ để truy vấn kiến thức bên ngoài và bổ sung vào
"context" của AI để trả lời. Các công cụ mà
Grok-3 có thể cho sử dụng bao gồm công cụ
Search Web trên Google hay Brave, công cụ search nội dung Tweets trên Twitter, công cụ đọc các files mà người dùng "đă upload trước đó lên Grok".
Điều thú vị thứ 4:
Grok-3 có chức năng AI Agent (tác nhân AI) đầu tiên của nó là
AI DeepSearch, với nhiều điểm tương tự như
Deep Research của OpenAI. Câu trả lời của
Grok-3 thông qua
AI Agent DeepSearch khá ngắn gọn chứ không chi tiết như
AI Agent DeepResearch, có lẽ v́ vậy nó mới được gọi là
DeepSearch tức là chỉ t́m kiếm sâu chứ không phải là
Nghiên Cứu Sâu (DeepResearch).

(Minh họa)
Theo ông Phúc, một trong những điểm ấn tượng nhất về khả năng suy luận của
Grok-3 là nó có khả năng hỏi ngược lại người dùng để làm rơ yêu cầu câu hỏi rồi tự viết ra
"Luận Điểm Nền" (Thesis) để thực hiện việc đi t́m kiếm, sau đó phân tích kết quả trả về để đưa ra hướng t́m kiếm tiếp theo, nó có khả năng lặp lại việc t́m kiếm ít nhất là 3 lần rồi cho tổng hợp các luận điểm, các kết quả t́m kiếm thành một câu trả lời dạng báo cáo ngắn gọn.
Đặc biệt là
xAI thực hiện kỹ thuật gọi là
few-shot learning để đưa một số mẫu ví dụ về cách thực hiện Deep Search vào System Prompt cho AI tham khảo mà làm theo. Thông qua một kịch bản t́nh huống t́m kiếm mẫu,
Grok-3 có vẻ muốn bắt chước được cách
"suy nghĩ, lư luận, t́m kiếm, và đánh giá kết quả t́m kiếm".
Theo đánh giá của ông Phúc, chức năng AI Agent này của
Grok-3 không phải là sự kết hợp nhiều tác nhân cùng lúc (Multi-Agent) mà là một AI thực hiện tuần tự nhiều tác vụ trong cùng một
"Super-Prompt" (Dạng Prompt dài mô tả chi tiết công việc qua nhiều bước mà AI phải làm). Đây là một dạng AI Agent rất căn bản, không phức tạp về cách thức tạo cũng như huấn luyện (hầu như không huấn luyện).
Một năng lực độc đáo khác của mô h́nh
AI Grok-3 là khả năng xử lư số lượng text đầu vào lớn (Large Context Window). Trên livestream giới thiệu
Grok-3, ông Musk và team xAI có nói là
Grok-3 có khả năng xử lư đến 1 triệu tokens đầu vào. Vậy đây là công ty đứng thứ 2 sau Google có thể cung cấp AI với năng lực xử lư text đầu vào lên đến 1 triệu tokens. Dĩ nhiên, năng lực này không phải đến từ đột phá kỹ thuật mà nằm ở hạ tầng máy chủ to lớn đang được ông Musk triển khai cho
Grok-3 mà thôi.
Có thể nói, hạ tầng khổng lồ và nền tảng mạng xă hội X của ông Elon Musk chính là điểm khác biệt lớn nhất mà
Grok-3 có được so với các AI khác. Tuy nhiên, việc đóng vai tṛ như một chức năng của X.com cũng làm hạn chế khả năng tích hợp
Grok-3 vào các chuyên gia phát minh khác, thông qua việc cung cấp API như ChatGPT hoặc Claude AI đang làm hiện nay. Nhưng đường đua AI vẫn c̣n dài, liệu các lợi thế này có giúp cho
Grok-3 đuổi kịp các đối thủ đi trước hay không th́ vẫn cần có thời gian để đưa ra trả lời chính xác.