Nếu hỏi AI về các vấn đề tim mạch bằng tiếng Việt, bạn có thể nhận được lời khuyên về bệnh Parkinson. Đây là một trong những phát hiện bất ngờ từ công tŕnh khoa học do các nghiên cứu viên Đại học RMIT Việt Nam dẫn đầu, mới được công bố trên Tạp chí Y khoa Anh quốc (BMJ).
Nghiên cứu “Thông tin sức khỏe cho mọi người: Các mô h́nh ngôn ngữ lớn đang thu hẹp hay nới rộng khoảng cách số?” hướng sự chú ư đến một vấn đề nổi trội trong tương lai ứng dụng AI của ngành y tế. Mặc dù các mô h́nh ngôn ngữ lớn (Large Language Models - LLM) như ChatGPT hứa hẹn cho phép truy cập thông tin sức khỏe 24/7, nhóm nghiên cứu phát hiện ra rằng các mô h́nh này có thể đưa ra thông tin không chính xác hoặc gây hiểu lầm khi dùng ngôn ngữ có nguồn tài nguyên kỹ thuật số hạn chế.
Theo Statista, hơn 80% toàn bộ nội dung trên mạng được viết bằng tám ngôn ngữ chính. Tuy nhiên, tám ngôn ngữ này lại chỉ đại diện cho 21% dân số thế giới, đồng nghĩa với việc phần lớn dân số toàn cầu có thể phải nhận thông tin sai lệch do AI tạo ra.
Tiến sĩ Arthur Tang, tác giả chính của nghiên cứu đến từ Đại học RMIT Việt Nam, cho biết: "Chúng tôi nhận thấy rằng LLM hiệu quả với những ngôn ngữ có nhiều tài nguyên như tiếng Anh, nhưng lại thường gặp khó khăn về độ chính xác ngôn ngữ và tính xác thực thông tin khi dùng các ngôn ngữ có ít tài nguyên như tiếng Việt. Những khu vực sử dụng ngôn ngữ có ít tài nguyên cũng thường có điều kiện kinh tế khó khăn hơn. Điều đó có nghĩa là trạng thái hiện tại của những tiến bộ công nghệ như LLM có thể khiến chênh lệch về mặt xă hội và kinh tế sâu sắc hơn".Nghiên cứu trên là kết quả hợp tác quốc tế giữa các nghiên cứu viên đến từ Đại học RMIT Việt Nam, Đơn vị nghiên cứu lâm sàng Đại học Oxford (OUCRU), Đại học Trung văn Hồng Kông, Đại học Quốc gia Singapore và Đại học Melbourne. Đáng chú ư là nghiên cứu c̣n có sự tham gia của hai sinh viên theo học chương tŕnh cử nhân ở RMIT Việt Nam (hiện đă tốt nghiệp) với tư cách đồng tác giả.
Các sinh viên đă nhận được hỗ trợ kỹ thuật và các nguồn lực điện toán thiết yếu từ trung tâm RMIT RACE Hub. RMIT RACE Hub cũng nâng cao trải nghiệm học tập của sinh viên bằng cách cho họ tiếp cận các thiết bị nghiên cứu tiên tiến.
Nguyễn Quỳnh Giang, sinh viên mới tốt nghiệp ngành Cử nhân Công nghệ thông tin cho biết: "Quá tŕnh thực hiện nghiên cứu đă cho tôi mở rộng tầm mắt về những tác động thực tế của AI trong lĩnh vực y tế. Lư tưởng nhất là AI sẽ đem đến quyền tiếp cận các dịch vụ và thông tin y tế một cách b́nh đẳng, nhưng hiện vẫn c̣n một số rào cản cho đến khi chúng ta đạt đến độ trưởng thành công nghệ như vậy".
Bùi Minh Nhật, đă hoàn tất bằng Kỹ sư (Kỹ thuật Phần mềm) tại RMIT Việt Nam và hiện đang học Thạc sĩ Trí tuệ nhân tạo tại Đại học RMIT ở Melbourne, chia sẻ về ư nghĩa thực tiễn của công tŕnh: "Nghiên cứu của chúng tôi cho thấy việc đơn giản như hỏi về các triệu chứng bệnh tim bằng tiếng Việt có thể cho đáp án là thông tin về một căn bệnh không liên quan như Parkinson. Điều này phản ánh yêu cầu cấp thiết phải phát triển các hệ thống AI bao trùm hơn, phục vụ cho mọi ngôn ngữ và nền văn hóa".
Nhóm nghiên cứu nhấn mạnh rằng giải quyết vấn đề này đ̣i hỏi sáng kiến đa ngành từ các nhà hoạch định chính sách, các đơn vị tài trợ nghiên cứu, các công ty công nghệ lớn, cộng đồng nghiên cứu, các chuyên gia y tế và những cộng đồng có sự hiện diện thấp về mặt ngôn ngữ.
Các đơn vị tài trợ đóng vai tṛ then chốt trong việc mở rộng hỗ trợ cho tính bao trùm về ngôn ngữ AI. Một ví dụ là chương tŕnh Grand Challenges 2023 (Thử thách lớn 2023) của Quỹ Bill & Melinda Gates. Chương tŕnh này đă tài trợ cho các dự án phát triển toàn cầu nhằm góp phần vào quyền tiếp cận AI công bằng.
Các tập đoàn công nghệ lớn cũng đóng vai tṛ quan trọng. Ví dụ, dự án No Language Left Behind (Không ngôn ngữ nào bị bỏ lại phía sau) của Meta hướng tới nâng cao khả năng dịch nhiều ngôn ngữ khác nhau cho AI.
Nghiên cứu của Tiến sĩ Arthur Tang và đồng nghiệp cũng nêu rơ rằng cộng đồng nghiên cứu nên dẫn dắt các sáng kiến về dữ liệu ngôn ngữ cũng như các mô h́nh và công cụ nguồn mở, vốn rất cần thiết cho đào tạo và nghiên cứu LLM.
Tiến sĩ Tang chia sẻ: “Tại RMIT, chúng tôi tham gia sâu vào nhiều dự án ứng dụng LLM trong các cơ sở y tế. Nỗ lực của chúng tôi không chỉ tập trung vào việc vượt qua thách thức về công nghệ mà c̣n hướng tới nâng cao tính bao trùm của công nghệ này đối với tiếng Việt. Mục đích là đảm bảo rằng mọi người dân Việt Nam đều có cơ hội hưởng lợi từ những tiến bộ công nghệ gần đây”.Tiến sĩ Tang đặc biệt tự hào về sự tham gia của các sinh viên vào công tŕnh nghiên cứu và tiết lộ rằng dự án này bắt nguồn từ một dự án cuối khóa thuộc bậc đại học vào năm ngoái.
“Tạp chí Y khoa Anh quốc là một trong những tạp chí lâu đời và uy tín nhất trong ngành y đa khoa. Tỉ lệ chấp nhận đăng bài của tạp chí này chỉ khoảng 7% tính trên 7.000-8.000 bài nộp mỗi năm. V́ vậy, đây thực sự là một thành tựu xuất sắc đối với các đồng tác giả là sinh viên”, ông cho biết.
"Sinh viên RMIT trau dồi kinh nghiệm thực tế với những công nghệ AI đang định h́nh lại các ngành nghề trên toàn thế giới. Điều này giúp các bạn chuẩn bị để trở thành những người dẫn đầu trong việc áp dụng AI một cách có đạo đức và hiệu quả trong sự nghiệp tương lai”.
|