Theo một nghiên cứu gần đây vừa được công bố trên JAMA Pediatrics, phiên bản ChatGPT chẩn đoán sai phần lớn (83/100) trường hợp nhi khoa.
Theo các tác giả của nghiên cứu, 72 chẩn đoán sai là hoàn toàn sai và 11 chẩn đoán sai có liên quan đến lâm sàng nhưng quá rộng để được coi là chẩn đoán chính xác. Lưu ư phiên bản thử nghiệm là ChatGPT 3.5.
Nghiên cứu nói trên nhấn mạnh tầm quan trọng việc giám sát của bác sĩ khi triển khai các công cụ AI và mô h́nh ngôn ngữ lớn (LLM) trong y học lâm sàng. Các công cụ AI chỉ mới bắt đầu được phát triển và cần nhiều thời gian để nghiên cứu trước khi trở thành công cụ chủ đạo trong việc chăm sóc sức khỏe.
ChatGPT chẩn đoán sai phần lớn các trường hợp nhi khoa.
Các giải thích y tế thường có nhiều sắc thái và đ̣i hỏi sự hiểu biết theo ngữ cảnh của nhiều yếu tố khác nhau. Ví dụ, khi các bác sĩ X quang đang giải thích kết quả chụp CT ở chân, họ có thể phát hiện thấy t́nh trạng phù dưới da ở bắp chân. Phát hiện này không đặc hiệu và có thể được thấy trong bối cảnh của nhiều chẩn đoán, bao gồm viêm mô tế bào, nhiễm trùng do chấn thương và bệnh mạch máu do suy tim.
Các bác sĩ dựa vào thông tin tổng hợp từ bệnh sử của bệnh nhân để đưa ra chẩn đoán cuối cùng. Trong t́nh huống trên, nếu bệnh nhân bị sốt th́ chẩn đoán có thể là viêm mô tế bào, nhưng nếu bệnh nhân bị tai nạn xe cơ giới th́ phù dưới da có thể là do nhiễm trùng.
Việc chẩn đoán chính xác trong các trường hợp nhi khoa không chỉ yêu cầu nhận dạng các triệu chứng mà c̣n phải xem xét độ tuổi của bệnh nhân và thông tin bệnh nhân theo ngữ cảnh bổ sung.
AI chắc chắn vượt trội trong việc nhận dạng mẫu, nhưng có thể phải vật lộn với các t́nh huống sức khỏe phức tạp hơn, nơi các triệu chứng có thể trùng lặp với nhiều chẩn đoán khác nhau. Hạn chế này chính là lư do tại sao các bác sĩ cần phải quản lư, giám sát các kết quả được chẩn đoán bằng các công cụ AI.
Vậy ngành chăm sóc sức khỏe có nên từ bỏ AI?
AI có những lợi thế to lớn và nghiên cứu nói trên sẽ là động lực để các nhà nghiên cứu, nhà khoa học tiếp tục phát triển các mô h́nh ngôn ngữ lớn để cải thiện hiệu suất của AI. Những công cụ này có khả năng biến đổi y học bằng cách giảm t́nh trạng kiệt sức, giao tiếp với bệnh nhân, ghi đơn thuốc và điều trị bệnh nhân từ xa.
Kết quả nghiên cứu trên JAMA Pediatrics sẽ đóng vai tṛ như một lời nhắc nhở nhẹ nhàng. AI là một công cụ, không phải là giải pháp cho những thách thức về chăm sóc sức khỏe và phải luôn được sử dụng song song với chuyên môn của các bác sĩ.