Nghiên cứu so sánh AI và bác sĩ trong chẩn đoán y khoa: Kết quả bất ngờ

Một nghiên cứu gần đây đã so sánh khả năng chẩn đoán bệnh của trí tuệ nhân tạo (AI) với các bác sĩ, và kết quả khiến nhiều người ngỡ ngàng.

Nghiên cứu do nhóm của Tiến sĩ Hirotaka Takita và Phó Giáo sư Daiju Ueda tại Đại học Osaka Metropolitan (Nhật Bản) thực hiện, dựa trên phương pháp tổng quan hệ thống và phân tích tổng hợp. Tổng cộng 18.371 nghiên cứu đã được xem xét, trong đó 83 nghiên cứu đáp ứng tiêu chí được chọn để phân tích chi tiết. Kết quả hé lộ cả điểm mạnh lẫn hạn chế của AI trong lĩnh vực chăm sóc sức khỏe.

Nghiên cứu đánh giá nhiều mô hình AI sinh học như GPT-4, Llama3 70B, Gemini 1.5 Pro và Claude 3 Sonnet trên các chuyên ngành y tế khác nhau. Trong đó, GPT-4 là mô hình được nghiên cứu nhiều nhất. Kết quả tổng hợp cho thấy:

Về độ chính xác chẩn đoán, các mô hình AI đạt trung bình 52.1% (KTC 95%: 47.0–57.1%). Khi so sánh với bác sĩ không chuyên, không có sự khác biệt đáng kể về thống kê (chênh lệch: 0.6% [KTC 95%: −14.5% đến 15.7%], p=0.93). Tuy nhiên, bác sĩ chuyên gia vẫn vượt trội hơn AI với khoảng cách đáng kể 15.8% (KTC 95%: 4.4%–27.1%, p=0.007), dù khoảng cách này có thể thu hẹp theo thời gian nhờ cải tiến công nghệ.

Hiệu suất của AI khá đồng đều trên hầu hết chuyên khoa, nhưng có hai ngoại lệ: da liễu và tiết niệu. Trong lĩnh vực da liễu, AI thể hiện kết quả mạnh mẽ hơn, có lẽ do đặc thù nhận diện hình ảnh – thế mạnh vốn có của AI. Tuy nhiên, các chuyên gia lưu ý rằng da liễu cũng đòi hỏi tư duy phức tạp và quyết định dựa trên đặc điểm riêng của bệnh nhân, điều mà AI chưa thể đáp ứng đầy đủ. Đối với tiết niệu, kết quả dựa trên một nghiên cứu quy mô lớn duy nhất, khiến việc khái quát hóa còn hạn chế.

 AI và bác sĩ

Tiến sĩ Takita nhấn mạnh: "Nghiên cứu này cho thấy khả năng chẩn đoán của AI sinh học tương đương bác sĩ không chuyên. Nó có thể được ứng dụng trong đào tạo y khoa để hỗ trợ bác sĩ thiếu kinh nghiệm hoặc trợ giúp chẩn đoán ở khu vực thiếu nguồn lực y tế". Ông cũng kêu gọi nghiên cứu sâu hơn về các kịch bản lâm sàng phức tạp, đánh giá hiệu suất dựa trên hồ sơ bệnh án thực tế, cải thiện tính minh bạch trong quyết định của AI, và xác thực trên nhóm bệnh nhân đa dạng.

Bên cạnh chẩn đoán, nghiên cứu còn chỉ ra tiềm năng ứng dụng AI trong đào tạo y khoa. Các tác giả cho biết: "Hiệu suất tương đương của các mô hình AI sinh học hiện tại so với bác sĩ trong môi trường không chuyên mở ra cơ hội lớn trong việc tích hợp AI vào đào tạo y tế". AI có thể mô phỏng các tình huống lâm sàng thực tế, giúp sinh viên rèn luyện kỹ năng và đánh giá năng lực.

Tuy nhiên, vẫn tồn tại lo ngại về tính minh bạch và thiên vị trong các mô hình này. Nhiều hệ thống AI không tiết lộ chi tiết dữ liệu huấn luyện, khiến việc đảm bảo tính khách quan trở nên khó khăn. Nhóm nghiên cứu nhấn mạnh: "Tính minh bạch giúp hiểu rõ kiến thức, bối cảnh và giới hạn của mô hình", đồng thời kêu gọi phát triển các ứng dụng AI rõ ràng, có đạo đức và được xác thực kỹ lưỡng.

Hiện tại, AI sinh học – dù hứa hẹn – vẫn gặp khó khăn với các ca bệnh phức tạp đòi hỏi thông tin chi tiết về bệnh nhân. Liệu các bác sĩ có nên lo lắng về việc bị thay thế? Dù khó dự đoán chính xác, nhưng trong lĩnh vực chẩn đoán, khả năng này hoàn toàn có thể xảy ra. Nghiên cứu kết luận: "AI không phải là mối đe dọa, mà là cơ hội để y học tiến xa hơn – miễn là chúng ta biết kết hợp trí tuệ nhân tạo với trí tuệ con người một cách có trách nhiệm".

Thứ Hai, 21/04/2025 16:20
31 👨 66
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
❖
    Chia sẻ
    Chia sẻ FacebookChia sẻ Twitter
    Đóng