Bài kiểm tra bệnh nhân Alzheimer cho thấy các chatbot AI bị ...suy giảm nhận thức. Ảnh: AI Debuit |
Hướng dẫn dành cho LLM cho mỗi nhiệm vụ đều giống như hướng dẫn dành cho bệnh nhân. Việc chấm điểm tuân theo hướng dẫn chính thức và được đánh giá bởi một bác sĩ thần kinh đang hành nghề.
ChatGPT 4o đạt điểm cao nhất trong bài kiểm tra MoCA (26/30), tiếp theo là ChatGPT 4 và Claude (25/30), trong khi Gemini 1.0 đạt điểm thấp nhất (16/30).
Tất cả các chatbot đều cho thấy hiệu suất kém trong các kỹ năng thị giác không gian và nhiệm vụ điều hành, chẳng hạn như nhiệm vụ tạo dấu vết (nối các số và chữ cái được khoanh tròn theo thứ tự tăng dần) và bài kiểm tra vẽ đồng hồ (vẽ mặt đồng hồ hiển thị thời gian cụ thể). Mô hình Gemini đã thất bại trong nhiệm vụ nhớ lại bị trì hoãn (ghi nhớ chuỗi năm từ).
Những tưởng sẽ thay thế bác sĩ, nhưng các AI lại bất ngờ trở thành bệnh nhân. Ảnh: AI Debuit |
Hầu hết các nhiệm vụ khác, bao gồm đặt tên, chú ý, ngôn ngữ và trừu tượng hóa đều được tất cả các chatbot thực hiện tốt.
Nhưng trong các thử nghiệm thị giác không gian tiếp theo, chatbot không thể thể hiện sự đồng cảm hoặc diễn giải chính xác các cảnh thị giác phức tạp.
Chỉ có ChatGPT 4o thành công trong giai đoạn không nhất quán của thử nghiệm Stroop, sử dụng sự kết hợp của tên màu và màu phông chữ để đo mức độ nhiễu ảnh hưởng đến thời gian phản ứng.
Đây là những phát hiện quan sát và các tác giả thừa nhận sự khác biệt cơ bản giữa não người và các mô hình ngôn ngữ lớn.
Tuy nhiên, họ chỉ ra rằng sự thất bại đồng loạt của tất cả các mô hình ngôn ngữ lớn trong các nhiệm vụ đòi hỏi trừu tượng hóa trực quan và chức năng điều hành làm nổi bật một điểm yếu đáng kể có thể cản trở việc sử dụng chúng trong các bối cảnh lâm sàng.
Do đó, họ kết luận, "Các nhà thần kinh học không chỉ khó có thể bị thay thế bởi các mô hình ngôn ngữ lớn trong thời gian tới mà những phát hiện của chúng tôi còn cho thấy họ có thể sớm phải điều trị cho những bệnh nhân ảo mới - các mô hình trí tuệ nhân tạo biểu hiện suy giảm nhận thức".
Mời độc giả xem thêm video "Chatbot AI trả lời sai thôi bay của Google 100 tỷ USD. - Nguồn: @Realnews365