Cầu nối giữa Thị giác Máy tính (SAM) và Thực tiễn Lâm sàng.
Nhận thức gắn liền với tri giác thị giác. Tuy nhiên, điểm vàng (fovea) chỉ xử lý được độ phân giải cao trong khoảng hẹp 2° của trường nhìn.
Trẻ mắc ASD sở hữu các kiểu phân bổ chú ý thị giác không điển hình. Đây được xem là một kiểu hình đặc trưng cốt lõi của hội chứng.
Theo dõi mắt (ET) chuyển hóa ánh nhìn thành dữ liệu định lượng, vượt qua hoàn toàn sự chủ quan và sai số của việc quan sát bằng mắt thường.
Mặc dù các giả thuyết tâm lý học này rất vững chắc, việc thiếu hụt các công cụ phân tích tự động (như đã nêu ở Slide 4) khiến việc chứng minh thực nghiệm trên diện rộng gặp bế tắc.
Hệ thống hóa (Systematizing) là quá trình não bộ nỗ lực tìm kiếm quy luật chi phối theo mô hình: Đầu vào (Input) → Quy tắc → Đầu ra (Output).
Trẻ mắc ASD là những người "siêu hệ thống hóa". Khi não bộ áp dụng bộ lọc quy tắc này lên dữ liệu logic thì thành công, nhưng khi áp dụng lên dữ liệu xã hội phi logic, chu trình sẽ đứt gãy và gây ra quá tải.
Ví dụ: Bánh răng, công tắc đèn, lịch trình.
Đặc tính: Tất định, hoàn hảo, có thể giải mã.
Ví dụ: Biểu cảm khuôn mặt, cuộc trò chuyện.
Đặc tính: Ngẫu nhiên, hỗn loạn, phi logic.
1. Lỗi Dự đoán:
Sự chênh lệch giữa kỳ vọng của não và thực tế.
2. HIPPE:
Gán độ chính xác cực cao cho mọi lỗi dự đoán.
3. Quá khớp (Overfitting):
Mô hình cứng nhắc, dễ sụp đổ trước cái mới.
Bộ lọc linh hoạt phớt lờ các Lỗi dự đoán ngẫu nhiên (nhiễu), giữ cho mô hình thế giới khái quát và ổn định.
HIPPE khuếch đại Lỗi dự đoán, ép buộc não vặn vẹo thành mô hình Quá khớp đầy gai góc và dễ sụp đổ.
Não bộ điển hình xử lý "sự bất ngờ" như một tín hiệu học tập tích cực thông qua hệ thống dopamine, thúc đẩy sự khám phá.
Bất ngờ bị xem là lỗi khổng lồ gây lo âu. Lảng tránh ánh nhìn là cách điều chỉnh cân bằng nội môi, hướng tới sự ổn định.
SAM có khả năng hiểu các lớp không gian lồng nhau từ một "điểm gợi ý" (prompt) duy nhất, ví dụ: phân vùng một cái nút áo, một chiếc áo và toàn bộ một người cùng lúc.
Vòng lặp cơ bản của hệ thống từ khung hình T0 đến Tn.
Ngăn chặn sự mất dấu bằng cách mở rộng vùng dự đoán.
Quá trình SAM khử nhiễu từ hộp giới hạn vuông thành mặt nạ chuẩn xác.
Thuật toán làm mịn (Moving Average) và nối liền khoảng trống do chớp mắt.
Khi đủ điều kiện không gian và thời gian, cụm dữ liệu sẽ hóa thành Điểm nhìn.
Hoạt hình mô phỏng thuật toán phân tách tự động.
THẾ GIỚI CỦA MẮT
PeyeMMV
Cung cấp tọa độ Điểm nhìn (Fixation) dưới dạng (x, y).
THẾ GIỚI HÌNH ẢNH
Mô hình SAM
Vẽ ra ranh giới đối tượng dưới dạng Mặt nạ đa giác (Mask).
VỊ TRỌNG TÀI PHÂN XỬ
Thuật toán Hit-Test
Kiểm tra xem tọa độ của mắt có nằm BÊN TRONG đa giác của SAM hay không để xác định người dùng đang nhìn vào đồ vật nào.
Bắn tia từ tọa độ (x,y). Cắt viền lẻ lần = HIT, chẵn lần = MISS.
Cách các chỉ số được cộng dồn theo thời gian.
So sánh vùng nhận diện của AI (Xanh) vs. Nhãn con người (Đứt nét).
Cơ chế: Bấm nút → Gấu phát sáng.
n = 45
Trẻ em được chẩn đoán mắc Rối loạn Phổ Tự kỷ thông qua tiêu chuẩn ADOS-2 và DSM-5.
n = 50
Trẻ em phát triển điển hình, không có tiền sử rối loạn thần kinh hoặc chậm phát triển.
Độ tuổi
24 - 72 tháng tuổi
Giới tính
Tỷ lệ Nam:Nữ ~ 3:1
Thị lực
Bình thường hoặc đã hiệu chỉnh
SAM bao quanh các vật thể và thu thập điểm nhìn (Fixations).
Điểm nóng tập trung hoàn toàn vào khuôn mặt gấu (Kích thích Xã hội)
Điểm nóng phân bổ dồn dập vào bàn tay và nút bấm (Kích thích Cơ học)
Sự phân ly rõ rệt giữa hai nhóm tham gia.
Ánh nhìn bị thu hút mạnh mẽ bởi chú hề 3D bật ra (Entropy cao)
Lảng tránh khu vực động, khóa chặt ánh nhìn vào họa tiết 2D tĩnh bên hông hộp
Độ chính xác
Độ nhạy
Độ đặc hiệu
Chuyển hóa tín hiệu số thành quyết định lâm sàng.
* Thử chọn: Count (Tăng), Duration (Giảm), Scatter (Tăng) để xem phản ứng.
Hành vi của mắt người dùng (Vòng tròn đen) phản ứng với màn hình.
Cơ sở khoa học: Trẻ ASD có xu hướng "siêu hệ thống hóa", thích các quy luật logic và lảng tránh sự khó đoán của cảm xúc con người.
Tình huống làm cha mẹ đau đầu:
Bé Bi (4 tuổi) luôn quay mặt đi khi mẹ cố gắng giơ thẻ hình biểu cảm khuôn mặt (Vui/Buồn) để dạy bé. Tuy nhiên, bé có thể ngồi hàng giờ đồng hồ chỉ để bấm các công tắc đèn hoặc xoay bánh xe ô tô đồ chơi một cách say sưa.
Cơ sở khoa học: Sự ác cảm với Lỗi dự đoán (Prediction Error) khiến não bộ trẻ tự kỷ dễ bị quá tải trước các biến đổi đột ngột.
Tình huống làm cha mẹ đau đầu:
Khi mẹ bật một bài hát thiếu nhi vui nhộn trên iPad với các con vật nhảy múa lấp lánh để thu hút sự chú ý, bé Tít (3 tuổi) lập tức nhắm nghiền mắt lại, bịt tai và hét lớn, kiên quyết lảng tránh cái màn hình.
Cơ sở khoa học: Trẻ thường bị kẹt ánh nhìn ở một góc cố định (VD: góc trái), khiến trẻ phớt lờ hoàn toàn các thông tin nằm ngoài "vùng an toàn" này.
Tình huống làm cha mẹ đau đầu:
Khi mẹ dọn cơm, bát cơm và thìa được đặt ở chính giữa bàn. Trẻ (5 tuổi) chỉ chăm chăm nhìn vào đồ vật nằm bên trái tay mình, không chịu vươn mắt tìm chiếc thìa ở giữa hoặc bên phải, dẫn đến việc trẻ không tự xúc ăn được và tỏ ra khó chịu.
Cơ sở khoa học: Khi đối diện với quá nhiều thông tin thị giác cùng lúc, não trẻ ASD bị "đóng băng" tạo ra đường hầm chú ý (nhìn đờ đẫn một điểm vô nghĩa).
Tình huống làm cha mẹ đau đầu:
Cô giáo đổ một rổ gồm 10 loại đồ chơi gỗ nhiều màu sắc ra bàn và yêu cầu: "Lấy cho cô quả bóng màu đỏ". Trẻ nhìn lướt qua đống đồ chơi, sau đó đờ đẫn nhìn chằm chằm vào mép bàn hoặc bắt đầu ném đồ vật đi vì quá bối rối.
Cơ sở khoa học: Khi ghép câu, trẻ thường bị rối loạn quỹ đạo nhìn (chaotic scanpath), không biết phải bắt đầu nhìn từ đâu dẫn đến việc ghép sai thứ tự từ vựng.
Tình huống thực tế:
Khi dạy bé ghép câu "Tôi muốn quả táo", trên bàn có 3 thẻ chữ. Bé nhìn lướt loạn xạ qua lại giữa thẻ "Quả táo" và "Tôi", rồi nhặt đại đưa cho mẹ. Kết quả là bé không hiểu được cấu trúc ngữ pháp cơ bản.
Cơ sở khoa học: Trẻ tự kỷ thường thiếu sự "chú ý chung" (Joint Attention). Trẻ có thể thực hiện hành động bằng tay (như đưa thẻ hoặc giật đồ) nhưng mắt lại đang nhìn lơ đãng đi chỗ khác.
Tình huống thực tế:
Bé cầm bức tranh "Bánh quy" đưa cho giáo viên để xin ăn. Tuy nhiên, lúc đưa tranh, mặt bé lại quay ngoắt ra nhìn cái quạt trần. Giáo viên lập tức đưa bánh cho bé. Việc này vô tình củng cố một thói quen giao tiếp "mù" (không có tương tác mắt).