Poster hội thảo

ỨNG DỤNG CÔNG NGHỆ THEO DÕI MẮT
ĐỂ HIỂU ĐẶC ĐIỂM NHẬN THỨC
VÀ TỐI ƯU HOÁ CAN THIỆP
CHO TRẺ RỐI LOẠN PHỔ TỰ KỶ

ThS. Nguyễn Thị Quỳnh Hoa – Khoa Công nghệ Thông tin, Trường Đại Toán học Và Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội.

Lê Đức Duy – Phòng thí nghiệm Tương tác Người–Máy, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.

Tạ Đăng Khoa – Phòng thí nghiệm Tương tác Người–Máy, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.

PGS. TS. Lê Thanh Hà – Trưởng Phòng thí nghiệm Tương tác Người–Máy, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.

TS. Ngô Thị Duyên – Phòng thí nghiệm Tương tác Người–Máy, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội.

TS. Nguyễn Nữ Tâm An – Trưởng bộ môn giáo dục trẻ khuyết tật trí tuệ và tự kỷ, Khoa giáo dục đặc biệt – Trường khoa học phát triển trẻ thơ – Trường ĐHSP Hà Nội.

TS. Nguyễn Thị Cẩm Hường – Trưởng bộ môn giáo dục trẻ KTHT và KT, Khoa giáo dục đặc biệt – Trường khoa học phát triển trẻ thơ – Trường ĐHSP Hà Nội.

Bối cảnh lâm sàng & tỷ lệ phát hiện gia tăng
02/23

Bối cảnh lâm sàng - 臨床的背景

  • Rối loạn Phổ Tự kỷ (ASD) được đặc trưng bởi sự khiếm khuyết dai dẳng trong giao tiếp và tương tác xã hội.
  • Khoảng 25-35% trẻ em được chẩn đoán mắc bệnh không phát triển được ngôn ngữ nói.
  • Khiếm khuyết trong giao tiếp chức năng tạo ra rào cản lớn, đòi hỏi các chiến lược trị liệu mạnh mẽ.
  • Các vấn đề liên quan: Sự gia tăng chẩn đoán đặt ra áp lực lớn lên hệ thống y tế, giáo dục đặc biệt.
  • 自閉症スペクトラム障害(ASD)は、コミュニケーションおよび社会的相互作用における持続的な障害を特徴とする。
  • 診断を受けた児童の約25~35%は、音声言語を発達させることができない
  • 機能的コミュニケーションの障害は大きな障壁となり、より強力な治療・支援戦略が求められる。
  • 関連する課題:診断数の増加は、医療および特別支援教育システムに大きな負担をもたらしている。

Tỷ lệ phát hiện ASD toàn cầu - 自閉症スペクトラム障害(ASD)の世界的検出率

  • Thống kê (CDC): Tỷ lệ mắc ASD đã tăng mạnh từ 1/150 (năm 2000) lên mức 1/31 (năm 2025).
  • 統計(CDC):自閉症スペクトラム障害(ASD)の有病率は、2000年の1/150から2025年には1/31へと急増している
Vai trò của chú ý thị giác - 視覚的注意の役割
03/23

Giới hạn của mắt người - 人間の目の限界

Nhận thức gắn liền với tri giác thị giác. Tuy nhiên, điểm vàng (fovea) chỉ xử lý được độ phân giải cao trong khoảng hẹp của trường nhìn.
知覚は視覚認知と密接に関係するが、高解像度で処理できる中心窩(fovea)は視野の約2°に限られる。

Kiểu hình phân kỳ ở ASD - ASDにおける注意の偏り

Trẻ mắc ASD sở hữu các kiểu phân bổ chú ý thị giác không điển hình. Đây được xem là một kiểu hình đặc trưng cốt lõi của hội chứng.
ASD児では視覚的注意の配分が非定型であり、症候群の中核的な表現型と考えられている。

Lăng kính khách quan - 客観的なレンズ

Theo dõi mắt (ET) chuyển hóa ánh nhìn thành dữ liệu định lượng, vượt qua hoàn toàn sự chủ quan và sai số của việc quan sát bằng mắt thường.
アイトラッキング(ET)は視線を定量データへ変換し、目視観察の主観性と誤差を低減する。

Nút thắt phương pháp luận - 方法論上のボトルネック
04/23

Khó khăn trong phân tích - 分析上の課題

  • Phân tích dữ liệu ET trên video động đòi hỏi xác định liên tục Vùng Quan tâm (AOI) theo từng khung hình.
  • Gán nhãn hộp giới hạn thủ công cực kỳ tốn kém: cần 30-60 phút lao động cho 1 phút video.
  • Sự chênh lệch này giới hạn nghiên cứu ở quy mô mẫu nhỏ, làm giảm sức mạnh thống kê để thiết lập dấu ấn sinh học chẩn đoán.

Quy trình xác định AOI thủ công - AOI手動アノテーション手順

Mặt (Face) / 顔 Khối (Blocks) / ブロック Xe (Car) / 車 t Nhiều đối tượng × 1800 khung hình = 1 phút video 複数対象 × 1800フレーム = 1分動画
Từ hành vi thị giác đến cơ chế nhận thức & mục tiêu
05/23

Các giả thuyết nhận thức - 認知仮説

  • Ánh nhìn không điển hình ở trẻ ASD không phải thiếu hụt ngẫu nhiên, mà phản ánh chiến lược thích nghi.
  • Siêu hệ thống hóa: Não bộ tự kỷ bị thu hút bởi quy luật máy móc hơn là tương tác xã hội khó đoán.
  • Không dung nạp lỗi (HIPPE): Lảng tránh kích thích bất ngờ để hạn chế quá tải cảm giác.

Khoảng trống phương pháp - 方法論のギャップ

Các giả thuyết tâm lý này rất vững chắc, nhưng thiếu hụt công cụ phân tích tự động khiến việc kiểm chứng thực nghiệm gặp bế tắc.

Dữ liệu thô 生データ ? Cơ chế Nhận thức 認知メカニズム ➡ Cần "phiên dịch" tự động 自動「翻訳」が必要

Mục tiêu nghiên cứu - 研究目標

  • Mục tiêu 1: Phát triển khung phân vùng zero-shot (SAM) để trích xuất tự động dấu ấn sinh học từ video.
  • Mục tiêu 2: Định lượng các giả thuyết (Siêu hệ thống hóa & HIPPE) qua 2 mô hình thực nghiệm (Nhân quả & Bất ngờ).
  • Mục tiêu 3: Triển khai can thiệp thích ứng tích hợp ET để tối ưu hóa trị liệu truyền thống.
Thuyết siêu hệ thống hóa (Hyper-Systemizing) - 過剰システム化理論
06/23

Hệ thống hóa (Systematizing): Đầu vào (Input) → Quy tắc → Đầu ra (Output).

Trẻ ASD có xu hướng "siêu hệ thống hóa". Bộ lọc quy tắc hoạt động tốt với dữ liệu logic, nhưng với dữ liệu xã hội phi logic thì dễ đứt gãy và gây quá tải.

BỘ LỌC フィルター QUY LUẬT ルール Dữ liệu Hệ thống システムデータ Dự đoán 100% 予測100% Dữ liệu Xã hội 社会データ Lỗi dự đoán 予測誤差 KHÔNG QUY LUẬT 非規則

Hệ thống cơ học - 機械的システム

Ví dụ: Bánh răng.
Đặc tính: Tất định, hoàn hảo, có thể giải mã.

INPUT OUTPUT

Tác nhân xã hội - 社会的エージェント

Ví dụ: Biểu cảm.
Đặc tính: Ngẫu nhiên, hỗn loạn, phi logic.

INPUT 😊 😠 ? ??? X
Mã hóa dự đoán & HIPPE (xử lý nhiễu)
07/23

1. Lỗi dự đoán:

Sự chênh lệch giữa kỳ vọng của não và thực tế.

2. HIPPE:

Gán độ chính xác cực cao cho mọi lỗi dự đoán.

3. Quá khớp (Overfitting):

Mô hình cứng nhắc, dễ sụp đổ trước cái mới.

Não bộ điển hình (dung nạp nhiễu) - 定型発達の脳(ノイズ許容)

Bộ lọc linh hoạt phớt lờ các Lỗi dự đoán ngẫu nhiên (nhiễu), giữ cho mô hình thế giới khái quát và ổn định.

BỘ LỌC フィルター Lỗi dự đoán 予測誤差 MÔ HÌNH モデル

Não bộ ASD (HIPPE & quá khớp) - ASDの脳(HIPPEと過学習)

HIPPE khuếch đại Lỗi dự đoán, ép buộc não vặn vẹo thành mô hình Quá khớp dễ sụp đổ.

KHUẾCH ĐẠI 増幅 Lỗi dự đoán 予測誤差 QUÁ KHỚP 過学習 ĐỔ VỠ! / 崩壊!
Bản chất của sự ác cảm với sự mới mẻ - 新奇性への嫌悪の本質
08/23

Học tập tích cực (trẻ TD) - 積極的学習(TD児)

Não bộ điển hình xử lý "sự bất ngờ" như tín hiệu học tập tích cực qua hệ dopamine, thúc đẩy khám phá.

DOPAMINE ドーパミン

Quá tải & lảng tránh (trẻ ASD) - 過負荷と回避(ASD児)

Bất ngờ bị xem là lỗi khổng lồ gây lo âu. Lảng tránh ánh nhìn là cách điều chỉnh nội môi để hướng tới ổn định.

VÙNG TĨNH 静的領域 QUÁ TẢI! 過負荷! LẢNG TRÁNH 回避
Kiến trúc tổng thể hệ thống - システム全体アーキテクチャ
09/23
  • Một luồng xử lý dạng mô-đun tích hợp phần cứng (thiết bị theo dõi mắt) và ngăn xếp phần mềm gồm năm mô-đun.
  • Các mô-đun: Tích hợp kích thích thị giác, Ghi nhận chuyển động mắt, Tiền xử lý dữ liệu, Nhận dạng AOI Zero-shot, và Trích xuất đặc trưng.
Kiến trúc tổng thể hệ thống
Mô hình SAM (Zero-Shot) & Cơ chế Tracking - SAM(ゼロショット)モデルと追跡機構
10/23

Phân vùng & Tracking - セグメンテーションと追跡

  • Zero-Shot: Phân vùng và bám sát đối tượng chính xác đến từng pixel mà không cần tinh chỉnh trước.
  • Mơ hồ phân cấp: SAM hiểu các lớp không gian lồng nhau từ một "điểm gợi ý" duy nhất.
  • Tracking: Tọa độ mắt thay đổi ý nghĩa liên tục nếu không có công cụ tự động bám sát vật thể.
  • Prompt & Track: Hệ thống dựa trên nguyên lý "Nhắc (Prompt)" điểm đầu và "Theo dõi (Track)" dịch chuyển.

Sự mơ hồ phân cấp - 階層的あいまい性

1. Toàn bộ Người 全身 2. Chiếc Áo 3. Nút áo ボタン

Luồng thực thi động - 動的実行フロー

Prompt Khởi tạo (t=0) 初期プロンプト (t=0) Mở rộng Bounding Box バウンディングボックス拡張 (Bắt chuyển động / 動きを捕捉) SAM Tinh chỉnh (Edge) SAM エッジ精緻化
Bước 1-3: Mở rộng & tinh chỉnh mặt nạ - ステップ1-3:マスク拡張と精緻化
11/23

Khắc phục mất dấu - トラッキング喪失の補正

  • Vấn đề khung tĩnh: Vật thể di chuyển nhanh làm hộp giới hạn cũ bị lệch.
  • Giải pháp mở rộng: Mở rộng biên 10-20% để tạo "lưới an toàn" bắt chuyển động.
  • SAM tinh chỉnh: Dùng hộp mở rộng làm Prompt để tự động loại bỏ nền nhiễu.
  • Kết quả: Tạo mặt nạ ôm sát đường biên đối tượng (Shrink-to-fit).

Mở rộng hộp giới hạn - バウンディングボックス拡張

Khung hình trước (t-1) 前フレーム (t-1) Khung hình (t) + Mở rộng 20% フレーム (t) + 20%拡張 Box (t-1) / ボックス (t-1) Expanded Box 拡張ボックス

Bóc tách & khớp biên - 切り出しと境界適合

Input Box 入力ボックス Output Mask 出力マスク
Phương pháp đánh giá kỹ thuật hệ thống - システム技術評価の方法
12/23

Thiết lập thực nghiệm - 実験設定

  • Để đánh giá độ chính xác của luồng AI, chúng tôi kiểm thử trên tập video chuyển động thực tế.
  • Nhãn tham chiếu (Ground-Truth): Con người gán nhãn thủ công mặt nạ từng vật thể trên 600 khung hình.
  • Phép thử: Hệ thống chạy tự động hoàn toàn (Zero-Shot) trên cùng 600 khung hình và đo độ lệch với người gán nhãn.

Mô phỏng quy trình so sánh - 比較プロセスの模式図

Frame t フレーム t Con Người 人手 Hệ thống AI AIシステム SO SÁNH 比較
Đánh giá hệ thống: độ chính xác & hiệu quả - システム評価:精度と効率
13/23

Hiệu suất đột phá - 画期的な性能

  • Độ chính xác (IoU): Trung bình 0.92 so với nhãn thủ công, cho thấy mức khớp cao với đánh giá của chuyên gia.
  • Tốc độ xử lý: Giảm 95% thời gian thao tác (1 phút video: ~60 phút thủ công xuống ~3 phút với AI).
  • Khả năng mở rộng: Mở đường cho phân tích dữ liệu ánh nhìn lâm sàng quy mô lớn.

Mô phỏng chỉ số IoU - IoU指標の模式図

Ground-Truth / 正解ラベル Prediction (AI) / AI予測 IoU Score = 0.92

So sánh tốc độ xử lý - 処理速度の比較

HOÀN THÀNH / 完了 Thủ công (~60 phút) / 手作業(約60分) Hệ thống AI (~3 phút) / AIシステム(約3分) GIẢM 95%! / 95%短縮!
Đối tượng tham gia & quy trình thử nghiệm - 参加者と実験プロトコル
14/23

Đối tượng nghiên cứu - 研究対象

Nhóm lâm sàng (ASD): n = 45 (Trẻ rối loạn phổ tự kỷ).

Nhóm đối chứng (TD): n = 50 (Trẻ điển hình).

Tiêu chí đối chiếu - 対照基準

  • Tuổi: 24 - 72 tháng tuổi.
  • Giới tính: Tỷ lệ Nam:Nữ ~ 3:1.
  • Thị lực: Bình thường hoặc đã hiệu chỉnh.

Quy trình thời gian - タイムライン手順

  • Giai đoạn 1 (T₁ - Baseline): Đồ chơi tĩnh, thu thập xu hướng tự nhiên.
  • Giai đoạn 2 (T₂ - Cause): Hành động nguyên nhân / cơ học.
  • Giai đoạn 3 (T₃ - Effect): Hiệu ứng bất ngờ / phần thưởng xã hội.

Lưu đồ thời gian (Timeline) - タイムライン図

0s / 0秒 3s / 3秒 5s / 5秒 10s / 10秒 T₁: Tĩnh / 静的 T₂: Hành động / 動作 T₃: Hiệu ứng / 効果
Mô hình A: Bài toán nhân quả & Heatmap - モデルA:因果課題とヒートマップ
15/23

Sự mâu thuẫn chú ý - 注意の競合

  • Kích thích: Đồ chơi "Gấu bấm nút" đặt hai kích thích cạnh tranh trong cùng khung hình.
  • Cơ học (Nguyên nhân): Nút bấm vật lý (logic, tất định).
  • Xã hội (Kết quả): Khuôn mặt gấu sáng/nhạc (cảm xúc).
  • Giả thuyết: ASD thiên về Nguyên nhân, TD thiên về Kết quả.

Mô phỏng xung đột thị giác - 視覚競合の模式図

NÚT BẤM / ボタン MẶT GẤU / クマの顔 ASD TD

Bản đồ nhiệt (Heatmap) - ヒートマップ

TD (nhìn mặt gấu)
ASD (nhìn nút bấm)
Kết quả A: Xác thực tính siêu hệ thống hóa - 結果A:過剰システム化の検証
16/23

Sự chênh lệch định hướng - 注視方向の乖離

  • Nhóm TD dành ~70% thời gian nhìn cho gấu xã hội (hiệu ứng xã hội).
  • Nhóm ASD dành ~75% thời gian nhìn vào nút bấm cơ học (nguyên nhân công cụ).
  • Kết luận: Hệ chú ý của trẻ ASD không thiếu hụt, mà thiên vị chọn lọc các quy tắc tất định (Đầu vào → Đầu ra) hơn kích thích xã hội.

Tỷ lệ tổng thời lượng nhìn (Dwell Time) - 総注視時間比率

Sự phân ly rõ rệt giữa hai nhóm. / 2群間の明確な乖離。

Nhóm điển hình (TD) - 定型群
Gấu XH / 社会: 70%
Nút / ボタン: 30%
Nhóm tự kỷ (ASD) - ASD群
Gấu / クマ: 25%
Nút cơ học / 機械: 75%
Mô hình B: Bài toán bất ngờ & phản ứng - モデルB:驚き課題と反応
17/23

Jack-in-the-Box & lảng tránh - ジャックインザボックスと回避

  • Trạng thái tĩnh: Xoay hộp nhạc dễ dự đoán (entropy thấp).
  • Trạng thái động: Chú hề 3D bật nắp đột ngột (entropy cao, lỗi dự đoán lớn).
  • Phản ứng: TD tập trung vào khuôn mặt 3D; ASD quá tải và nhanh chóng saccade lảng tránh về họa tiết 2D tĩnh để tự điều chỉnh.

Sự bất ngờ (Surprise) - 驚き

POP! / びっくり!

Phân ly ánh nhìn tự động - 注視の自動分離

AOI 2 (Tĩnh) / AOI2(静的) AOI 1 (Động) / AOI1(動的)
Bản đồ nhiệt (Heatmap) - Mô hình B - ヒートマップ(モデルB)
18/23

Nhóm điển hình (TD) - 定型群

Ánh nhìn bị thu hút mạnh bởi chú hề 3D bật ra (entropy cao).

TD Heatmap Model B

Nhóm tự kỷ (ASD) - ASD群

Lảng tránh khu vực động, khóa ánh nhìn vào họa tiết 2D tĩnh bên hông hộp.

ASD Heatmap Model B
Đỉnh entropy & phân ly lỗi dự đoán - エントロピーのピークと予測誤差の分離
19/23

Sự ác cảm với entropy cao - 高エントロピーへの嫌悪

  • Lỗi dự đoán (entropy) tăng vọt khi chú hề bật ra.
  • Nhóm TD: ~85% thời lượng nhìn vào khuôn mặt động.
  • Nhóm ASD: Tránh mặt động, ~75% thời gian nhìn vào họa tiết tĩnh bên hộp.
  • Kết luận: Trẻ ASD không "sợ khuôn mặt" mà ác cảm với chuyển động khó dự đoán.

Đồ thị lỗi dự đoán - 予測誤差グラフ

Entropy / エントロピー T₁ (Nền) / ベースライン T₂ / 驚き

Tỷ lệ Dwell Time - 注視維持時間比率

TD / 定型群
AOI1 động/動: 85%
10%
ASD / ASD群
5%
AOI2 tĩnh/静: 75%
Phân loại tự động (chẩn đoán) - 自動分類(診断)
20/23

Sức mạnh của dấu ấn sinh học - バイオマーカーの力

  • Các chỉ số biomarker (TTFF, Dwell Time, Fixation Count) từ 12 loại kích thích được dùng để huấn luyện SVM.
  • Mục tiêu là tạo công cụ hỗ trợ y tế tự động phân biệt ASD và TD dựa trên dữ liệu khách quan.
  • Hiệu suất: Độ chính xác tổng thể 90.91%, cho thấy tính khả thi của eye-tracking trong chẩn đoán không xâm lấn.

Mô phỏng phân loại SVM & hiệu suất - SVM分類と性能の模式図

Nhóm TD / TD群 Nhóm ASD / ASD群
91%

Độ chính xác / 精度

87%

Độ nhạy / 感度

97%

Độ đặc hiệu / 特異度

Cẩm nang 1: Cơ học mở khóa xã hội - ガイド1:機械刺激で社会性を開く
21/23

Bối cảnh & tình huống thực tế - 背景と実践場面

Cơ sở khoa học: Trẻ ASD có xu hướng "siêu hệ thống hóa", ưu tiên quy luật logic và tránh kích thích cảm xúc khó đoán.

Tình huống làm cha mẹ đau đầu:

Bé Bi (4 tuổi) quay mặt đi khi học thẻ biểu cảm (Vui/Buồn), nhưng có thể tập trung rất lâu vào công tắc đèn hoặc bánh xe đồ chơi.

Hướng dẫn thực hiện - 実施ガイド

  • Bước 1 (Neo giữ ánh nhìn): Cho bé bắt đầu từ đồ chơi nút bấm cơ học (điểm mạnh hiện có).
  • Bước 2 (Ghép nối phần thưởng): Khi bé ấn nút đúng, cho xuất hiện khuôn mặt cười hoặc lời khen ngay lập tức.
  • Bước 3 (Chuyển hóa): Trẻ dần chủ động nhìn kích thích xã hội vì nó trở thành "kết quả logic" của hành động.
1. Tác vụ cơ học / 機械タスク 2. Mở khóa xã hội / 社会性を開く
Cẩm nang 3: Khắc phục thiên vị vị trí (Gaze Bias) - ガイド3:注視位置バイアスの是正
22/23

Bối cảnh & tình huống thực tế - 背景と実践場面

Cơ sở khoa học: Trẻ có thể mắc kẹt ánh nhìn ở một góc cố định, bỏ qua thông tin ngoài "vùng an toàn".

Tình huống làm cha mẹ đau đầu:

Khi bát và thìa đặt giữa bàn, trẻ 5 tuổi chỉ nhìn bên trái, không quét sang giữa/phải nên khó tự xúc ăn và dễ bực bội.

Hướng dẫn thực hiện - 実施ガイド

  • Bước 1 (Thích nghi & Tự tin): Không ép nhìn phải; đặt bát/thìa ở vùng trái quen thuộc để tạo thành công ban đầu.
  • Bước 2 (Mồi nhử & Kéo giãn): Dán sticker phát sáng lên thìa và dịch dần sang phải 2-3 cm/ngày để mở rộng góc quét.
Kéo giãn vùng quét bằng "Mồi nhử" / 「誘導手掛かり」で探索拡張 Vùng an toàn / 安全域 Nhích dần ra xa / 少しずつ遠くへ
Cẩm nang 6: Đồng bộ ánh nhìn và hành động - ガイド6:視線と行動の同期
23/24

Bối cảnh & tình huống thực tế - 背景と実践場面

Cơ sở khoa học: Trẻ tự kỷ thường thiếu "chú ý chung" (Joint Attention): tay làm việc nhưng mắt không đồng bộ với đối tượng giao tiếp.

Tình huống thực tế:

Bé đưa thẻ "Bánh quy" để xin ăn nhưng mắt nhìn quạt trần; nếu vẫn được thưởng ngay sẽ củng cố thói quen giao tiếp không có tương tác mắt.

Hướng dẫn thực hiện (Intercept) - 実施ガイド

  • Bước 1 (Đình chỉ): Nếu bé đưa thẻ mà không nhìn, tạm dừng thưởng ngay lúc đó.
  • Bước 2 (Đánh chặn ánh nhìn): Đưa phần thưởng lên ngang tầm mắt người lớn và gọi nhẹ tên bé.
  • Bước 3 (Trao thưởng): Chỉ thưởng khi mắt bé chạm vào mục tiêu, qua đó đồng bộ ánh nhìn và hành động.
Mắt trẻ 子どもの目 Mắt mẹ 母の目 Phần thưởng 報酬
Kết thúc - ご清聴ありがとうございました
24/24

Xin cảm ơn quý thầy cô và các anh/chị đã lắng nghe

ありがとうございました

Q&A