트랙 2: 한 사람으로 배운 EEG 모델을 다른 사람에게도 일반화하는 실험 (Generalizable INR)

상위 인덱스: README.md 권장 학년: 학부 3-4학년 또는 석사 1년차 (PyTorch 한 학기 이상 경험 권장) 연결 과제: BNL(미국 Brookhaven National Laboratory) 협업 사전 실험

프로젝트 개요

뇌파(EEG)는 사람마다 머리 모양, 두피 두께, 전극 부착 위치가 달라서 한 사람의 데이터로 학습한 모델이 다른 사람에게는 잘 안 작동한다. 이걸 "cross-subject 일반화 문제"라고 부른다.

이 문제를 해결하는 한 가지 방법이 Generalizable Implicit Neural Representation (GINR) 이다. 개념은 두 부분이다:

Implicit Neural Representation (INR): 신호를 "좌표 → 값" 형태의 함수로 표현 (예: 시간·채널 위치 → EEG 진폭). 신경망이 그 함수를 학습한다.
Generalizable: 큰 본체 신경망은 모든 사람이 공유하고, 각 사람의 차이는 작은 잠재 벡터 (예: 64-128개 숫자)로만 흡수한다. 새 사람이 와도 잠재 벡터만 빠르게 맞추면 된다.

이 방식이 EEG에서 실제로 작동하는지 작은 규모로 검증한다. 미국 BNL 연구팀(2024-2025)이 제안한 아이디어를 따른다. 인턴이 만든 결과는 차지욱 연구실의 BNL 협업 본 연구의 baseline으로 사용된다.

주요 수행 업무 (8주 주차별)

1-2주차: 환경 셋업 및 측정 스크립트 1회 통과

연구실 GPU 서버 계정 발급 → 1주차 안에 SSH/Slurm hello-world 통과
PyTorch 환경 셋업, GPU 사용법 학습
기존 ai4science-2026 저장소의 측정 스크립트 (scripts/profile_inr_overhead.py) 1회 실행 — 완벽한 재현은 5주차에 평가
1주차 후반에 멘토와 metric lock-in 미팅: 7주차 평가에 쓸 정확도 지표(Pearson r 권장) + tolerance 확정

3-4주차: 데이터셋 준비 및 BNL 논문 정독

공개 EEG 데이터셋 1개 선택 및 다운로드 (멘토가 후보 3-4개 제시; 데이터 사용 동의 처리 완료된 것 우선)
- 예: BCI Competition IV-2a (즉시 다운로드 가능, N=9), Sleep-EDF (N=83), TUH EEG (멘토가 DUA 사전 처리 시)
전처리 파이프라인 작성 — bandpass filter, 표준화, 사람별 segment 분할
시각화 (matplotlib) — 같은 task 신호가 사람마다 얼마나 다른지 확인 (사람 간 분산 vs 사람 내 분산)
BNL GINR 핵심 논문 1편 정독 (Generalizable INR via Parameterized Latent Dynamics) — 1주에 걸쳐 슬로우 리딩

5-6주차: 작은 INR 동작 확인 → scale-up

5주차: 약 300만 (3M) 파라미터 작은 INR 본체 + 사람별 64-dim latent vector로 동작 확인. 학습 loss가 내려가는지, latent vector가 사람별로 다르게 학습되는지 확인.
6주차: 3000만-1억 (30M-100M) 파라미터로 scale-up. 권장 default는 60M. 학습 곡선 기록, latent 차원 1-2개 조정 ablation.
입력: 채널 위치 좌표 + 시간 좌표 → 출력: EEG 진폭 값
학습 셋 N명 (데이터셋별 권장: BCI IV-2a → N=7 train + 2 hold-out)

7주차: Cross-subject 일반화 평가

학습에 없던 새 피험자(hold-out 2-5명)에 대해 latent vector만 fine-tune (본체 고정)
비교 대상 1: 단순 전이 학습 (전체 모델 재학습) baseline
비교 대상 2: 사람별 처음부터 학습 baseline
평가 지표 (1주차 lock-in 결과 적용):
- 재구성 정확도 = Pearson r (reconstructed vs true, hold-out subject, 평균)
- Latent fit 효율 = 수렴까지 epoch 수 (loss plateau ε<0.01 기준)
- 일반화 격차 = (in-subject test r) − (cross-subject test r)
모든 측정은 seed 3개 평균으로 보고

8주차: 결과 정리 및 발표 자료 작성

결과 그래프 4-5개 (학습 곡선, 일반화 비교, latent vector 분포 시각화)
한국어 1페이지 요약 보고서 + 영문 슬라이드 5장 작성
랩 세미나 발표

필요 역량

필수: Python + PyTorch 사용 경험 (간단한 신경망 학습 코드 작성 가능, 한 학기 이상)
필수: 선형대수 기초 (행렬 곱, 고유값 분해 정도)
권장: 시간에 따라 변하는 신호를 분석한 경험 (수업 또는 과제 수준)
권장: 영문 발표 자료 작성 의지
있으면 좋음: EEG 또는 fMRI 데이터 경험, INR/NeRF 관련 사전 지식

활용 인프라

연구실 GPU 서버 (NVIDIA GB10, 메모리 128GB)
공개 EEG 데이터셋 3-4종 (다운로드 경로 + 데이터 사용 동의(DUA) 처리 상태 안내됨)
BNL 협업 자료 모음 — INR/EEG 파운데이션 모델 관련 논문 자료 (자연어 검색 가능)
기존 INR 측정 스크립트 (profile_inr_overhead.py) + 평가 코드 일부 제공

산출물

데이터 전처리 파이프라인 Python 모듈
학습 코드 + 학습된 모델 체크포인트 (본체 + N+M개 latent vector)
Cross-subject 일반화 비교 보고서 (한국어 1페이지) + 영문 슬라이드 5장

성공/실패 판단 기준 (인턴 본인이 자가 진단 가능):

성공: hold-out 피험자 평균 재구성 r이 단순 전이 학습 baseline보다 0.05 이상 높거나(seed 3개 평균), latent fit epoch 수가 baseline의 50% 이하인 경우 (둘 중 하나 충족).
실패: 8주 안에 학습 코드를 1회도 끝까지 돌리지 못하거나, 두 지표 모두 baseline 동등 이하 성능. 실패도 결과 보고서에 기록한다 (음성 결과도 학습 자료).

멘토링

PI: 차지욱 교수 (주 1회 진도 미팅; PI 부재 시 박사과정 학생이 대행)
직속 멘토: 박사과정 학생 1명 (주 2-3회 PyTorch 코드 리뷰)
외부 협업: BNL 연구팀과 월 1회 화상 미팅 가능 여부는 PI 협의 시 결정 (옵션, 영문)

심화 기회

다음 중 1개 또는 복수를 선택할 수 있다.

우수한 결과를 낸 학생은 학기 중 연구실 학부 연구생으로 계속 참여 가능
BNL 협업 후속 논문/제안서에 차교수 추천 가능; 최종 저자 결정은 협업 PI 공동
NeuroX 해커톤 2026 겨울 팀원 합류

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

트랙 2: 한 사람으로 배운 EEG 모델을 다른 사람에게도 일반화하는 실험 (Generalizable INR)

프로젝트 개요

주요 수행 업무 (8주 주차별)

1-2주차: 환경 셋업 및 측정 스크립트 1회 통과

3-4주차: 데이터셋 준비 및 BNL 논문 정독

5-6주차: 작은 INR 동작 확인 → scale-up

7주차: Cross-subject 일반화 평가

8주차: 결과 정리 및 발표 자료 작성

필요 역량

활용 인프라

산출물

멘토링

심화 기회

FilesExpand file tree

track2-eeg-ginr.md

Latest commit

History

track2-eeg-ginr.md

File metadata and controls

트랙 2: 한 사람으로 배운 EEG 모델을 다른 사람에게도 일반화하는 실험 (Generalizable INR)

프로젝트 개요

주요 수행 업무 (8주 주차별)

1-2주차: 환경 셋업 및 측정 스크립트 1회 통과

3-4주차: 데이터셋 준비 및 BNL 논문 정독

5-6주차: 작은 INR 동작 확인 → scale-up

7주차: Cross-subject 일반화 평가

8주차: 결과 정리 및 발표 자료 작성

필요 역량

활용 인프라

산출물

멘토링

심화 기회