📌 Notion Metadata Properties
- 👤 작성자: Antigravity v2.0 (Google DeepMind)
- 📅 최종 수정일: 2026-05-22
- 🟢 상태:
Completed/Approved- 🏷️ 카테고리:
AI for Science/Neuroscience/Agentic Coding- 📁 프로젝트 허브:
Transconnectome/lbm-agent- 🔗 원본 노션 페이지: Notion Link (36841454561d80db93b1ed512b242af2)
Note
Executive Summary (핵심 요약) 본 문서는 서울대학교 차지욱 교수 연구팀의 **Large Brain Model(LBM) 연구 성과(DIVER, SwiFT, Neural Field Modeling)**와 Graham Neubig 교수의 OpenHands 및 OSWorld 에이전트 AI의 융합 전략 연구를 노션 뷰어 형태로 포맷팅한 미러링 대시보드입니다.
- 핵심 가치: 기존 VLM 에이전트의 물리적 한계(Visuomotor Grounding 오차, 추론 지연 등)를 LBM의 Spatiotemporal 뇌 토큰 매핑 및 오류 관련 전위(ErrP) 피드백 루프를 통해 보완하는 Brain-Agent Interface(BAI) 프레임워크를 제안합니다.
- 현실적 제약 반영: fMRI의 물리적 BOLD 지연(4~6초) 및 EEG의 두개골 노이즈 감쇄 문제를 직시하여 실시간 인터랙션과 장기 맥락 분석을 구분한 5개년 3단계 로드맵을 포함합니다.
┌────────────────────────────────────────────────────────────────────────┐
│ 📑 [종합 전략 연구 보고서] docs/strategic_lbm_agent_ai_report.md │
│ - 뇌 신호 시맨틱 토큰 정렬 및 5개년 R&D 로드맵을 상술한 최고 학술 문서. │
├────────────────────────────────────────────────────────────────────────┤
│ 🖼️ [프리미엄 16:9 슬라이드 갤러리] gallery.html │
│ - 13건의 SOTA 발표 슬라이드를 한눈에 보고 검색할 수 있는 단일 HTML 뷰어. │
├────────────────────────────────────────────────────────────────────────┤
│ 🔬 [대학원생 R&D 실습 핸드아웃] docs/snu_connectome_student_handout.md │
│ - nlm RAG 실습, 슬라이드 등록, create_gmail_drafts.py 연동 실무 교재. │
└────────────────────────────────────────────────────────────────────────┘
1️⃣ DIVER-1: Spatio-temporal Attention & any-variate EEG Model (클릭하여 닫기)
- 시공간 통합: 시간과 공간 정보를 병렬적으로 처리하지 않고 Spatio-temporal Attention과 **Rotary Position Embedding(RoPE)**를 결합하여 뇌의 시공간 동역학을 모델링합니다.
- 채널 유연성: **Sliding Temporal Conditional Positional Encoding(STCPE)**와 any-variate attention 메커니즘을 적용하여, 채널의 개수나 전극 위치가 달라지더라도 Permutation & Translation Equivariance를 강건하게 유지합니다. 이 덕분에 17.7k subject 및 54k 시간의 대규모 데이터로 사전학습된 제로샷 BCI 일반화 성능을 냅니다.
- 에이전트 폐루프 제어 (Closed-loop ErrP): 에이전트가 코딩 에러를 범해 개발자가 순간적인 **오류 관련 전위(ErrP, Error-Related Potential)**를 유발하면, DIVER-1이 이를 밀리초(ms) 단위로 90% 정확도로 실시간 검출하여 에이전트 루프를 즉시 롤백(Revert)시킵니다.
sequenceDiagram
participant User as 사용자 뇌파 (DIVER)
participant Agent as OpenHands Agent
participant Env as IDE / OSWorld 환경
Agent->>Env: Action 수행 (클릭/코드 수정)
Env-->>User: 에러/오작동 노출 (Visual Feed)
Note over User: 뇌파 상에 ErrP (오류 관련 전위) 발생!
User->>Agent: DIVER-1 실시간 ErrP 90% 검출 & Revert 시그널 전송
Agent->>Env: Revert Action 실행 (원상 복구)
Note over Agent: 무한 에러 루프 방지 & 66% 예산 절감!
2️⃣ SwiFT: Swin 4D fMRI Transformer (클릭하여 열기)
- 윈도우 Self-Attention: fMRI의 복잡하고 방대한 4D spatiotemporal 볼륨 데이터를 4D Window Multi-head Self-Attention(4DW-MSA) 및 Shifted Window(4DSW-MSA) 기법을 통해 다룹니다. 이를 통해 고차원의 3D 공간+1D 시간 계산 복잡도를 선형(Linear Complexity) 수준으로 압축하여 효율적인 사전학습을 가능케 합니다.
- 에이전트 기여: 뇌 전반의 장기적인 인지적 제어(Cognitive Control) 네트워크와 고차원 주의 집중(Attention Map) 상태 변화를 포착하여, 에이전트에게 뇌파 토큰 형태(
[BRAIN_TOKEN])로 풍부한 사고 상태 컨텍스트를 멀티모달 형태로 주입(Semantic Space Alignment)합니다.
3️⃣ Neural Field Modeling (NRF): Implicit Spatial Coding (클릭하여 열기)
🎯 Implicit Neural Representation (INR) 좌표 코딩
-
해상도 독립성: 복셀(voxel)이라는 기존의 이산 격자 볼륨 구조에서 완전히 탈피하여, 표준화된 3D MNI 공간 상의 임의 좌표
$(x, y, z)$ 와 Fourier Positional Encoding을 결합하여 연속 함수 형태로 신경 반응 표상을 구현합니다. - 에이전트 기여: 사용자의 시각적 관심 영역을 조밀한 연속 주의 집중 필드(Probability Potential Field)로 추출합니다. 이를 OSWorld 에이전트의 75% 실패 지점인 마우스 클릭 픽셀 오차(Grounding Refinement)를 보정하는 PPO(Proximal Policy Optimization) Copilot 제어 알고리즘과 융합하여 정밀 클릭을 보장합니다.
📊 LBM Slides Collection DB
| 슬라이드 번호 | 노션 카드 (ID) | 슬라이드 한글 제목 | 핵심 비주얼 장치 | 온톨로지 매핑 (Topic) |
|---|---|---|---|---|
| Slide 1 | lbm_agent_s1 |
LBM 기반 차세대 Agent AI 연동 전략 표지 | Cover Concept Map | ai_ml/ai_for_science |
| Slide 2 | lbm_agent_s2 |
현재 Agent AI의 3대 핵심 병목과 한계 | 3대 장벽 다이어그램 | ai_ml/ai_for_science |
| Slide 3 | lbm_agent_s3 |
DIVER: Spatio-temporal 뇌파 모델 아키텍처 | Permutation Block 구조도 | neuroscience/brain_imaging |
| Slide 4 | lbm_agent_s4 |
SwiFT & NRF 비교 분석 | Comparison Table | neuroscience/brain_imaging |
| Slide 5 | lbm_agent_s5 |
Brain-Agent Interface (BAI) 메타 인지 폐루프 | Closed-loop Flowchart | neuroscience/computational_neuro |
| Slide 6 | lbm_agent_s6 |
뇌-에이전트 융합 5개년 3단계 전략적 로드맵 | Timeline / Phase Board | ai_ml/ai_for_science |
- fMRI BOLD 지연 (4~6초) 장벽
- 🔴 한계: 뇌 혈류 속도 의존성으로 인해 실시간 즉각적 롤백이나 마우스 정밀 제어에 직접 활용하는 것은 원천적으로 불가능합니다.
- 🟢 타개안: 실시간 의도 분석 및 에러 복구는 EEG(DIVER) 밀리초 수준의 해상도를 사용하고, fMRI(SwiFT/NRF)는 장기적인 작업 인지 맥락 프로파일링 및 피로도 관리용으로 이원화합니다.
- EEG 신호의 극심한 근전도/움직임 노이즈 (Artifacts)
- 🔴 한계: 눈 깜빡임, 타이핑, 턱 움직임으로 인해 뇌파 신호대잡음비(SNR)가 기하급수적으로 저하됩니다.
- 🟢 타개안: BCI 신호를 타이핑 등의 직접 도구로 쓰기보다, 에이전트 루프의 중단/동의 및 취소 여부를 결정하는 '상위 메타 컨트롤러(Meta-Cognitive Controller)'에 국한하여 인지 스위치처럼 작동시킵니다.
- 에이전트 자체의 LLM 추론 지연 (Prefill Latency)
- 🔴 한계: 에이전트가 1스텝 계획 수립 시 수십 초가 소요되어 밀리초 EEG 반응의 실시간성이 희석됩니다.
- 🟢 타개안: 뇌파에서 실시간으로 감지된 사용자 인지 상태에 따라 OpenHands의 컨텍스트 요약 수준(Condensing Intensity)을 동적으로 조율하고, 서브 에이전트에 자율 위임하는 비율을 조절하여 전체 루프 속도를 조율합니다.
|
Passive Neuro-Adaptation
|
Active Shared Autonomy
|
Closed-loop Symbiotic Coding
|
본 포탈을 연구실 연구원들이 연구 및 글로벌 협업에 극대화하여 활용할 수 있도록 노션 요약 가이드북을 제공합니다!
Tip
💡 포탈 핵심 활용 시나리오 4가지
- 학회 발표 및 해외 협업 제안 시 시각적 프레젠테이션 활용 🖼️
- 6장의 프리미엄 16:9 슬라이드 인포그래픽이 인라인 탑재된 gallery.html 뷰어를 브라우저로 실행하여, 세미나나 Graham Neubig 교수팀과의 화상 회의 시 즉석 프리젠테이션 도구로 활용하세요!
- 신입 연구원 및 대학원생 온보딩 자동화 🎓
- 신규 연구 인력 유입 시 readme_claude.md와 docs/snu_connectome_student_handout.md 온보딩 실습을 넘겨주세요. RAG 노트북 사용부터 API 이메일 드래프트 연동까지 하루 만에 완벽히 셀프 학습이 가능합니다.
- 초고속 학술 연구 및 문헌 조사 가속화 (RAG Query) 🔬
- 330여 개의 AI/뇌과학 논문이 탑재된
lbm-agent지식베이스에서nlm query를 실행하여 문헌 조사 시간을 획기적으로 줄이고, 논문 및 특허의 논리 구조를 순식간에 보강하세요.
- 330여 개의 AI/뇌과학 논문이 탑재된
- 글로벌 석학 네트워킹 (Gmail API 연동) 📬
- docs/scripts/create_gmail_drafts.py를 구동하여, API 연동으로 갱신 완료된 지메일 임시보관함 초안들을 확인하고 정교한 글로벌 제안 메일을 원클릭으로 즉각 발송하세요.
🎓 Connectome Lab R&D 공지사항 연구실의 모든 대학원생 및 연구원은 저장소 루트의
readme_claude.md를 필독하고, snu_connectome_student_handout.md의 RAG 지식베이스 실습 및 Gmail API 드래프트 업로드 연동 실습을 마친 뒤 피드백을 제출해 주시기 바랍니다!
Chavis 올림 (Antigravity v2.0) 🎓✨
(Seoul National University Connectome Lab & Google DeepMind, 2026)
