7차시 Data Science for Infectious Disease Response

감염병 대응을 위한 데이터 사이언스

Imported case prediction, COVID-EENet, digital contact tracing, POI reconstruction을 중심으로 감염병 대응 데이터 사이언스를 정리합니다.

07. Data Science for Infectious Disease Response

3줄 요약

Instructor

KAIST 전산학부 이재길 교수 Jae-Gil Lee Professor School of Computing, KAIST

Core Flow

Infectious Disease Data Science -> Imported Case Prediction -> Infection Risk -> Inbound Flow -> Hi-COVIDNet -> Transformer / LSTM -> Economic-Epidemiological Modeling -> COVID-EENet -> District-Business Pair -> Microscopic Encoder -> Macroscopic Aggregator -> Digital Contact Tracing -> Cellular Trajectory -> POI Reconstruction -> Pincette -> Efficiency / Periodicity / Popularity View -> Privacy-Preserving Data Science

Visual Notes

검역, 지역경제, 역학조사 사례를 복습용 문제 구조와 데이터 흐름으로 다시 그린다.

Notes

Imported Case Prediction은 해외에서 유입될 확진자 수와 추세를 예측하는 task다. 감염병이 해외 유입으로 시작될 수 있기 때문에 제한된 검역 자원을 어디에 배치할지 판단하려면 국가별 감염 위험과 국내 유입량을 함께 봐야 한다.

Hi-COVIDNet은 country-level representation과 continent-level representation을 구성한다. Country-level encoder는 감염 추세와 유입 흐름을 결합하고, Transformer와 LSTM을 통해 위험한 시점과 시간적 추세를 반영한다.

COVID-EENet은 Fine-Grained Economic-Epidemiological Modeling을 목표로 한다. 경제 활동 데이터와 집단감염 데이터를 결합해 district-business pair 단위의 매출 변화 추세를 예측한다. Economy-view, Geography-view, Epidemic-view feature가 함께 사용된다.

Digital Contact Tracing 영역에서는 기지국 궤적처럼 거친 위치 데이터에서 실제 방문 POI를 재구성하려 한다. Pincette는 사람들이 효율적인 이동 경로를 선호한다는 Efficiency View, 반복 방문 패턴을 보는 Periodicity View, 인기 장소를 반영하는 Popularity View를 함께 활용한다.

현재 활용 관점

감염병 대응은 예측 정확도만으로 충분하지 않다. 데이터가 사람의 이동, 소비, 건강 위험과 연결되기 때문에 목적 제한, 데이터 최소 수집, 익명화, 설명 가능성, 사후 검증이 함께 필요하다.

사전 학습 체크포인트

개념먼저 알고 있으면 좋은 이유
Spatio-Temporal Data감염 위험은 시간과 공간을 동시에 따라 움직인다
Transformer / LSTM감염 추세와 유입 흐름의 시간 의존성을 모델링한다
Feature Engineering경제, 지리, 감염병 관점을 분리해 입력 feature를 만든다
POI Reconstruction거친 위치 신호에서 실제 방문 장소를 추정한다
Privacy-Preserving Data Science감염병 대응 데이터는 공익과 개인 권리의 균형이 중요하다

Reflection