민지영 (JIYOUNG MIN)

Medical Data Scientist

Email, Github, LinkedIn

EDUCATION


  • [석사] 성균관대학교 – 디지털헬스학과, 삼성융합의과학원

    2019.03 - 2021.02

    • Smart Health Lab.
      연구실에서 의료기관에서 발생한 다양한 종류의 의료 데이터를 분석하고, 머신러닝 기반의 예측 및 진단 모델을 개발함


  • [학사] 인천대학교 – 전자공학과

    2013.02 - 2019.02

    • 전자공학과 수석 졸업

    • Bioelectronics Lab.
      연구실에서 심전도(ECG), 근전도(EMG) 생체신호를 수집하고, time & frequency-domain에서 전처리 및 분석을 수행함


WORK EXPERIENCE


  • 인천대학교 – 산학협력단 연구원

    2021.01 - 현재

    • 실험자로부터 센서를 통해 직접 근전도(EMG) 생체신호를 수집하고, 이를 활용하여 복잡한 손동작을 실시간으로 인식할 수 있는
      machine learning 기반의 모델을 개발하는 연구를 수행 중임

    • 주요 역할
      신호 데이터의 노이즈 제거, 최적 time window 서치 및 구현, feature 추출, 머신러닝 모델 개발 등의 연구를 수행함


  • 삼성서울병원 – 과제 수행 연구원

    2018.11 - 2020.12

    • 다양한 종류의 EHR (Electronic Health Record) 데이터를 CDW (Clinical Data Warehouse)에서 추출 및 분석하고,
      의사 및 환자들의 의사결정을 돕는 machine learning 기반의 CDS (Clinical Decision Support) 모델을 개발함

    • 주요 역할

      데이터 클리닝: 연구 조건에 맞는 데이터를 추출하고 text mining을 통해 필요한 정보 추출, 중복 데이터 제거, outlier 처리,
      데이터 타입 변환 등의 일을 수행

      데이터 전처리: 분석 및 모델 개발에 사용될 데이터를 구성하기 위해, 다양한 종류의 테이블을 병합 및 처리하여 예측 변수 생성,
      time-series dataset 구축 등의 일을 수행

      데이터 분석 및 시각화: 데이터의 pattern, trend, outlier 분석 및 통계 분석을 통해 data-driven knowledge와 insight 제공

      모델 개발: 전통적인 machine learning 기반의 예측 및 진단 모델 개발
      (XGBoost, Random forest, Support vector machine, Logistic Regression, ANN 기반)


KEY SKILLS


  • Python: 모델링 수행
  • R: 데이터 분석, 전처리, 통계 분석, 시각화 수행
  • SQL (PostgreSQL): DB 구축 및 조회 수행


CIRTIFICATION


  • Tensorflow Developer Certification

    Issuing Organization: Google Developers , Issued 2020.11


EDUCATION CIRTIFICATION


  • Google Developer Machine Learning BootCamp

    Issuing Organization: Google Developers , Issued 2021.01

  • Deep Learning Specialization

    Issuing Organization: Coursera , Issued 2020.12

  • 의료 인공지능 전문가 양성과정 수료증

    Issuing Organization: 한국보건복지 인력개발원 , Issued 2020.12


PUBLICATION & PRESENTATION


[Big Data Analysis] Publication


[Machine Learning] Publication

Symposium Presentation

  • Development of a detection algorithm for unusual High-alert medication-order

    Presenter, The Medical Informatics Europe (MIE) (Oral presentation, accepted)


NATIONAL PROJECT


  • [산업통상자원부] CDM 기반의 지능형 진료 가이드 알고리즘 개발과 확산을 위한 CDSS 플랫폼 개발

    • 연구 참여 기간: 2019.01 – 2020.12 (1, 2차 년도 연구 담당)

    • 담당 주제: 삼성서울병원의 의료데이터를 활용하여, 실수로 잘못 처방될 시 심각한 결과를 초래할 수 있는 고위험약물의
      이상 처방을 감지하는 머신러닝 기반 모델 개발

    • 업무 내용:

    1. Study design
      Case & control, inclusion & exclusion criteria 설계 논의

    2. CDW 에서 데이터 추출

    3. IRB 취득

    4. Mini CDM (Common Data Model) 데이터 구축 (삼성서울병원 CDM 데이터 ETL rule 기반)

    5. 데이터 전처리 – 분석 및 모델 인풋에 사용할 데이터셋 구축 데이터 클리닝 수행, EDA 수행 (table과 figure로 변수 간의 상관성, 데이터 trend, pattern, outlier 요약)
      다양한 데이터 조인 및 예측 변수 생성 (약물 처방 데이터, 랩 검사 데이터, 활력징후 데이터, 상병 데이터, 병원 입 퇴원 및 진료 데이터 활용), 결측 처리 (single, multiple imputation etc.) 등

    6. 모델 개발 Python의 Tensorflow를 사용하여 ANN 모델 개발 (structure: 5-layer neural network, regularization: L2, dropout, tuning with early stopping method, learning rate decay)


  • [보건복지부] 응급, 중환자 대상 범국가적 의료 품질의 지속적 향상을 위한 CDM, FHIR, AI 기반의 정밀의료 플랫폼 구현 및 활용정책 개발

    • 연구 참여 기간: 2019.06 – 2019.12 (1차 년도 연구 참여)

    • 담당 주제: 삼성서울병원의 의료데이터를 활용하여, 중환자실에서 발생하는 비계획적 발관 (unplanned extubation)을 예측하는 머신러닝 기반 모델 개발

    • 업무 내용:

    1. Study design
      Case & control, inclusion & exclusion criteria 설계 논의

    2. 데이터 전처리 – 분석 및 모델 인풋에 사용할 데이터셋 구축
      데이터 클리닝 수행 (중복 제거, 간호기록에서 text mining을 통해 정보 추출, 데이터 타입 변환),
      EDA 수행 (변수간 correlation 분석, Sankey diagram 활용 전체 흐름 시각화, 통계 기반 logistic regression 수행
      risk factor 분석, table과 figure로 데이터 trend, pattern, outlier 요약),
      ICU critical care flow sheet 기반 time-series dataset 구성 및 feature 추출 (min, max, mean, variation etc.)
      결측 처리 (carry-forward, single imputation 활용), data imbalance handling (smote기법 활용, under-sampling) 등

    3. 모델 개발 Python의 Scikit learn, Tensorflow를 사용하여 comparative machine learning study (ANN, RF, SVM, LR 비교) 진행