※온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
신장암 진단 의료 영상
- 분야헬스케어
- 구분 안심존(온라인)
- 유형 비디오 , 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021-06-30 데이터 최초 개방 소개
신장암 진단 및 치료 과정에서 필요한 영상·이미지 데이터
구축목적
신장암을 자동으로 검출할 수 있도록 인공지능을 훈력하기 위한 데이터셋
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 비디오 , 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/60만 -
구축 내용 및 제공 데이터량
- 1. 신장암 데이터1 – 수술전 CT 영상 216,000 장 이상 (신장암 수술 환자 영상 진단, 예후 예측용)
- 2. 신장암 데이터2 – 소형신종양 CT 영상 216,000 장 이상 (신장암 의심 환자 감별 진단용 – 악성/양성)
- 3. 신장암 데이터3 – 부신 CT 영상 40,000장 이상 (부신 측량 및 질환 감별 진단용)
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 종양 영역 예측 정확도 Prediction Resnet34 Accuracy 90 % 99.73 % 2 신부신암 영역 검출 Object Detection Resnet34 Accuracy 90 % 99.95 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.30 데이터 최초 개방 구축 목적
- 신장암을 자동으로 검출할 수 있도록 인공지능을 훈력하기 위한 데이터셋
활용 분야
- Healthcare 분야에서 정확하고 빠르게 암 병변을 검출하고 양/악성 여부를 판단해줄 수 있는 AI 요약기술 개발
소개
- 신장암 전향적 코흐트를 기반으로 한 임상정보, 의료영상, 수술 동영상 등 다차원 (multidimensional)의 다양한 인공지능 학습용 AI데이터셋을 구축하고, 이를 활용한 AI 모델과 서비스를 제시. 데이터의 외적검증 (external validation)을 위해 다기관 데이터를 같이 축적하여 데이터셋으로 구축.
그림1. 전향적 코호트 데이터 수집 및 다기관 데이터 수집 개요도
구축 내용 및 제공 데이터량
- 1. 신장암 데이터1 – 수술전 CT 영상 216,000 장 이상 (신장암 수술 환자 영상 진단, 예후 예측용)
- 2. 신장암 데이터2 – 소형신종양 CT 영상 216,000 장 이상 (신장암 의심 환자 감별 진단용 – 악성/양성)
- 3. 신장암 데이터3 – 부신 CT 영상 40,000장 이상 (부신 측량 및 질환 감별 진단용)
대표도면
<그림2. 신장암 환자 CT영상과 레이블링 겨로가 (연두색) 예시>
필요성
- 최근 신장암의 발견은 증상으로 인한 진단보다는 건강 검진에서 우연히 발견되고 조기 진단되는 경우가 대다수임. CT 검사에서 우연히 발견되는 신장 종괴는 판독을 통해 신장암 의증 여부가 결정되고, 신장 전절제술 혹은 신장 부분절제술의 수술적 치료를 진행하게 됨. CT 검사의 판독 결과의 정확성이 신장암의 진단에 중요한 비중을 차지하고 있음
- 최근 건강검진의 증가로 신장암의 조기 진단 빈도가 높아지고 있음. 또한 신장은 후복막강 심부에 위치하고 있고, 늑골과 다른 장기로 인해 접근이 어려운 문제가 있어 조직검사가 어렵거나 조직검사에서 위음성이 나오는 경우가 있어 수술 전 조직검사의 적용은 어려움이 있음. 이에 현재 대부분 신장암의 수술은 술 전 영상의학적 진단에 의존하여 결정되고 있으나 아직까지 몇 가지 개선되지 못한 문제점이 있음
- 부신과형성증은 장기간 호르몬의 자극으로 인해 이차적으로 부신의 피질이 증식하는 것을 의미하여 쿠싱 증후군, 이소성 ACTH 증후군, 일차적 알도스테론증 등의 질환에서 나타날 수 있음. 부신과형성증은 크게 ACTH 의존성, ACTH 비의존성, 선천성 부신과형성증 3가지로 나눌 수 있으며 대개 혈청 호르몬 수치 측정을 통한 임상적인 진단으로 확진됨. 영상학적으로는 정상 부신 형태를 유지하면서 광범위한 피질의 비대로 나타나는 경우가 제일 흔하나 대결절성/소결절성 비대로 나타나는 경우도 있음
데이터 구조
- 데이터 구성
- 제공하고자 하는 데이터는 원천데이터 (.dcm), 그리고 레이블링 데이터와 임상정보를 결합시킨 어노테이션 데이터 (.json)의 두가지 형태로 제공
- 어노테이션 포맷
어노테이션 포맷 No 항목 길이 타입 필수여부 비고 한글명 영문명 1 공통임상정보 Clinical Information (Global) Object Y 1-1 나이 Clinical Information (Global).age 1000 String Y 1-2 키 Clinical Information (Global).height 1000 String N 1-3 몸무게 Clinical Information (Global).weight 1000 String N 1-4 성별 Clinical Information (Global).gender 1000 String Y 1-5 종양 위치 Clinical Information (Global).laterality 1000 String Y Rt/Lt 1-6 CT 시행일 Clinical Information (Global).CT date 1000 String Y 병리 T 병기 Clinical Information (Global).pathologic T stage 1000 String Y T1a/T1b/
T2a/T2b/
T3a/T3b/
T3c/T4수술 시행일 Clinical Information (Global).operation date 1000 String Y 2 영역별 정보 Clinical Information (Local) Object Y 2-1 좌측 신장 Clinical Information (Local).left kidney Object Y 2-1-1 부피 Clinical Information (Local).left kidney.
Volume(mm³)1000 String N 2-1-2 조직학적 분류 Clinical Information (Local).left kidney.
histologic type1000 String N dummy
variable2-1-3 신장 크기 Clinical Information (Local).left kidney.size 1000 String N dummy
variable2-1-4 종양 핵 분화도 Clinical Information (Local).left kidney.
Fuhrmann nuclear grade1000 String N dummy
variable2-2 우측 신장 Clinical Information (Local).right kidney Object Y 2-2-1 부피 Clinical Information (Local).right kidney.
>Volume(mm³)1000 String N 2-2-2 조직학적 분류 Clinical Information (Local).right kidney.
histologic type1000 String N dummy
variable2-2-3 신장 크기 Clinical Information (Local).right kidney.size 1000 String N dummy
variable2-2-4 종양 핵 분화도 Clinical Information (Local).right kidney.
Fuhrmann nuclear grade1000 String N dummy
variable2-2 좌측 종괴 Clinical Information (Local).left mass Object N 2-2-1 부피 Clinical Information (Local).left mass.
Volume(mm³)1000 String N 2-2-2 조직학적 분류* Clinical Information (Local).left mass.
histologic type1000 String Y chr,pp 2-2-3 종괴 크기 Clinical Information (Local).left mass.size 1000 String Y 2-2-4 종양 핵 분화도 Clinical Information (Local).left mass.
Fuhrmann nuclear grade1000 String Y 2-3 우측 종괴 Clinical Information (Local).right mass Object N 2-3-1 부피 Clinical Information (Local).right mass.
Volume(mm³)1000 String N 2-3-2 조직학적 분류* Clinical Information (Local).right mass.
histologic type1000 String Y chr,pp 2-3-3 종괴 크기 Clinical Information (Local).right mass.size 1000 String Y 2-3-4 종양 핵 분화도 Clinical Information (Local).right mass.
Fuhrmann nuclear grade1000 String N 3 영역좌표 roi_list Object 3-1 좌측 신장 roi_list.left kidney[] - List Y 좌표 (x,y,z) 3-2 우측 신장 roi_list.right kidney[] - List Y 좌표 (x,y,z) 3-3 좌측 종괴 roi_list.left mass[] - List N 좌표 (x,y,z) 3-4 우측 종괴 roi_list.right mass[] - List N 좌표 (x,y,z) (조직학적 분류* – RCC : renal cell carcinoma; chr : chromophobe RCC; pp : papillary RCC)
<표 1 어노테이션 포맷 예시 (수술 받은 환자의 수술 전 CT 영상에서의 종양의 레이블링 정보와 임상정보가 결합된 json 형태의 속성값 예시)>
-
데이터셋 구축 담당자
수행기관(주관) : 서울대학교병원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김영곤 02-2072-4487 younggon2.kim@gmail.com · 원문 데이터 확보 및 제공 · 데이터 품질 검증 총괄 · 데이터 품질 품질 1,2차 검수 · AI 모델 개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 부산대병원 · 원문 데이터 확보 및 제공
· 데이터 품질 1,2차 검수서울특별시 보라매병원 · 원문 데이터 확보 및 제공
· 데이터 품질 검증서르 · 레이블링 툴 제공
· 데이터 1차 가공SQI 소프트 · 웹기반 응용 서비스 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 정창욱(서울대학교병원) 02-2072-3899 drboss@snu.ac.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.