BETA 안면부 피부질환 이미지 합성 데이터
- 분야헬스케어
- 유형 이미지
- 생성 방식합성데이터
※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-22 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-22 산출물 전체 공개 소개
얼굴에 호발하는 피부질환 진단 및 중증도 평가를 위한 고해상도 안면부 피부질환 이미지 합성 데이터 및 진단 데이터
구축목적
- 얼굴에 호발하는 염증성 피부질환 5종의 진단 보조 - 병변의 중증도를 판정하는 인공지능 알고리즘 개발
-
메타데이터 구조표 데이터 영역 헬스케어 데이터 유형 이미지 데이터 형식 이미지 : PNG 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(마스킹 이미지), 바운딩 박스, 임상정보 text 라벨링 형식 PNG, JSON 형식 데이터 활용 서비스 피부 질환 진단 보조 서비스 고도화 데이터 구축년도/
데이터 구축량2024년/원천데이터(총 1만 2천장), 라벨링 데이터(총 1만 2천장) -
데이터 구성
데이터 구축 규모
안면부 피부질환 이미지 합성데이터 총 1만 2천장(정상을 포함한 5개 질환)- 원천데이터(총 1만 2천장)
데이터 구성-데이터 구축 규모-원천데이터 클래스 방향 포맷 해상도 규모 건선 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 아토피 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 여드름 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 주사 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 지루 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 정상 정면 PNG 1024 x 1024 1천장 측면 PNG 512 x 512 1천장 ※ 방향 : 안면부를 기준이며, 정면 합성데이터는 안면부 전체를 포함, 측면의 경우 안면부 측면의 부분으로 구성.
- 라벨링 데이터(임상정보 1만 2천건, 병변 마스킹 이미지 5천장)
데이터 구성-데이터 구축 규모-라벨링데이터 클래스 방향 포맷 유형 규모 건선 정면 PNG 병변 마스킹 1천장 JSON 임상정보 1천건 측면 JSON 임상정보 1천건 아토피 정면 PNG 병변 마스킹 1천장 JSON 임상정보 1천건 측면 JSON 임상정보 1천건 여드름 정면 PNG 병변 마스킹 1천장 JSON 임상정보 1천건 측면 JSON 임상정보 1천건 주사 정면 PNG 병변 마스킹 1천장 JSON 임상정보 1천건 측면 JSON 임상정보 1천건 지루 정면 PNG 병변 마스킹 1천장 JSON 임상정보 1천건 측면 JSON 임상정보 1천건 정상 정면 PNG 임상정보 1천건 측면 JSON 임상정보 1천건 ※ 정면의 경우엔 안면부 전체를 포함하여 마스킹 이미지를 통하여 병변 부위를 특정함.
데이터 분포
- 질환별데이터 분포-질환별 클래스 방향 규모 비율(%) 건선 정면 1,000 8.33 측면 1,000 8.33 아토피 정면 1,000 8.33 측면 1,000 8.33 여드름 정면 1,000 8.33 측면 1,000 8.33 주사 정면 1,000 8.33 측면 1,000 8.33 지루 정면 1,000 8.33 측면 1,000 8.33 정상 정면 1,000 8.33 측면 1,000 8.33 합계 12,000 100% - 임상정보 속성별 (정면 6,000 건만 해당하며 측면 6,000 건 제외)
데이터 분포-임상정보 속성별1 성별 클래스 방향 규모 비율(%) 합계(%) 남 건선 정면 706 11.77 50.87
(3,052 건)측면 - - 아토피 정면 683 11.38 측면 - - 여드름 정면 444 7.4 측면 - - 주사 정면 273 4.55 측면 - - 지루 정면 484 8.07 측면 - - 정상 정면 462 7.7 측면 - - 여 건선 정면 294 4.9 49.13
(2,948 건)측면 - - 아토피 정면 317 5.28 측면 - - 여드름 정면 556 9.27 측면 - - 주사 정면 727 12.12 측면 - - 지루 정면 516 8.6 측면 - - 정상 정면 538 8.97 측면 - - 합계 6,000 100% 데이터 분포-임상정보 속성별2 나이대 클래스 방향 규모 비율(%) 합계(%) 0-5 건선 정면 1 0.02 8.25
(495 건)측면 - - 아토피 정면 355 5.92 측면 - - 여드름 정면 - - 측면 - - 주사 정면 - - 측면 - - 지루 정면 4 0.07 측면 - - 정상 정면 135 2.25 측면 - - 6-11 건선 정면 35 0.58 4.72
(283 건)측면 - - 아토피 정면 78 1.3 측면 - - 여드름 정면 18 0.3 측면 - - 주사 정면 1 0.02 측면 - - 지루 정면 1 0.02 측면 - - 정상 정면 150 2.5 측면 - - 12-18 건선 정면 73 1.22 7.92
(475 건)측면 - - 아토피 정면 147 2.45 측면 - - 여드름 정면 163 2.72 측면 - - 주사 정면 9 0.15 측면 - - 지루 정면 32 0.53 측면 - - 정상 정면 51 0.85 측면 - - 6-18 건선 정면 - - 3.4
(204 건)측면 - - 아토피 정면 122 2.03 측면 - - 여드름 정면 80 1.33 측면 - - 주사 정면 - - 측면 - - 지루 정면 2 0.03 측면 - - 정상 정면 - - 측면 - - 19-29 건선 정면 298 4.97 27.33
(1,640 건)측면 - - 아토피 정면 197 3.28 측면 - - 여드름 정면 611 10.18 측면 - - 주사 정면 97 1.62 측면 - - 지루 정면 200 3.33 측면 - - 정상 정면 237 3.95 측면 - - 30-39 건선 정면 262 4.37 18.55
(1,113 건)측면 - - 아토피 정면 78 1.3 측면 - - 여드름 정면 116 1.93 측면 - - 주사 정면 157 2.62 측면 - - 지루 정면 223 3.72 측면 - - 정상 정면 277 4.62 측면 - - 49-49 건선 정면 194 3.23 12.63
(758 건)측면 - - 아토피 정면 23 0.38 측면 - - 여드름 정면 11 0.18 측면 - - 주사 정면 226 3.77 측면 - - 지루 정면 217 3.62 측면 - - 정상 정면 87 1.45 측면 - - 59-59 건선 정면 79 1.32 9.68
(581 건)측면 - - 아토피 정면 - - 측면 - - 여드름 정면 - - 측면 - - 주사 정면 281 4.68 측면 - - 지루 정면 178 2.97 측면 - - 정상 정면 43 0.72 측면 - - 69-69 건선 정면 40 0.67 4.9
(294 건)측면 - - 아토피 정면 - - 측면 - - 여드름 정면 1 0.02 측면 - - 주사 정면 151 2.52 측면 - - 지루 정면 90 1.5 측면 - - 정상 정면 12 0.2 측면 - - 79-79 건선 정면 15 0.25 2.35
(141 건)측면 - - 아토피 정면 - - 측면 - - 여드름 정면 - - 측면 - - 주사 정면 74 1.23 측면 - - 지루 정면 44 0.73 측면 - - 정상 정면 8 0.13 측면 - - 80+ 건선 정면 3 0.05 0.27
(16 건)측면 - - 아토피 정면 - - 측면 - - 여드름 정면 - - 측면 - - 주사 정면 4 0.07 측면 - - 지루 정면 9 0.15 측면 - - 정상 정면 - - 측면 - - 합계 6,000 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드● 이미지 분류 (6종 이미지 분류)
활용 지표: 유효성 및 유용성
* AI 모델 : DenseNet- 2017년에 Microsoft Research에서 고안된 모델로, ResNet과 Pre-Activation ResNet보다 적은 파라미터 수로 더 높은 성능을 가짐.
- 대규모 이미지 데이터 셋에서 깊은 신경망을 효과적으로 학습시킬 수 있는 능력으로 인해 많은 컴퓨터 비전 과제에서 성공적으로 적용되고 있음.
- 개발언어 및 프레임워크 확인DenseNet 개발언어 및 프레임 워크 품질특성 TASK 명 모델명 개발언어 프레임워크 유효성 피부질환 진단(분류) DenseNet121 python Pytorch 2.3.1 - 데이터 학습 모델 및 학습 조건 확인
데이터 학습 모델 및 학습 조건 확인 품질특성 TASK 명 모델명 학습데이터 비율 학습조건 유효성 피부질환 진단(분류) DenseNet121 8:1:1 image_size = 256
batch_size = 32
learning_rate = 0.001
dropout_rate = 0.5
num_epochs = 11
optimizer = ADAM
서비스 활용 시나리오구축한 모델은 환자의 피부과 진료 지원과 연구 및 데이터 분석에 활용할 수 있음.
피부과 진료지원
● 진단 보조 도구로 활용: 병변 이미지를 분석해 6가지 안면부 병변 유형을 분류하고, 진단과 치료 결정을 보조.
● 원격 진료 서비스에 적용: 모바일로 업로드된 안면부 이미지를 분석하여 병변 유형과 심각도를 평가하고, 전문의 상담 여부를 안내.
● 경과 모니터링 및 사전 예방: 병변의 변화를 주기적으로 추적하여 이상 징후를 조기에 감지하고 사용자와 의료진에게 알림.연구 및 데이터 분석
● 안면부 병변 통계 분석: 분류된 데이터를 기반으로 병변 발생률과 경향을 분석하여 특정 연령대 및 지역의 피부 건강 현황을 파악.
● 모델의 학습 데이터 확장: 합성 데이터를 통해 학습 범위를 확장하고, 드문 병변 유형에서도 일관된 성능을 유지하도록 개선.기타정보
대표성
● 실제 데이터와 유사한 합성 데이터를 활용해 안면부 병변의 분류와 경계 분할 성능을 극대화했으며, 병변의 유형, 크기, 색상 및 경계 등 주요 특징을 정밀하게 반영하여 높은 정확도를 제공.차별점
● 합성 데이터를 기반으로 실제 데이터가 부족한 환경에서도 안정적이고 일관된 성능을 발휘하며, 드문 병변 사례와 복잡한 환경에서도 병변의 유형과 경계를 정밀하게 분석하여 다양한 임상적 적용 가능성을 보장. -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드안면부 피부질환 이미지 합성데이터셋은 원천데이터로 합성된 안면부 정면 전체 이미지와 안면부 측면의 부분 이미지와 안면부 정면 전체 이미지의 경우엔 정상 피부 및 배경이 존재하여 병변 부위를 특정할 수 있도록 Annotation한 마스킹 이미지로 구성되어 있으며 임상정보를 포함한 라벨링 데이터로 구성됨
● 데이터 구성데이터 구성 구분 Key Description Type Child Type 1 annotations 어노테이션 배열 JsonArray JsonObject 1-1 identifier 식별자 string 1-2 diagnosis_info 피부질환정보 JsonObject 1-2-1 diagnosis_name 피부질환명 string 1-2-2 onset 발병시기 string 1-2-3 distribution 병변분포 string 1-2-4 bodypart 신체부위 string 1-2-5 symptom 증상 string 1-2-6 easi_score 아토피 이지스코어 정보 JsonObject 1-2-6-1 iga_grade 중증도 단계 string 1-2-6-2 erythema 홍반 string 1-2-6-3 papulation 구진 string 1-2-6-4 excoriation 줄까짐 string 1-2-6-5 lichenification 태선화 string 1-3 desc 피부질환 설명 string 1-4 generated_parameters 합성관련 변수 정보 JsonObject 1-4-1 gender 성별 string 1-4-2 age_rance 연령대 string 1-4-3 race 인종 string 1-5 photograph 사진정보 JsonObject 1-5-1 file_path 이미지 파일경로 string 1-5-2 width 이미지 가로크기 int 1-5-3 height 이미지 세로크기 int 1-6 bbox 라벨링 정보 JsonObject 1-6-1 xpos x 좌표 int 1-6-2 ypos y 좌표 int 1-6-3 file_path 이미지 파일경로 string 1-6-4 width 이미지 가로크기 int 1-6-5 height 이미지 세로크기 int 1-7 lesion_area 병변영역 이미지경로 string 1-8 lesions 여드름 상세 레이블링 JsonArray JsonObject 1-8-1 xpos x좌표 int 1-8-2 ypos y좌표 int 1-8-3 width 가로크기 int 1-8-4 height 세로크기 int 1-8-5 inflammatory 염증/비염증 여부 boolean ● 어노테이션 포맷
어노테이션 포맷 구분 항목명 Type Required 비고 한글명 영문명 1 어노테이션 배열 annotations JsonArray Yes 1-1 식별자 identifier string Yes 1-2 피부질환정보 diagnosis_info JsonObject Yes 1-2-1 피부질환명 diagnosis_name string Yes 1-2-2 발병시기 onset string No 1-2-3 병변분포 distribution string No 1-2-4 신체부위 bodypart string No 1-2-5 증상 symptom string No 1-2-6 아토피 이지스코어 정보 easi_score JsonObject No 아토피만 해당 1-2-6-1 중증도 단계 iga_grade string No 1-2-6-2 홍반 erythema string No 1-2-6-3 구진 papulation string No 1-2-6-4 줄까짐 excoriation string No 1-2-6-5 태선화 lichenification string No 1-3 피부질환 설명 desc string Yes 1-4 합성관련 변수 정보 generated_parameters JsonObject Yes 1-4-1 성별 gender string Yes 1-4-2 연령대 age_rance string Yes 1-4-3 인종 race string Yes 1-5 사진정보 photograph JsonObject No 1-5-1 이미지 파일경로 file_path string No 1-5-2 이미지 가로크기 width int No 1-5-3 이미지 세로크기 height int No 1-6 라벨링 정보 bbox JsonObject Yes 1-6-1 x 좌표 xpos int Yes 1-6-2 y 좌표 ypos int Yes 1-6-3 이미지 파일경로 file_path string Yes 1-6-4 이미지 가로크기 width int Yes 1-6-5 이미지 세로크기 height int Yes 1-7 병변영역 이미지경로 lesion_area string No 정면만 해당 1-8 여드름 상세 레이블링 lesions JsonArray No 여드름만 해당 1-8-1 x좌표 xpos int No 1-8-2 y좌표 ypos int No 1-8-3 가로크기 width int No 1-8-4 세로크기 height int No 1-8-5 염증/비염증 여부 inflammatory boolean No ● 이미지 데이터 포맷
이미지 데이터 포맷 합성 이미지 마스킹 이미지 포맷 PNG PNG 예시 ● 라벨링 데이터 포맷
라벨링 데이터 포맷 어노테이션 포맷 JSON 예시 {
"annotations": [
{
"identifier": "H0_17717_P2_L0",
"diagnosis_info": {
"diagnosis_name": "여드름",
"onset": "수 년 전",
"distribution": "부분 침범",
"bodypart": "얼굴",
"symptom": "none",
"desc": "면포와 구진, 농포, 결절 등으로 나타나는 피지선과 모낭의 만성질환"
},
"generated_parameters": {
"gender": "여",
"age_range": "19-29",
"bodypart": "얼굴",
"race": "황인"
},
"photograph": {
"file_path": "여드름/정면/H0_17717_P2_L0.png",
"width": 1024,
"height": 1024
},
"bbox": {
"xpos": 0,
"ypos": 0,
"file_path": "여드름/정면/H0_17717_P2_L0.png",
"width": 1024,
"height": 1024,
"lesion_area": "여드름/정면/lesion_area/H0_17717_P2_L0.png",
"lesions": [
{
"xpos": 525,
"ypos": 642,
"width": 17,
"height": 17,
"inflammatory": false
}
]
}
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : 서울대학교 산학협력단
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 나정임 031-787-7314 jina1@snu.ac.kr 주관업무 총괄, 데이터 수집/정제/가공/검수, 모델개발 수행기관(참여)
수행기관(참여) 기관명 담당업무 에스큐아이소프트(주) 저작/검수 도구 개발/운영 및 품질관리 충남대학교 산학협력단 합성데이터 생성 한림대학교 산학협력단 데이터 수집, 정제, 검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 나정임 031-787-7314 jina1@snu.ac.kr 조민우 02-2072-4291 windsblues@snu.ac.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 나정임 031-787-7314 jina1@snu.ac.kr 조민우 02-2072-4291 windsblues@snu.ac.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 임광섭 02-2284-3341 wthlord@sqisoft.com 류승근 02-2284-3341 harushogo@sqisoft.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.