콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#헬스케어 의료

BETA 안면부 피부질환 이미지 합성 데이터

안면부 피부질환 이미지 합성데이터 아이콘 이미지
  • 분야헬스케어
  • 유형 이미지
  • 생성 방식합성데이터
구축년도 : 2024 갱신년월 : 2025-04 조회수 : 305 다운로드 : 32 용량 :

※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2025-04-22 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2025-04-22 산출물 전체 공개

    소개

    얼굴에 호발하는 피부질환 진단 및 중증도 평가를 위한 고해상도 안면부 피부질환 이미지 합성 데이터 및 진단 데이터

    구축목적

    - 얼굴에 호발하는 염증성 피부질환 5종의 진단 보조 
    - 병변의 중증도를 판정하는 인공지능 알고리즘 개발
  • 데이터 구성
    데이터 구축 규모
    안면부 피부질환 이미지 합성데이터 총 1만 2천장(정상을 포함한 5개 질환)

     

    - 원천데이터(총 1만 2천장)

    데이터 구성-데이터 구축 규모-원천데이터
    클래스 방향 포맷 해상도 규모
    건선 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장
    아토피 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장
    여드름 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장
    주사 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장
    지루 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장
    정상 정면 PNG 1024 x 1024 1천장
    측면 PNG 512 x 512 1천장

    ※ 방향 : 안면부를 기준이며, 정면 합성데이터는 안면부 전체를 포함, 측면의 경우 안면부 측면의 부분으로 구성.

     

    - 라벨링 데이터(임상정보 1만 2천건, 병변 마스킹 이미지 5천장)

    데이터 구성-데이터 구축 규모-라벨링데이터
    클래스 방향 포맷 유형 규모
    건선 정면 PNG 병변 마스킹  1천장
    JSON 임상정보 1천건
    측면 JSON 임상정보 1천건
    아토피 정면 PNG 병변 마스킹 1천장
    JSON 임상정보 1천건
    측면 JSON 임상정보 1천건
    여드름 정면 PNG 병변 마스킹 1천장
    JSON 임상정보 1천건
    측면 JSON 임상정보 1천건
    주사 정면 PNG 병변 마스킹 1천장
    JSON 임상정보 1천건
    측면 JSON 임상정보 1천건
    지루 정면 PNG 병변 마스킹  1천장
    JSON 임상정보 1천건
    측면 JSON 임상정보 1천건
    정상 정면 PNG 임상정보 1천건
    측면 JSON 임상정보 1천건

    ※ 정면의 경우엔 안면부 전체를 포함하여 마스킹 이미지를 통하여 병변 부위를 특정함.

     

    데이터 분포
    - 질환별

    데이터 분포-질환별
    클래스 방향 규모 비율(%)
    건선 정면 1,000 8.33
    측면 1,000 8.33
    아토피 정면 1,000 8.33
    측면 1,000 8.33
    여드름 정면 1,000 8.33
    측면 1,000 8.33
    주사 정면 1,000 8.33
    측면 1,000 8.33
    지루 정면 1,000 8.33
    측면 1,000 8.33
    정상 정면 1,000 8.33
    측면 1,000 8.33
    합계 12,000 100%

     

    - 임상정보 속성별 (정면 6,000 건만 해당하며 측면 6,000 건 제외)

    데이터 분포-임상정보 속성별1
    성별 클래스 방향 규모 비율(%) 합계(%)
    건선 정면 706 11.77 50.87
    (3,052 건)
    측면 - -
    아토피 정면 683 11.38
    측면 - -
    여드름 정면 444 7.4
    측면 - -
    주사 정면 273 4.55
    측면 - -
    지루 정면 484 8.07
    측면 - -
    정상 정면 462 7.7
    측면 - -
    건선 정면 294 4.9 49.13
    (2,948 건)
    측면 - -
    아토피 정면 317 5.28
    측면 - -
    여드름 정면 556 9.27
    측면 - -
    주사 정면 727 12.12
    측면 - -
    지루 정면 516 8.6
    측면 - -
    정상 정면 538 8.97
    측면 - -
    합계 6,000 100%

     

    데이터 분포-임상정보 속성별2
    나이대 클래스 방향 규모 비율(%) 합계(%)
    0-5 건선 정면 1 0.02 8.25
    (495 건)
    측면 - -
    아토피 정면 355 5.92
    측면 - -
    여드름 정면 - -
    측면 - -
    주사 정면 - -
    측면 - -
    지루 정면 4 0.07
    측면 - -
    정상 정면 135 2.25
    측면 - -
    6-11 건선 정면 35 0.58 4.72
    (283 건)
    측면 - -
    아토피 정면 78 1.3
    측면 - -
    여드름 정면 18 0.3
    측면 - -
    주사 정면 1 0.02
    측면 - -
    지루 정면 1 0.02
    측면 - -
    정상 정면 150 2.5
    측면 - -
    12-18 건선 정면 73 1.22 7.92
    (475 건)
    측면 - -
    아토피 정면 147 2.45
    측면 - -
    여드름 정면 163 2.72
    측면 - -
    주사 정면 9 0.15
    측면 - -
    지루 정면 32 0.53
    측면 - -
    정상 정면 51 0.85
    측면 - -
    6-18 건선 정면 - - 3.4
    (204 건)
    측면 - -
    아토피 정면 122 2.03
    측면 - -
    여드름 정면 80 1.33
    측면 - -
    주사 정면 - -
    측면 - -
    지루 정면 2 0.03
    측면 - -
    정상 정면 - -
    측면 - -
    19-29 건선 정면 298 4.97 27.33
    (1,640 건)
    측면 - -
    아토피 정면 197 3.28
    측면 - -
    여드름 정면 611 10.18
    측면 - -
    주사 정면 97 1.62
    측면 - -
    지루 정면 200 3.33
    측면 - -
    정상 정면 237 3.95
    측면 - -
    30-39 건선 정면 262 4.37 18.55
    (1,113 건)
    측면 - -
    아토피 정면 78 1.3
    측면 - -
    여드름 정면 116 1.93
    측면 - -
    주사 정면 157 2.62
    측면 - -
    지루 정면 223 3.72
    측면 - -
    정상 정면 277 4.62
    측면 - -
    49-49 건선 정면 194 3.23 12.63
    (758 건)
    측면 - -
    아토피 정면 23 0.38
    측면 - -
    여드름 정면 11 0.18
    측면 - -
    주사 정면 226 3.77
    측면 - -
    지루 정면 217 3.62
    측면 - -
    정상 정면 87 1.45
    측면 - -
    59-59 건선 정면 79 1.32 9.68
    (581 건)
    측면 - -
    아토피 정면 - -
    측면 - -
    여드름 정면 - -
    측면 - -
    주사 정면 281 4.68
    측면 - -
    지루 정면 178 2.97
    측면 - -
    정상 정면 43 0.72
    측면 - -
    69-69 건선 정면 40 0.67 4.9
    (294 건)
    측면 - -
    아토피 정면 - -
    측면 - -
    여드름 정면 1 0.02
    측면 - -
    주사 정면 151 2.52
    측면 - -
    지루 정면 90 1.5
    측면 - -
    정상 정면 12 0.2
    측면 - -
    79-79 건선 정면 15 0.25 2.35
    (141 건)
    측면 - -
    아토피 정면 - -
    측면 - -
    여드름 정면 - -
    측면 - -
    주사 정면 74 1.23
    측면 - -
    지루 정면 44 0.73
    측면 - -
    정상 정면 8 0.13
    측면 - -
    80+ 건선 정면 3 0.05 0.27
    (16 건)
    측면 - -
    아토피 정면 - -
    측면 - -
    여드름 정면 - -
    측면 - -
    주사 정면 4 0.07
    측면 - -
    지루 정면 9 0.15
    측면 - -
    정상 정면 - -
    측면 - -
    합계 6,000 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    ● 이미지 분류 (6종 이미지 분류)

     

    활용 지표: 유효성 및 유용성


    * AI 모델 : DenseNet

     

    - 2017년에 Microsoft Research에서 고안된 모델로, ResNet과 Pre-Activation ResNet보다 적은 파라미터 수로 더 높은 성능을 가짐.
    - 대규모 이미지 데이터 셋에서 깊은 신경망을 효과적으로 학습시킬 수 있는 능력으로 인해 많은 컴퓨터 비전 과제에서 성공적으로 적용되고 있음.

    DenseNet121 활용AI모델_1


    - 개발언어 및 프레임워크 확인

    DenseNet 개발언어 및 프레임 워크
    품질특성 TASK 명 모델명 개발언어 프레임워크
    유효성 피부질환 진단(분류) DenseNet121 python Pytorch 2.3.1

     

    - 데이터 학습 모델 및 학습 조건 확인   

    데이터 학습 모델 및 학습 조건 확인
    품질특성 TASK 명 모델명 학습데이터 비율 학습조건
    유효성 피부질환 진단(분류) DenseNet121 8:1:1 image_size = 256
    batch_size = 32
    learning_rate = 0.001
    dropout_rate = 0.5
    num_epochs = 11
    optimizer = ADAM

       
    서비스 활용 시나리오

     

    구축한 모델은 환자의 피부과 진료 지원과 연구 및 데이터 분석에 활용할 수 있음.

     

    피부과 진료지원
    ● 진단 보조 도구로 활용: 병변 이미지를 분석해 6가지 안면부 병변 유형을 분류하고, 진단과 치료 결정을 보조.
    ● 원격 진료 서비스에 적용: 모바일로 업로드된 안면부 이미지를 분석하여 병변 유형과 심각도를 평가하고, 전문의 상담 여부를 안내.
    ● 경과 모니터링 및 사전 예방: 병변의 변화를 주기적으로 추적하여 이상 징후를 조기에 감지하고 사용자와 의료진에게 알림.

     

    연구 및 데이터 분석
    ● 안면부 병변 통계 분석: 분류된 데이터를 기반으로 병변 발생률과 경향을 분석하여 특정 연령대 및 지역의 피부 건강 현황을 파악.
    ● 모델의 학습 데이터 확장: 합성 데이터를 통해 학습 범위를 확장하고, 드문 병변 유형에서도 일관된 성능을 유지하도록 개선.

     

    기타정보

     

    대표성
    ● 실제 데이터와 유사한 합성 데이터를 활용해 안면부 병변의 분류와 경계 분할 성능을 극대화했으며, 병변의 유형, 크기, 색상 및 경계 등 주요 특징을 정밀하게 반영하여 높은 정확도를 제공.

     

    차별점
    ● 합성 데이터를 기반으로 실제 데이터가 부족한 환경에서도 안정적이고 일관된 성능을 발휘하며, 드문 병변 사례와 복잡한 환경에서도 병변의 유형과 경계를 정밀하게 분석하여 다양한 임상적 적용 가능성을 보장.

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    안면부 피부질환 이미지 합성데이터셋은 원천데이터로 합성된 안면부 정면 전체 이미지와 안면부 측면의 부분 이미지와 안면부 정면 전체 이미지의 경우엔 정상 피부 및 배경이 존재하여 병변 부위를 특정할 수 있도록 Annotation한 마스킹 이미지로 구성되어 있으며 임상정보를 포함한 라벨링 데이터로 구성됨


    ● 데이터 구성

    데이터 구성
    구분 Key Description Type Child Type
    1 annotations 어노테이션 배열 JsonArray JsonObject
    1-1 identifier 식별자 string  
    1-2 diagnosis_info 피부질환정보 JsonObject  
    1-2-1 diagnosis_name 피부질환명 string  
    1-2-2 onset 발병시기 string  
    1-2-3 distribution 병변분포 string  
    1-2-4 bodypart 신체부위 string  
    1-2-5 symptom 증상 string  
    1-2-6 easi_score 아토피 이지스코어 정보 JsonObject  
    1-2-6-1 iga_grade 중증도 단계 string  
    1-2-6-2 erythema 홍반 string  
    1-2-6-3 papulation 구진 string  
    1-2-6-4 excoriation 줄까짐 string  
    1-2-6-5 lichenification 태선화 string  
    1-3 desc 피부질환 설명 string  
    1-4 generated_parameters 합성관련 변수 정보 JsonObject  
    1-4-1 gender 성별 string  
    1-4-2 age_rance 연령대 string  
    1-4-3 race 인종 string  
    1-5 photograph 사진정보 JsonObject  
    1-5-1 file_path 이미지 파일경로 string  
    1-5-2 width 이미지 가로크기 int  
    1-5-3 height 이미지 세로크기 int  
    1-6 bbox 라벨링 정보 JsonObject  
    1-6-1 xpos x 좌표 int  
    1-6-2 ypos y 좌표 int  
    1-6-3 file_path 이미지 파일경로 string  
    1-6-4 width 이미지 가로크기 int  
    1-6-5 height 이미지 세로크기 int  
    1-7 lesion_area 병변영역 이미지경로 string  
    1-8 lesions 여드름 상세 레이블링 JsonArray JsonObject
    1-8-1 xpos x좌표 int  
    1-8-2 ypos y좌표 int  
    1-8-3 width 가로크기 int  
    1-8-4 height 세로크기 int  
    1-8-5 inflammatory 염증/비염증 여부 boolean  

     

    ● 어노테이션 포맷

    어노테이션 포맷
    구분 항목명 Type Required 비고
    한글명 영문명
    1 어노테이션 배열 annotations JsonArray Yes  
    1-1 식별자 identifier string Yes  
    1-2 피부질환정보 diagnosis_info JsonObject Yes  
    1-2-1 피부질환명 diagnosis_name string Yes  
    1-2-2 발병시기 onset string No  
    1-2-3 병변분포 distribution string No  
    1-2-4 신체부위 bodypart string No  
    1-2-5 증상 symptom string No  
    1-2-6 아토피 이지스코어 정보 easi_score JsonObject No 아토피만 해당
    1-2-6-1 중증도 단계 iga_grade string No
    1-2-6-2 홍반 erythema string No
    1-2-6-3 구진 papulation string No
    1-2-6-4 줄까짐 excoriation string No
    1-2-6-5 태선화 lichenification string No
    1-3 피부질환 설명 desc string Yes  
    1-4 합성관련 변수 정보 generated_parameters JsonObject Yes  
    1-4-1 성별 gender string Yes  
    1-4-2 연령대 age_rance string Yes  
    1-4-3 인종 race string Yes  
    1-5 사진정보 photograph JsonObject No  
    1-5-1 이미지 파일경로 file_path string No  
    1-5-2 이미지 가로크기 width int No  
    1-5-3 이미지 세로크기 height int No  
    1-6 라벨링 정보 bbox JsonObject Yes  
    1-6-1 x 좌표 xpos int Yes  
    1-6-2 y 좌표 ypos int Yes  
    1-6-3 이미지 파일경로 file_path string Yes  
    1-6-4 이미지 가로크기 width int Yes  
    1-6-5 이미지 세로크기 height int Yes  
    1-7 병변영역 이미지경로 lesion_area string No 정면만 해당
    1-8 여드름 상세 레이블링 lesions JsonArray No 여드름만 해당
    1-8-1 x좌표 xpos int No
    1-8-2 y좌표 ypos int No
    1-8-3 가로크기 width int No
    1-8-4 세로크기 height int No
    1-8-5 염증/비염증 여부 inflammatory boolean No

     

    ● 이미지 데이터 포맷

    이미지 데이터 포맷
      합성 이미지 마스킹 이미지
    포맷 PNG PNG
    예시 이미지삽업_13_아토피 이미지삽업_14_아토피2

     

    ● 라벨링 데이터 포맷

    라벨링 데이터 포맷
      어노테이션
    포맷 JSON
    예시 {
        "annotations": [
            {
                "identifier": "H0_17717_P2_L0",
                "diagnosis_info": {
                    "diagnosis_name": "여드름",
                    "onset": "수 년 전",
                    "distribution": "부분 침범",
                    "bodypart": "얼굴",
                    "symptom": "none",
                    "desc": "면포와 구진, 농포, 결절 등으로 나타나는 피지선과 모낭의 만성질환"
                },
                "generated_parameters": {
                    "gender": "여",
                    "age_range": "19-29",
                    "bodypart": "얼굴",
                    "race": "황인"
                },
                "photograph": {
                    "file_path": "여드름/정면/H0_17717_P2_L0.png",
                    "width": 1024,
                    "height": 1024
                },
                "bbox": {
                    "xpos": 0,
                    "ypos": 0,
                    "file_path": "여드름/정면/H0_17717_P2_L0.png",
                    "width": 1024,
                    "height": 1024,
                    "lesion_area": "여드름/정면/lesion_area/H0_17717_P2_L0.png",
                    "lesions": [
                        {
                            "xpos": 525,
                            "ypos": 642,
                            "width": 17,
                            "height": 17,
                            "inflammatory": false
                        }
                    ]
                }
            }
        ]
    }
  • 데이터셋 구축 담당자

    수행기관(주관) : 서울대학교 산학협력단
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    나정임 031-787-7314 jina1@snu.ac.kr 주관업무 총괄, 데이터 수집/정제/가공/검수, 모델개발
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    에스큐아이소프트(주) 저작/검수 도구 개발/운영 및 품질관리
    충남대학교 산학협력단 합성데이터 생성
    한림대학교 산학협력단 데이터 수집, 정제, 검수
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    나정임 031-787-7314 jina1@snu.ac.kr
    조민우 02-2072-4291 windsblues@snu.ac.kr
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    나정임 031-787-7314 jina1@snu.ac.kr
    조민우 02-2072-4291 windsblues@snu.ac.kr
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    임광섭 02-2284-3341 wthlord@sqisoft.com
    류승근 02-2284-3341 harushogo@sqisoft.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청 데이터 열람신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.

오프라인 데이터 이용 안내

본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.

K-ICT 빅데이터센터는 데이터 안심구역으로 지정되어
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.

데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.

국방데이터 이용신청 탭 이미지

국방데이터 개방 안내

본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.