콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#애니메이션 # 캐릭터 # 감정분류

애니메이션 속 캐릭터 얼굴 랜드마크 데이터

애니메이션 캐릭터 얼굴 랜드마크
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2021 갱신년월 : 2022-07 조회수 : 7,990 다운로드 : 485 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2022-07-14 데이터 최초 개방

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2022-10-20 신규 샘플데이터 개방
    2022-07-14 콘텐츠 최초 등록

    소개

    애니메이션의 각 프레임별 다양한 캐릭터의 얼굴의 위치 및 얼굴 세그멘테이션, 캐릭터 감정 등에 대한 데이터 구축으로 애니메이션 제작사 등 종사자 및 학생들이 창작 및 기획 수행에 양질의 데이터를 제공함으로써 애니메이션 산업 발전 도모

    구축목적

    사람의 얼굴을 캐릭터의 얼굴로 변환 및 생성하기 위해 얼굴의 세그멘테이션 데이터 및 감정 데이터 수집을 목적으로 함
  • 1. 데이터 구축 규모

    • 학습용데이터 가공을 위한 원천데이터는 6개 작품으로 함
    • 대상은 6개 작품의 58개 캐릭터를 기준으로 하고 데이터가 편향되지 않도록 캐릭터별 원천데이터를 확보
    • 감정 클래스는 7개로 하고 감정별 캐릭터별 감정데이터가 편향되지 않도록 캐릭터별 데이터는 7,000개 이상, 캐릭터별 감정별 데이터는 1,020개 이상을 구축 (애니메이션 작품의 특성을 감안하여 캐릭터와 감정의 편향성에 대해서는 실제 도출되는 테이터결과를 기준으로 설정)
    • 캐릭터별 감정별 데이터가 편향되거나 부족할 경우 원천데이터를 기존 400,000건 보다 추가 확보하여 전체 데이터를 400,000건 이상 구축
    • 얼굴 랜드마크 데이터의 경우 정면, 측면 데이터를 동일 배율로 구축하는 것을 원칙으로 하되 동일 한쪽의 데이터가 부족할 경우 부족한 부문을 최대한 반영

    2. 데이터 라벨링/어노테이션 분포

    • 작품별 데이터셋 구축결과
      1. 데이터 구축 규모
      작품구분 감정분류 합계
      놀라움 두려움 분노 슬픔 중립 행복 혐오
      구름빵(1/2/3) 22,433 7,069 3,640 12,370 43,584 79,792 1,355 170,243
      레츠고MBA 7,062 2,454 7,541 5,884 13,398 15,326 1,586 53,251
      숲속배달부 빙빙 7,740 5,355 3,777 4,869 18,765 13,431 1,432 55,369
      라바(1/2/3) 17,140 12,380 6,551 10,327 10,605 15,657 3,544 76,204
      다이노코어(1~5) 9,458 2,945 4,510 2,658 9,956 9,234 1,326 40,087
      꽉잡아 4,083 1,105 4,936 2,678 10,419 5,174 1,614 30,009
      합계 67,916 31,308 30,955 38,786 106,727 138,614 10,857 425,163

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

     

     

    데이터명 AI모델 성능 지표
    애니메이션 속 캐릭터 얼굴 랜드마크 데이터 이미지 생성 모델
    이미지 감정 분류 모델
    캐릭터 탐지 및 세그멘테이션
    FID score
    F1-Score
    mAP 

     

    구분 학습방안
    StyleGAN2 기반 transfer learning – 사람의 얼굴에서 애니메이션 캐릭터로 domain transfer를 해야함.
    – 사람 이미지 데이터인 FFHQ 데이터로 학습된 pretrained weight 사용
    – Generator의 convolutional neural weight를 freeze 시켜 transfer learning 진행 
    StyleGAN2 ADA 적용 – StyleGAN2는 뛰어난 생성 모델이지만, 학습에 수십만장 단위의 많은 데이터를 필요로 함.
    – 수천장의 상대적으로 적은 수의 데이터에서도 준수한 성능을 보이는 StyleGAN2 ADA를 활용해 학습을 진행
    감정 분류 모델 Mask RCNN + VGG16  – 전체 이미지 속에서 캐릭터의 정확한 위치를 찾기 위해서 Mask RCNN으로 각 캐릭터의 영역을 추출한 뒤, 각각을 VGG16 분류 모델에 넣어 감정을 분류함
    – 각 캐릭터 별로 학습 데이터와 검증 데이터를 나눠서 감정 분류를 진행하고, 차후에 다른 캐릭터의 감정 인식의 전이 학습 진행

     

    • StyleGAN2 기반 transfer learning
      • 사람의 얼굴에서 에니메이션 캐릭터로 domain transfer를 해야함
      • Stylegan의 style vector를 사용함
      • 사람 이미지 데이터인 FFHQ 데이터로 학습된 pretrained weight 사용
      • Generator의 몇개의 convolutional neural weight를 freeze 시켜 transfer learning 진행 
      • 사람 데이터와 같은 latent space을 가질 수 있음. 
    • StyleGAN2 기반 image projection
      • FFHQ 데이터 기반으로 학습된 pretrained weight를 사용
      • 유저의 얼굴을 latent vector로 projection
      • 이 latent vector를 위에서 에니메이션 데이터로 학습한 모델에 input으로 활용 
    • Instance Segmentation 모델 적용
      • 애니메이션 속에 있는 각 캐릭터의 감정을 분류하는 것을 목표로 하기에, 먼저 캐릭터의 위치를 찾아내는 모델과, 이렇게 찾아진 캐릭터의 감정을 분류하는 모델이 필요함
      • Mask RCNN(https://arxiv.org/abs/1703.06870)은 이미지 segmentation과 detection을 하는 알고리즘으로 정리
      • 여기에서의 bounding box와 segmentation 결과를 활용하여 분류기 모델과 생성모델에 적용
      • COCO Dataset (200,000 이미지와 80개 카테고리) 으로 미리 학습된 가중치를 활용하여 전이학습 가능
      • 전이 학습을 통해 효율적인 학습 가능
    • VGG(https://arxiv.org/abs/1409.1556)+Mask RCNN(https://arxiv.org/abs/1703.06870) 모델로 분류 작업 수행
      • 감정 분류기 적용
      • SOTA :Understanding cartoon emotion using integrated deep neural network on large dataset(https://link.springer.com/article/10.1007/s00521-021-06003-9)에서 다른 분류 알고리즘에 비해서 VGG16이 잘 되는 것을 검증.
      • VGG16은 기본적인 분류 모델로 특징을 추출하는 레이어와 크기를 축소하는 레이어를 쌓아서 만듬
    • 전체 알고리즘
      • StyleGan2와 VGG 모델의 혼합 모델 사용
      • StyleGan2로 이미지를 생성하고, VGG + Mask RCNN 모델로 감정을 분류함
      • 기존 모델을 활용하여 통합된 모델을 연구하는 면에서 연구 가치 존재
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 감정 분류 Image Classification VGG Based Classifier F1-Score 0.8 0.8131
    2 애니메이션 생성 성능 Image Generation StyleGAN2 ADA FID 18 10.44
    3 캐릭터 탐지 및 세그멘테이션 Object Detection Mask RCNN mAP 25 % 61.14 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 구축 데이터의 정의

    • Emotion Detection 정보
      1. 구축 데이터의 정의
      분류 필드명 내용
      Image
      정보
      (단일)


       
      id 이미지에 대한 고유번호
      width 이미지 detection box의 폭에 대한 값
      height 이미지 detection box의 높이에 대한 값
      file_name 이미지 파일 이름
      license 라이선스 정보 (해당없을 경우 0)
      date_capture 이미지 캡쳐 날짜 (해당없을 경우 0)
      Annotation
      정보
      (복수)



       
      segmentation Detection 영역의 좌표(x, y)가 순차적으로 입력
      area box가 가지는 영역
      bbox bounding box (x, y, width, height)
      iscrowd 평가 제외 여부
      id Annotation 정보에 대한 고유번호
      image_id Annotation 정보에 대응하는 이미지 고유번호
      category_id 카테고리 정보 고유번호로 본 과제에서는 감정에 해당
      License
      정보
      (복수)
      id 이미지 라이선스 정보의 고유번호
      name 라이선스명
      url 라이선스 정보 URL
      Category
      정보
      (복수)
      supercategory 카테고리 이름 (본 과제에서는 emotion으로 명명하여 감정을 표시)
      id 감정 고유번호 (본 과제는 7개 감정을 표시)
      name 7개의 감정 중 하나를 표시 *분노(Anger), 혐오(Disgust), 두려움(Fear), 행복(Happiness), 중립(Neutral), 슬픔(Sadness), 놀라움(Surprise)
    • Segmentation 정보
      분류 필드명 내용
      Image
      정보
      (단일)
      id 이미지에 대한 고유번호
      width 이미지 detection box의 폭에 대한 값
      height 이미지 detection box의 높이에 대한 값
      file_name 이미지 파일 이름
      license 라이선스 정보 (해당없을 경우 0)
      date_capture 이미지 캡쳐 날짜 (해당없을 경우 0)
      Annotation
      정보
      (복수)
      bbox bounding box (x, y, width, height)
      segmentation 랜드마크 좌표(x, y)가 순차적으로 입력됨
      랜드마크의 레이블링 순서는 반드시 일관성있게 유지되어야 함

    2. 구축 데이터의 예시

    • Emotion Detection Annotation
      애니메이션 속 캐릭터 얼굴 랜드마크-구축 데이터의 예시_1_캐릭터 감정 입력 예시

      [그림] 캐릭터 감정 입력 예시
      • 예시) 이미지는 구름빵 애니메이션 화면을 캡쳐하여 jpg 파일로 저장하였으며, 화면에 등장하는 캐릭터는 두 명이고 라이선스는 없으며, 7개의 감정 중 하나로 판단하여 Annotation

      애니메이션 속 캐릭터 얼굴 랜드마크-구축 데이터의 예시_2_캐릭터 감정 JSON(1)
      애니메이션 속 캐릭터 얼굴 랜드마크-구축 데이터의 예시_3_캐릭터 감정 JSON(2)

      [표] 캐릭터 감정 JSON

    • Segmentation Annotation
      애니메이션 속 캐릭터 얼굴 랜드마크-구축 데이터의 예시_4_Segmentation Annotation
      • 감정입력 이미지와 동일한 이미지에 대해 랜드마크 정보를 Annotation
      애니메이션 속 캐릭터 얼굴 랜드마크-구축 데이터의 예시_5_Segmentation JSON
      [표] Segmentation JSON

    3. 구축 데이터에 대한 라벨링 작업 대상

    • 라벨링 작업의 대상: 애니메이션 캐릭터의 얼굴부분 정보에 한함
    • 클래스분류 기준
      • 캐릭터 이미지 감정분류 : 분노(Anger), 혐오(Disgust), 두려움(Fear), 행복(Happiness), 중립(Neutral), 슬픔(Sadness), 놀라움(Surprise)
      • 학습에 사용된 캐릭터 뿐만 아닌 범용적인 데이터셋에 확인하기 위하여 기존 데이터 셋과 범용적으로 사용할 수 있는 감정 분류기준 (7개) 사용
      • 세그멘테이션 : 얼굴 윤곽선에 대해 25개 이상의 포인트를 부여한 폴리곤으로 구성
    • 세그멘테이션 정보 입력시에는 순서가 포인트 위치정보를 내포하므로 동일한 순서로 라벨링되는 것이 필수적임(왼쪽 상단부터 시작)
    • 라벨링 및 어노테이션 구조는 COCO dataset 기준을 참조하여 범용성 및 확장성을 고려하여 설계
    • 두 방식 모두 저장 양식은 json을 기준으로 함
    • 라벨링/어노테이션 절차
      절차  주요내용 
      전처리데이터(입력)  수집 및 정제 후 전처리된 원천데이터를 가공 도구를 통해 제공 
      가이드라인 확인  가공 기준 및 검수 기준으로 활용되는 라벨링 가이드라인 확인 
      정제된 이미지의 사전 정보 확인  수집 및 정제, 전처리 과정에서 생성된 이미지 정보
      (카테고리, 사이즈 등)을 확인 
      핵심 영역 선정  얼굴, 눈, 코 등 사전 정보를 통해 핵심 특성 확인 
      정제된 이미지 확인  제공된 정제 이미지 원천데이터 확인 
      이미지 영역 지정  얼굴 및 특징 영역 지정
      감정 분류  감정 분류 정보 태깅
  • 데이터셋 구축 담당자

    수행기관(주관) : 강원정보문화진흥원
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    최경희 033-245-6410 khani@gica.or.kr · 실무책임자
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    비플라이소프트 · 데이터 전체 품질관리/검수
    고려대학교 · AI학습모델 개발
    위고데이터 · 데이터 가공(구축)
    아이티베이스 · 데이터 수집/정제
    인터마인즈 · 수집된/가공된 데이터의 검수 업무 수행, 검수 관련 가이드라인 수립
    춘천시 · 크라우드 소싱 지원, 데이터 확산 및 수요처 발굴
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.