콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#이미지 학습데이터 # 전통가옥 학습 데이터 # 한옥 데이터 # 이미지 라벨링 # 메타버스 # 메타버스 빌드잇 # 인공지능 생태계 # 데이터셋 # 이미지 데이터 # 가상현실 # 건축데이터 # 경상북도

NEW 메타버스 활용 목적 전통가옥 학습 데이터

메타버스 활용 목적 전통가옥 학습 데이터 아이콘 이미지
  • 분야문화관광
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 2,121 다운로드 : 97 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-15 데이터 최종 개방
    1.0 2023-06-28 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-02-16 산출물 전체 공개

    소개

    o 경상북도 내의 등 23개 행정구역에 분포되어 있는 한옥을 분포 비율별로 차등 수집하여 전통한옥 600개소 총 300,000장의 이미지 데이터셋을 구축하며 인공지능학습 데이터로 활용할 수 있도록 각 10종의 소분류에 대한 이미지를 대분류에 하위의 상세 항목과 구조를 정의하여 한옥 이미지에 라벨링된 데이터 셋 구성

    구축목적

    ㅇ 대한민국의 전통과 생활 철학이 녹아있는 전통 한옥에 대한 구성요소를 촬영하여 학습데이터로 구축하고 인공지능의 학습에 다양하게 활용하도록 하는 것을 목적으로 함
  • ● 데이터 통계

    1. 데이터 구축 규모

    데이터 통계 데이터 구축 규모 323,197장
    데이터 분포 outer(0.9%), door(2.3%), roof(5.4%), column(21.8%), window(17.3%), wall(18.4%), floor(4.3%), railing(0.9%), basestone(22.5%), stylobate(6.2%)

     

    2. 데이터 분포

     ◆ 도메인 분포 : outer, door, roof, column, window, wall, floor, railing, basestone, stylobate 총 10종
     ◆ 지역별 :  Pohang, Andong, Mungyeong, Seongju, Chilgok, Yecheon, Uiseong, Yeongdeok, Yeongcheon, Sangju, Goryeong, Bonghwa, Gyeongju, Yeongju, Cheongdo, Gumi, Yeongyang, Cheongsong, Gimcheon, Gunwi, Uljin, Gyeongsan
     ◆ 촬영 날씨 : Clear, Cloudy, Rainy, Snow
     ◆ 문화재 유형 : Loc, Nal, Nor
     ◆ 가옥 유형 : ilja, giyeogja, diguedja, mieumja
     

    2.1 다양성(요건) : 도메인 분포

    No. 카테고리  이미지장수   비율 
    1 outer            2,970 0.9%
    2 door            7,319 2.3%
    3 roof          17,573 5.4%
    4 column          70,481 21.8%
    5 window          55,861 17.3%
    6 wall          59,621 18.4%
    7 floor          13,785 4.3%
    8 railing            2,782 0.9%
    9 basestone          72,789 22.5%
    10 stylobate          20,016 6.2%
    총계         323,197 100%

    도메인 분포 차트

    2.2 다양성(요건) : 지역별

    No. 지역  이미지 장 수   비율 
    1 Pohang          10,071 3.1%
    2 Andong          92,147 28.5%
    3 Mungyeong            5,926 1.8%
    4 Seongju            5,577 1.7%
    5 Chilgok            4,932 1.5%
    6 Yecheon            6,768 2.1%
    7 Uiseong            8,648 2.7%
    8 Yeongdeok          38,290 11.8%
    9 Yeongcheon          27,006 8.4%
    10 Sangju            4,182 1.3%
    11 Goryeong            2,386 0.7%
    12 Bonghwa          18,038 5.6%
    13 Gyeongju          15,815 4.9%
    14 Yeongju          20,098 6.2%
    15 Cheongdo          12,923 4.0%
    16 Gumi            7,775 2.4%
    17 Yeongyang          19,218 5.9%
    18 Cheongsong          15,413 4.8%
    19 Gimcheon            2,710 0.8%
    20 Gunwi              395 0.1%
    21 Uljin            3,116 1.0%
    22 Gyeongsan            1,763 0.5%
    총계         323,197 100%

    지역별 분포 차트

    2.3 다양성(통계) : 촬영 날씨

    No. 날씨  이미지 장 수   비율 
    1 Clear         247,405 76.5%
    2 Cloudy          66,656 20.6%
    3 Rainy            2,977 0.9%
    4 Snow            6,159 1.9%
    총계         323,197 100.0%

    촬영 날씨 차트

    2.4 다양성(통계) : 문화재 유형

    No. 문화재유형  이미지 장 수   비율 
    1 LOC         202,814 62.8%
    2 NAL          70,281 21.7%
    3 NOR          50,102 15.5%
    총계         323,197 100.0%

    문화재 유형 차트

    2.5 다양성(통계) : 가옥 유형

    No. 가옥 유형  이미지 장 수   비율 
    1 ilja         180,202 55.8%
    2 giyeongja          24,803 7.7%
    3 diguedja          22,186 6.9%
    4 mieumja          92,424 28.6%
    5 etc            3,582 1.1%
    총계         323,197 100.0%

    가옥 유형 차트

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 학습 모델 개요

    < MASK-RCNN >

    전통한옥의 외관과 세부 구조들을 학습데이터로 구축하여 전통 건축 양식의 보존 및 계승과 이를 활용한 건축 한류에 활용할 수 있는 모델을 구축하고자 한다. 이를 위해 구축한 데이터에 MASK-RCNN을 적용하여 한옥의 구성 요소를 식별하는 모델을 개발한다.

    전통한옥 외관 설명 이미지 합각 지네철 박공장식 추녀마루 공포 기둥 초석 기단 전통한옥 외관 이미지 16장 마당-전면 마당-후면 마장-좌측면 마당-우측면 대문 화단 담장 벽체 초석 석계 기단 한옥 기둥

     

    2. 학습 모델 설명

    RCNN은 Fast-RCNN > Faster-RCNN > MASK-RCNN으로 발전하였으며, MASK-RCNN은 앞선 Faster-RCNN에 Masking 레이어를 추가하여 성능을 높였다. 특징을 뽑기 위한 베이스 CNN인 백본은 주로 ResNet과 FPN(Feature Pyramid Network)을 사용한다.

    전통한옥 외관 이미지학습 모델 전통한옥 외관 기단 식별 이미지

     

    3. 서비스 활용 시나리오

    ㅇ 한옥 건축에 대한 건물 이미지 데이터를 학습하고 활용하여 한옥에 대한 스케치 및 설계, 구조의 상세화 등에 활용 가능 

    ㅇ 한옥 이미지 학습데이터 구축은 인공지능 분야를 활용하여 한옥의 글로벌 경쟁을 향상시키고 다방면의 한옥 활용을 증진 

    ㅇ 4차 산업혁명의 도래 이후 정보통신 기술은 빠르게 발전하고 있으며 블록체인기술, 인공지능 기술의 발전 이후 최근 메타버스의 등장을 통하여 다양한 분야에 활용 

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 전통가옥 구성요소 탐지 성능 Object Detection mmdetection, MASK R-CNN mAP@IoU 0.5 70 % 74.9 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    ● 대표 도면

    과제명 주요 내용 데이터 구축량 데이터 형식
    메타버스 활용목적
    전통가옥 학습 데이터
    경상북도 22개 지역(울등도 지역 제외)에 대해 10개의 한옥 구조에 대한 이미지를 수집하고 대분류 하위의 상세 항목과 구조를 정의하여 한옥 이미지에 라벨링된 데이터 셋 10개의 카테고리(32개의 세부속성)를 대상으로 경북지역 전통가옥을 촬영하여 정제기준에 맞게 정제 후 라벨링한 데이터셋 경북지역 전통가옥을 촬영하여 Bounding BOX로 라벨링한 데이터셋
    총 파일 개수 : 323,197장 원천데이터 : jpg
    라벨링데이터 : json
    데이터 종류 포함 내용 제공 방식
    이미지 데이터셋 경북지역 전통가옥에 대해 30만 장 이상 촬영 후 정제 기준에 맞게 정제된 이미지 데이터 Jpg 포맷 파일
    라벨링 데이터셋 10개의 한옥구조에 대해 항목별로 라벨링된 데이터 Json 포맷 파일

    ● 데이터 구성

    속성명 속성 및 내용 타입
    dataet 데이터셋 정보 Object
    dataset.id 데이터셋 식별자 String
    dataset.name 파일명 String
    dataset.image_path 이미지 위치 경로 String
    dataset.label_path 레이블 위치 경로 String
    dataset.category 데이터셋 카테고리 Number
    dataset.type 데이터셋 타입 Number
    dataset.width 이미지 가로 크기(픽셀) Number
    dataset.height 이미지 세로 크기(픽셀) Number
    dataset.file_size 이미지 파일 사이즈(byte) Number
    annotation 어노테이션 정보 Array
    annotation.id 어노테이션 ID Number
    annotation.type 어노테이션 라벨링 기법 String
    annotation.name 어노테이션 한옥클래스 카테고리 Number
    annotation.points 어노테이션 포인트위치값 Array
    metadata    
    metadata.area 촬영 한옥 수집지역 String
    metadata.location 촬영 한옥 세부지역  String
    metadata.cultural_heritage 문화재 유형 String
    metadata.hanok_type 한옥유형 String
    metadata.hanok_house 건물유형 String
    metadata.weather 어노테이션 날씨 String
    metadata.category 어노테이션한옥클래스카테고리 String
    metadata.motive_pattern 어노테이션 클래스 세분류 String
    metadata.shooting_direction 어노테이션 대상 촬영 각도 String
    metadata.shooting_height 어노테이션 대상 촬영 높이 String

    ● 어노테이션 포맷

    구분 속성명 타입 필수여부 설명 범위 
    1 dataset Object Y 데이터셋 정보  
    1 1-1 dataset.id String Y 데이터셋 식별자 P000001~P999999
    1-2 dataset.name String Y 파일명  
    1-3 dataset.image_path String Y 이미지 위치 경로  
    1-4 dataset.label_path String Y 레이블 위치 경로  
    1-5 dataset.category Number Y 데이터셋 카테고리 1
    1-6 dataset.type Number Y 데이터셋 타입 1
    1-7 dataset.width Number Y 이미지 가로 크기 (픽셀) 640~6000
    1-8 dataset.height Number Y 이미지 세로 크기 (픽셀) 360~6000
    1-9 dataset.file_size Number Y 이미지 파일 사이즈(byte) 27462~5184736
    2 annotation Array Y 어노테이션 정보  
      2-1 annotation.id Number Y 어노테이션 ID 0~999999999
    2-2 annotation.type String Y 어노테이션 라벨링 기법 {“2DBBOX”}
    2-3 annotation.name Number Y 어노테이션한옥클래스
    카테고리
    1~10
    2-4 annotation.points Array Y 어노테이션
    포인트 위치값
     
    3 metadata        
      3-1 metadata.area String Y 촬영 한옥 수집지역
    Pohang, Andong, Mungyeong, Seongju, Chilgok, Yecheon, Uiseong
    Yeongdeok, Yeongcheon, Sangju, Goryeong, Bonghwa, Gyeongju
    Yeongju, Cheongdo, Gumi, Yeongyang, Cheongsong, Gimcheon
    Gunwi, Uljin, Gyeongsan
      3-2 metadata.location String Y 촬영 한옥
    세부지역
    mundeokri, deogamangil, hangae2gil, odeokri
      3-3 metadata.cultural_heritage String Y 문화재 유형 {Loc, Nal, Nor}
      3-4 metadata.hanok
    _type
    String Y 가옥 유형 {lija, giyeogja, diguedja, mieumja}
      3-5 metadata.hanok
    _house
    String Y 건물 유형 anchae, sarangchae, munganchae, etc
      3-6 metadata.weather String Y 날씨 {Clear, Cloudy, Rainy, Snow}
      3-7 metadata.category String Y 한옥클래스
    카테고리

    outer, door, roof, column, window, wall, floor, railing, basestone, stylobate
      3-8 metadata.motive
    _pattern
    String Y 클래스 세분류
    ilja, giyeogja, diguedja, mieumja, soteuldaemun, pyeongdaemun, ilgakmun, sajumun
    matbaejibung, paljakjibung, wujingakjibung, wonju, bangju, palgakju, panmun, ssangchang
    dokchang, goangchang, panbyeok, hwoabangbyeok, matbyeok, habgakbyeok, daecheongmaru
    ttoitmaru, numaru, jjokmaru, gyejanangan, pyeongnangan, jayeonseok, duju, jangdaeseok, etc
      3-9 metadata.shooting_direction String Y 어노테이션 대상 촬영 각도 {left, center, right}
      3-10 metadata.shooting_height String Y 어노테이션 대상 촬영 높이 {low, middle, high}

    ● 라벨링데이터 실제 예시

                    
    {                
        dataset: {            
            dataset.id: "P000171",        
            dataset.name: "sou_H002_sj_munganchae_clear_nal_roof_matbaejibung_ofront_cmid_P000171",        
            dataset.image_path: "./232_100P_DATASET/원천데이터/03_roof/01_matbaejibung/sou_H002_sj_munganchae_clear_nal_roof_matbaejibung_ofront_cmid_P000171.jpg",        
            dataset.label_path: "./232_100P_DATASET/라벨링데이터/03_roof/01_matbaejibung/sou_H002_sj_munganchae_clear_nal_roof_matbaejibung_ofront_cmid_P000171.json",        
            dataset.category: 3,        
            dataset.type: 1,        
            dataset.width: 4032,        
            dataset.height: 2268,        
            dataset.file_size: 837936        
        },            
        annotation: [            
            {        
                annotation.id: 2,    
                annotation.type: "2DBBOX",    
                annotation.name: 1,    
                annotation.point: [    
                    39.7685546875,
                    893.916015625,
                    3801.220947265625,
                    583.5789185
                ]    
            }        
        ],            
        metadata: {            
            metadata.area: "Seongju",        
            metadata.location: "mundeokri",        
            metadata.cultural_heritage: "Nal",        
            metadata.hanok_type: "matbaejibung",        
            metadata.hanok_house: "munganchae",        
            metadata.weather: "clear",        
            metadata.category: "roof",        
            metadata.motive_pattern: "matbaejibung",        
            metadata.shooting_direction: "center",        
            metadata.shooting_height: "middle"        
        }            
    }                
     

  • 데이터셋 구축 담당자

    수행기관(주관) : (주)테이크오프
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    이상준 070-7565-0806 7912mile@take-off.kr 품질검수
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    (주)디트리플 수집,정제
    (주)어노테이션에이아이 가공
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    이상준 070-7565-0806 7912mile@take-off.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.