콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#상표 # 브랜드 # 인공지능 # 간판 # 지식재산 # 도용 # 침해 # Trademark # Brand # AI

NEW IP산업의 상표권 보호를 위한 오프라인 상표 이미지 데이터

IP산업의 상표권 보호를 위한 오프라인 상표 이미지 데이터 아이콘 이미지
  • 분야지식재산
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2023-12 조회수 : 11,642 다운로드 : 45 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-15 데이터 최종 개방
    1.0 2023-04-30 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-15 산출물 전체 공개

    소개

    ◾ 오프라인에서 수집한 간판, 의류잡화, 종이인쇄물에 있는 상표 이미지 데이터를 비엔나 코드 분류 기준으로 가공, 정제하여 구축한 인공지능 학습용 데이터셋 구축

    구축목적

    ◾ (추진 목표) 유사 상표 검색을 통한 IP산업의 상표권 보호를 위해서는 다양한 고품질의 정제된 상표 이미지 데이터 확보가 필요함. 본 사업을 통해 해당 데이터를 구축하여 오프라인 상표 이미지 데이터를 디지털화하고 지식재산 산업의 발전에 기여하고자 함.
    ◾ (기대효과) 일반적인 상표 이미지뿐만 아니라 의류, 가방 등에 있는 상표 이미지 분석을 통해 유사 상표 존재 여부를 파악함으로써 지식재산권 보호가 가능할 것으로 사료됨.
  • 1. 데이터 구축 규모

     

    데이터 구분 데이터 형식 데이터 분류(수집원) 규모(수량) 용량
    원천데이터 이미지 cat1 : 간판 172,743 195,981 149GB
    (jpg) cat2 : 의류잡화 6,985
      cat3 : 종이인쇄물 16,253
    라벨링데이터 어노테이션 cat1 : 간판 485,756 541,660 625MB
    (json) cat2 : 의류잡화 14,791
      cat3 : 종이인쇄물 41,113

     

    2. 데이터 분포

     

    ◾ (원천데이터 기준) 데이터 수집 장소, 시간, 각도, 수집원 분포

    항목 구분 설명 데이터 건수 비율(%)
    장소 서울 데이터 수집 장소 - 서울 77,013 39.30
    경기 데이터 수집 장소 - 경기 47,650 24.31
    인천 데이터 수집 장소 - 인천 33,409 17.05
    제주 데이터 수집 장소 - 제주 11,709 5.97
    대전 데이터 수집 장소 - 대전 7,052 3.60
    부산 데이터 수집 장소 - 부산 5,852 2.99
    울산 데이터 수집 장소 - 울산 5,288 2.70
    대구 데이터 수집 장소 - 대구 3,647 1.86
    강원 데이터 수집 장소 - 강원 1,294 0.66
    전북 데이터 수집 장소 - 전북 889 0.45
    경북 데이터 수집 장소 - 경북 663 0.34
    충남 데이터 수집 장소 - 충남 590 0.30
    충북 데이터 수집 장소 - 충북 398 0.20
    경남 데이터 수집 장소 - 경남 273 0.14
    광주 데이터 수집 장소 - 광주 245 0.13
    전남 데이터 수집 장소 - 전남 6 0.00
    세종 데이터 수집 장소 - 세종 3 0.00
    시간 D 181,444 92.58
    N 14,537 7.42
    각도 F 중앙 정면 115,958 59.17
    L 왼쪽 정면 18,373 9.37
    R 오른쪽 정면 17,522 8.94
    B 중앙 아래 15,319 7.82
    LB 왼쪽 아래 14,592 7.45
    RB 오른쪽 아래 14,217 7.25
    수집원 간판 입간판, 광고판, x배너, 현수막 등 172,743 88.14
    의류잡화 모자, 가방, 티셔츠, 바지, 양말 등 6,983 3.56
    종이인쇄물 명함, 메뉴판, 신문, 잡지, 판촉물, 전단지 등 16,255 8.29

     

    ◾ (라벨링데이터 기준) 비엔나 코드 중분류 분포

    구분 설명 데이터 건수 비율(%)
    0101 별, 혜성  6,792 1.25
    0103 태양  3,812 0.70
    0105 지구, 지구본, 행성 1,245 0.23
    0107 달  2,146 0.40
    0111 성좌, 성군, 별이 있는 하늘, 천구의, 천체지도 105 0.02
    0113 고대<아밀러리> 천구의, 천문관, 천문궤도, 원자 모형, 분자 모형 244 0.05
    0115 자연현상  11,051 2.04
    0117 지리학적 지도, 평면 천체도(성좌도)  165 0.03
    0201 남성 17,536 3.24
    0203 여성 12,146 2.24
    0205 어린이  2,636 0.49
    0207 혼성 그룹, 단체장면  2,339 0.43
    0209 신체의 일부, 골격, 두개골 12,521 2.31
    0301 네발짐승 (I 계열군) 9,773 1.80
    0302 네발짐승 (II 계열군) 810 0.15
    0303 네발짐승 (III 계열군) 422 0.08
    0304 네발짐승 (IV 계열군) 12,907 2.38
    0305 네발짐승 (V 계열군) 2,129 0.39
    0306 네발짐승의 신체의 일부, 골격, 두개골 1,071 0.20
    0307 조류, 박쥐 16,296 3.01
    0309 수생 동물, 전갈  10,205 1.88
    0311 파충류, 양서류, 달팽이, 바다표범, 강치, 물개 1,831 0.34
    0313 곤충, 거미, 미생물 3,025 0.56
    0315 기타 다른 동물; 선사시대 거대 동물  188 0.03
    0317 본 류의 각기 다른 군에 속하는 동물의 집단 3 0.00
    0401 날개 또는 뿔을 가진 사람 404 0.07
    0402 반인반수 396 0.07
    0403 전설적 동물 532 0.10
    0405 사람 또는 동물을 나타내는 식물, 물체 또는 기하도형; 마스크·공상적 형태의 머리·식별하기 힘든 머리 형태 9,132 1.69
    0407 제4류에 속하나 각기 군이 상이한 도형요소 그룹 54 0.01
    0501 나무, 관목 5,777 1.07
    0503 나뭇잎, 침엽, 나뭇잎 또는 침엽을 가지는 나뭇가지 13,997 2.58
    0505 화초, 과수 꽃 8,248 1.52
    0507 곡물, 씨앗, 과일 5,361 0.99
    0509 야채 1,779 0.33
    0511 기타 다른 식물 1,275 0.24
    0513 식물로 만들어진 장식품 1,848 0.34
    0601 산, 바위, 동굴 2,959 0.55
    0603 물, 강 또는 개울이 있는 풍경  217 0.04
    0606 사막 또는 열대 풍경 21 0.00
    0607 도시 풍경 또는 마을 풍경 358 0.07
    0619 기타 다른 풍경 403 0.07
    0701 거주지, 빌딩, 광고판 또는 광고기둥, 동물우리 또는 사육장 12,264 2.26
    0703 거주지 또는 빌딩의 일부, 인테리어 3,878 0.72
    0705 기념비, 경기장, 분수 938 0.17
    0711 대형 건조물 107 0.02
    0715 건축 자재, 벽, 문 또는 장벽, 비계 94 0.02
    0801 제과 제품, 페이스트리, 과자류, 초콜릿 4,388 0.81
    0803 우유, 유제품, 치즈 121 0.02
    0805 육류, 돈육, 생선류 1,403 0.26
    0807 기타 다른 음식물 6,941 1.28
    0901 의류를 제외한 직물, 재봉틀(직조기)의 북 1,238 0.23
    0903 의류 1,495 0.28
    0905 재봉(바느질) 부속품, 옷본 226 0.04
    0907 모자류 3,745 0.69
    0909 신발류 316 0.06
    1001 담배, 흡연 기구, 성냥 90 0.02
    1003 여행용품, 부채, 가방 1,765 0.33
    1005 세면용품, 거울 774 0.14
    1101 나이프, 포크 및 숟가락, 주방용품 및 기계 4,579 0.85
    1103 음료용기, 접시 및 식기류, 음식 또는 음료를 요리·준비 및 서빙하기 위한 주방용품  19,212 3.55
    1107 기타 다른 가사 용품 203 0.04
    1201 가구 381 0.07
    1203 위생 설비 75 0.01
    1301 조명, 무선 밸브(진공관) 1,052 0.19
    1303 가열·조리 또는 냉장 기구, 세탁 기계, 건조 기구 751 0.14
    1401 관, 케이블, 중(대형) 철물용구  164 0.03
    1403 소형 철물, 스프링 243 0.04
    1405 자물쇠용 열쇠, 자물쇠, 맹꽁이 자물쇠 324 0.06
    1407 연장  2,177 0.40
    1409 농업용 또는 원예용 도구, 쇄빙 도끼 11 0.00
    1411 사다리 20 0.00
    1501 산업용 또는 농업용 기계, 산업설비, 모터, 엔진, 다양한 기계장치  199 0.04
    1503 가사 용도의 기계, 물레 174 0.03
    1507 바퀴, 베어링 686 0.13
    1509 전기 장치 61 0.01
    1601 통신, 녹음 또는 재생, 컴퓨터 1,352 0.25
    1603 사진 촬영, 영화 촬영, 광학 2,935 0.54
    1701 시계류 290 0.05
    1702 보석류 938 0.17
    1703 저울, 체중계, 저울추 227 0.04
    1705 측정 기구  638 0.12
    1801 육상 차량 2,175 0.40
    1802 동물용구 89 0.02
    1803 수중 및 수륙양용 운송구 311 0.06
    1804 닻, 부표, 구명대(조끼) 171 0.03
    1805 항공 또는 우주 수송 기구 603 0.11
    1807 교통 신호 및 이정표 22 0.00
    1901 대형 용기  292 0.05
    1903 소형 용기  308 0.06
    1907 병, 휴대용기 1,071 0.20
    1908 병의 일부 또는 병 부분품 44 0.01
    1909 암포라, 항아리, 꽃병, 화분, 꽃받이 328 0.06
    1911 실험실 및 의약용 용기 1,237 0.23
    1913 내과 또는 외과 장비, 기구 또는 용품, 인공 보철물, 의족, 의치, 내복약 907 0.17
    1919 각종 잡다한 제품  89 0.02
    2001 필기·제도 또는 그림용 재료, 소형 사무용품 954 0.18
    2005 종이, 문서 435 0.08
    2007 서적, 제본, 신문 2,202 0.41
    2101 게임용구, 장난감 1,272 0.23
    2103 스포츠 용품, 회전목마 2,199 0.41
    2201 악기, 악기 부속품, 음악 부속품 1,157 0.21
    2203 225 0.04
    2205 그림, 조각 39 0.01
    2301 휴대용 무기, 화약을 사용하지 않은 기타 다른 무기 101 0.02
    2303 화기, 탄약, 폭발물 183 0.03
    2305 갑옷 47 0.01
    2401 방패 5,069 0.94
    2403 인장, 도장, 스탬프 3,951 0.73
    2405 메달(훈장), 주화, 훈위 134 0.02
    2407 깃발 1,062 0.20
    2409 왕관, 보석이 박힌 머리띠 장식 7,254 1.34
    2411 표장, 기장 459 0.08
    2413 십자가 8,411 1.55
    2415 화살(표)  3,518 0.65
    2417 기호, 표시, 심볼 7,191 1.33
    2501 장식용 무늬(장식재)  2,678 0.49
    2503 수평으로 길게 늘여진 장식  107 0.02
    2505 두 개 또는 네 개로 분할된 배경  221 0.04
    2507 도형 또는 문자가 반복 표현된 표면 또는 배경 1,067 0.20
    2512 기타 다른 장식으로 덮인 표면 또는 배경 101 0.02
    2601 원, 타원 70,117 12.94
    2602 원 또는 타원의 절단부 또는 부채꼴 5,726 1.06
    2603 삼각형, 각을 형성하는 선 8,267 1.53
    2604 사변형 43,344 8.00
    2605 기타 다각형  6,703 1.24
    2607 병렬로 놓이거나 접하거나 또는 교차된 2종의 기하도형 1,441 0.27
    2611 선, 띠  20,450 3.78
    2613 기타 기하 도형, 정의하기 곤란한 도형 2,486 0.46
    2615 기하학적 입체도형 1,988 0.37
    2701 기하학적 도형을 형성하는 문자 또는 숫자, 원근법으로 쓰여지거나 인쇄된 문자 또는 숫자  2,085 0.38
    2703 사람, 동물, 식물 또는 대상(천체 또는 자연현상, 사물 포함)을 표현하는 문자 또는 숫자  7,457 1.38
    2705 특이 서체를 표현하는 문자 23,602 4.36
    2707 특이 서체를 표현하는 숫자 1,013 0.19
    2709 알파벳 문자 도형 27,176 5.02
    2803 중국, 일본 또는 한국 문자 1,481 0.27
    2817 고대 설형 문자 또는 상형 문자 6 0.00
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    1. 인공지능 기반 상표 이미지 객체 탐지 모델
    ◾ 개발 목표: 서비스를 통해 수집된 상표 이미지 내 비엔나코드에 해당하는 객체(도형) 탐지
    ◾ 개발 내용: 구축되는 학습데이터를 활용 YOLOv5 기반 상표 이미지에서 라벨(비엔나코드 중분류)에 해당하는 객체(도형)를 탐지함.

     

    ◾ 상표 이미지 객체 탐지 YOLOv5 모델의 기본 구조는 다음과 같음.

    YOLOv5 구조

    YOLOv5 구조 YOLO의 작동 방식 이미지

    [그림] YOLO의 작동 방식

    설명 • Step object detection 기법을 제안하여 기존의 모형보다 객체 검출 속도 및 정확도가 획기적으로 향상되었으며, 해당 모형에 대한 설명은 아래와 같음.
    • YOLO에서 활용되는 CNN의 입력 크기는 수식 416×416으로 가로와 세로 길이 비율이 동일하나, 일반적인 영상 데이터의 가로 세로 비율이 1:1이 아닌 경우 영상에 여백을 추가하여 가로 세로의 비율을 1:1로 조정함.
    • 가로와 세로의 비율이 조정된 영상 데이터를 이미지로 분할하여 CNN에 통과시키며, fully connected layer까지 통과된 특성 벡터를 아래 식과 같은 형태로 변환함.

     수식 7×7×((Anchors×parameters)+classnumbers)식(1)

    • 위의 식에서 수식 Anchors는 anchor의 개수를 의미하며, 수식 parameters수식 Pₒ(object가 존재할 확률), 수식 x,y,w,h(x center, y center, width, height), 수식 classnumbers는 클래스 개수를 의미함.
    • 각 그리드 셀에서 수식 Pₒ가 threshhold 미만으로 나타난 bounding box를 제거하며, threshhold 이상으로 나타난 bounding box 중 region별로 수식 Pₒ가 가장 높은 boundig box만 남김으로써 객체의 위치 및 클래스를 검출함.

     

    2. 응용서비스 - 상표 이미지 기반 유사 이미지 검색 서비스 ‘마크뷰’ 개발
    ◾ 전문가뿐만 아니라 일반인도 쉽게 사용할 수 있는 유사 상표 이미지 및 텍스트 검색 플랫폼 개발을 통해 상표권/디자인권 보호 및 지식재산권 취약계층 격차 해소
    ◾ 본 개발을 통해, 지식재산보호 취약계층인 중소기업, 소상공인에 대한 지식재산보호 강화, 노동집약적인 지식재산 산업에 인공지능 기술을 접목하여 기술 선진화에 이바지하고자 함.

    응용서비스인 유사 상표 이미지와 텍스트 검색 서비스 '마크뷰' 화면

    [그림] 유사 상표 이미지/텍스트 검색 서비스 ‘마크뷰’

  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 상표탐지 성능 Object Detection YOLO v5 mAP 60 % 66.6 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    1. 데이터 개요
    ◾ 기구축된 상표 이미지 데이터는 한국특허정보원 키프리스플러스(kiprisplus) DB로부터 수집한 데이터를 수집/가공한 것으로, 온라인 상의 디지털 상표 이미지 데이터임.
    ◾ 본 과제는 오프라인에서 수집한 상표 이미지 데이터를 비엔나 코드 분류 기준에 의거하여 이미지 내의 특징(객체)을 태깅하고 위치를 어노테이션하여 인공지능 학습용 DB를 구축함.
    ◾ 하나의 상표 이미지에서 평균적으로 2.63개 이상의 비엔나코드를 부여하므로, 이를 바탕으로 원천데이터는 19만 건, 라벨링 데이터는 50만 건 이상을 구축 목표로 함.

     

    2. 원천데이터
    ◾ 예시

    원천데이터 상표 이미지 예시 사진 1원천데이터 상표 이미지 예시 사진 2

     

    ◾ 디렉토리 구조
       ㅇ 데이터 활용성 및 범용성을 위해 3가지 종류(간판, 의류잡화, 종이인쇄물)의 이미지 데이터를 수집하였으며, 해당 카테고리로 폴더를 분류하여 제공함.
       ㅇ 원천데이터, 라벨링 데이터 각각의 폴더 내에 3가지(간판, 의류잡화, 종이인쇄물) 카테고리가 있으며, 원천데이터에는 상표 이미지(jpg)가, 그리고 라벨링 데이터에는 어노테이션 정보(json)가 존재함.

     

    [표] 상표 이미지 데이터 카테고리 분류

    분류 세부 항목
    cat1 간판 입간판, 광고판, x배너, 현수막 등
    cat2 의류잡화 모자, 가방, 티셔츠, 바지, 양말 등
    cat3 종이인쇄물 명함, 메뉴판, 신문, 잡지, 판촉물, 전단지 등

     

    [표] 디렉토리 구조

    No Field name Meaning 구조
    1 cat1 간판 카테고리 상표 이미지 폴더 구조 이미지 폴더 cat1 cat2 cat3 일렬로 나열
    2 cat2 의류잡화 카테고리 상표 이미지
    3 cat3 종이인쇄물 카테고리 상표 이미지

     

    3. 라벨링 데이터
    ◾ 구성
       ㅇ 원천데이터에 비엔나 코드 기준으로 가공하여 라벨링 데이터를 생성
       ㅇ 비엔나 코드
         - 비엔나 분류 코드(도형분류코드)는 상표의 표장에 포함된 도형, 기호, 문자, 입체적 형상, 색채, 동작, 홀로그램, 소리·냄새 등을 시각적인 방법으로 사실적으로 표현한 구성요소를 비엔나 분류라는 국제기준에 따라 6자리의 숫자로 기호화한 것임.
         - 예시: 남자어부 도형의 경우 “사람-남자-어부(02-01-12)”로 표시

     

    구분 속성명 타입 필수여부 설명 범위 비고
    1 images array Y 이미지 데이터    
      1-1 fileName string Y 파일명    
    1-2 img_id string Y 이미지 식별자    
    1-3 store_kor_name string Y 국문 상호명    
    1-4 store_eng_name string Y 영문 상호명    
    1-5 width number Y 이미지 너비    
    1-6 height number Y 이미지 높이    
    1-7 data_captured string Y 촬영 시간    
    1-8 location string Y 촬영 장소    
    1-9 business_category string Y 비즈니스 종류    
    1-10 item_category string Y 수집원 분류 "간판",  
    "의류잡화",
    "종이인쇄물"
    1-11 item_sub_category string Y 수집원 상세 분류    
    1-12 dayNight string Y 촬영 조도 "D", "N" D: 낮, N: 밤
    1-13 direction string Y 촬영 각도 "F", "L", "R", "B", "LB", "RB" F: 중앙 정면
    L: 왼쪽 정면
    R: 오른쪽 정면
    B: 중앙 아래
    LB: 왼쪽 아래
    RB: 오른쪽 아래
    1-14 tot_mid_vienna_code array Y 비엔나코드 중분류 리스트    
    1-15 tot_vienna_code array Y 비엔나코드 리스트    
    2 annotations object Y 라벨링 데이터    
      2-1 bbox array Y 바운딩 박스    
      2-1-1 bbox_id string Y bbox 식별자    
    2-1-2 fileName string Y 파일명    
    2-1-3 mid_vienna_code string Y 비엔나코드 중분류    
    2-1-4 points array Y 바운딩 박스 좌표    
    2-2 polygon array N 폴리건    
      2-2-1 poly_id string Y poly 식별자    
    2-2-2 fileName string Y 파일명    
    2-2-3 mid_vienna_code string Y 비엔나코드 중분류    
    2-2-4 points array Y 폴리건 좌표    

     

    ◾ 예시

    라벨링 데이터 예시 코드

     

    ◾ 디렉토리 구조: 

    [표] 디렉토리 구조

    No Field name Meaning 구조
    1 cat1 간판 카테고리 어노테이션 정보 폴더 구조 이미지 폴더 cat1 cat2 cat3 일렬로 나열
    2 cat2 의류잡화 카테고리 어노테이션 정보
    3 cat3 종이인쇄물 카테고리 어노테이션 정보
  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜마크클라우드
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김주현 02-1833-4992 info@markcloud.co.kr 총괄
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜아이웹 데이터 수집, 서비스 구축, 홍보/마케팅, 크라우드 소싱 인력 확보 및 비용 관리
    특허법인 로얄 크라우드 소싱 인력 교육/관리, 데이터 검증 및 라벨링, 오프라인 상표 이미지 데이터 구축 및 품질 관리, 법적 이슈사항 검토
    해율특허법률사무소 크라우드 소싱 인력 교육/관리, 오프라인 상표 이미지 데이터 구축 및 정제, 공모전 개최
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김주현 02-1833-4992 info@markcloud.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.