특이 도로 환경 주행 데이터
- 분야교통물류
- 유형 3D , 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-29 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-13 신규 샘플데이터 개방 2022-07-29 콘텐츠 최초 등록 소개
국내 특이도로 18종 77 카테고리 환경에서 자율주행시스템을 적용하기 위한 2D이미지, 3D 라이다 데이터 및 센서 데이터
구축목적
국내 특이도로 18종 77 카테고리 환경에서 자율주행시스템을 적용하기 위하여, 2D와 3D 동적(차량, 보행자, 이륜차 등) 및 2D 정적(표지판, 신호등 등) 객체의 검출을 위한 AI 모델 학습데이터 구축이 주 목적
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 3D , 이미지 데이터 형식 .json 데이터 출처 자체 수집한 다채널 카메라 (직접 촬영) 라벨링 유형 바운딩박스(이미지/동영상),세그멘테이션(이미지/동영상),폴리라인(이미지/동영상),3D큐보이드(3D 포인트 클라우드) 라벨링 형식 JSON 데이터 활용 서비스 자율주행 분야 인공지능, 다채널 카메라 라이다 등의 인지센서를 기반으로 하는 다양한 분야에서의 활용 가능 데이터 구축년도/
데이터 구축량2021년/36만장 -
1. 데이터 구축 규모
1. 데이터 구축 규모 원시데이터 구축량 학습데이터 규모 어노테이션 규모 영상 (100시간 36만장 이상) 영상 (100시간 36만장 이상) 영상 (360만개 이상) 라이다 (100시간 36만장 이상) 라이다 (100시간 36만장 이상) 라이다(12만장 이상/영상의 30%수준) [데이터 구축 규모]
객체 정보의 상세 내용은 다음과 같다.
[어노테이션 종류 및 내용] 어노테이션 타입 어노테이션 대상 어노테이션 내용 상세 3D Cuboid 자동차, 이륜차, 보행자 1. 객체의 인스턴스 고유 번호
2. 객체 클래스 네임
3. Cuboid 3D 좌표2D Bounding Box 자동차, 이륜차, 보행자, 신호등 등 1. 객체의 인스턴스 고유 번호
2. 객체 어노테이션 고유 번호
3. 객체 카테고리 번호
4. 도로유형, 날씨, 시간대, 복잡도, 해상도 등 이미지 정보
5. 가공방법에 따른 좌표2D Segmentation 정지선, 횡단보도, 장애물 등 2D Polyline 차선 [어노테이션 종류 및 내용]
2. 데이터 분포
- 특이도로, 도로유형, 시간대, 외부환경, 복잡도, 객체 다양화 등을 고려한 데이터 설계 기준과 분포는 다음과 같다.
- 특이도로 : 수치지도 정보를 바탕으로 국내 특이도로의 분포도를 확인하고 이를 기반으로 데이터 구축 계획을 수립하여 국내 실도로를 18종 77 카테고리 유형으로 분류하였다.
- 도로유형 : 도로 유형이 적절한 비율로 촬영되어야 하므로 자동차 전용도로 70% 도심로 30% 으로 구성하였다.
- 시간대 : 주간 데이터와 야간 데이터가 적절한 비율로 구성되어야 하므로 주간 70%, 야간 30%로 구성하였다.
- 날씨 : 다양한 날씨 정보를 포함하고 있어야 학습 모델이 환경적인 요인에 영향을 덜 받으므르 맑음, 강수, 안개 상황이 골고루 포함되도록 했다.
- 복잡도 : 자동차의 주행 속도에 따라 원활/혼잡으로 구분
- 객체 다양화 : COCODATASET을 기반으로 카테고리를 분류하였고 크게 동적 객체(자동차, 이륜차, 보행자), 정적객체(신호등, 표지판, 차선, 정지선, 횡단보도, 장애물) 등 총 53종이 포함되도록 구성하였다.
[데이터 구조] 속성 구분 속성값 속성값 상세 특이도로 조건 특이도로 코드 04 : 코드로 표시 도로유형 조건 자동차전용도로/도심로 01 : 코드로 표시 시간대 조건 LIGHT, NIGHT 주간, 야간 날씨 조건 CLEAR, RAINNY, FOGGY 맑음, 강수, 안개 복잡도 SMOOTH, TRAFFIC 원활, 혼잡 [데이터 구조]
- 특이도로, 도로유형, 시간대, 외부환경, 복잡도, 객체 다양화 등을 고려한 데이터 설계 기준과 분포는 다음과 같다.
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 2D AI 활용 모델 설명
- 객체의 클래스 정확성 : 약 360만개의 가공 객체를 자동차(일반자동차/SUV/버스/트럭/특수차량), 이륜차(일반/사륜차/전동휠), 보행자(일반/자전거)등의 동적 객체, 표지판, 신호등 등 정적 객체로 분류의 정확성
- 각각의 Snapshot 기준으로 Object Detection 오류, 분류 오류 등을 고려하여 B-Box의 크기 기준으로 mAP(mean Average Precision) 값 계산
- 각 도로주행 케이스 단위로 여러 장의 Snapshot으로부터 mAP 값의 평균 계산
1. 2D AI 활용 모델 설명 TRAINING VALIDATION TEST 80% 10% 10% 2. 3D AI 활용 모델 설명
- 객체의 클래스 정확성 : 약 360만개의 가공 객체를 자동차(일반자동차/SUV/버스/트럭/특수차량), 이륜차(일반/사륜차/전동휠), 보행자(일반/자전거) 단위로 동적 분류의 정확성
- 각각의 Snapshot 기준으로 Object Detection 오류, 분류 오류 등을 고려하여 슈퍼클래스의 분류 기준으로 mAP(mean Average Precision) 값 계산
- 각 도로주행 케이스 단위로 여러 장의 Snapshot으로부터 mAP 값의 평균 계산
2. 3D AI 활용 모델 설명 TRAINING VALIDATION TEST 40% 10% 50% 3. 서비스 활용 시나리오
- 구축한 모델은 다양한 자율주행 상황에서의 동적객체, 정적객체 Detection에 활용할 수 있음
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 큐보이드 객체 인식(라이다, Car) Object Detection PointPillars AP 79 % 79 % 2 큐보이드 객체 인식(라이다, Pedestrian) Object Detection PointPillars AP 41 % 45.38 % 3 큐보이드 객체 인식(라이다, Cyclist) Object Detection PointPillars AP 68 % 69.9 % 4 바운딩박스 객체 인식(카메라, Small) Object Detection DetectoRS mAP 36 % 37 % 5 바운딩박스 객체 인식(카메라, Medium) Object Detection DetectoRS mAP 57 % 72.8 % 6 바운딩박스 객체 인식(카메라, Large) Object Detection DetectoRS mAP 67 % 82.6 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1. 원천 데이터 포맷
- 데이터 Naming
2D 이미지, LiDAR 데이터, 2D 어노테이션 파일, 3D 어노테이션파일, GPS, IVN 파일 이름이 일치
1. 원천 데이터 포맷 데이터 Naming [파일 이름 구조] 파일 종류 파일 이름 2D 이미지 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.png 2D 어노테이션 파일 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.json LiDAR 데이터 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.pcd 3D 어노테이션 파일 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.json GPS 파일 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.csv IVN 파일 <특이도로코드>_<시간대>_<날씨>_<복잡도>_<고유번호>.csv [파일 이름 구조]
[특이도로 정체 코드] 특이도로코드 01 02 03 04 05 06 커브 경사 주의구간 평면교차 입체교차 분기/합류 07 08 09 10 11 12 차로증/감 특수차로 터널 지하차도 고가차도 교량 13 14 15 16 17 18 톨게이트 로터리 시설물 중앙분리대 도로경계 유실/비포장로 [특이도로 정체 코드] 도로유형코드 01 02 자동차전용도로 도심로 [특이도로 정체 코드]
2. 데이터 구성
- 2D 어노테이션 포맷
2. 데이터 구성 2D 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 images Y 이미지 파일 정보 1–1 id string Y 파일 아이디 14022 1–2 filename string Y 파일명 0701_light_clear_traffic_00000000.png 1–3 width number Y 파일 가로 사이즈 [0-1920] 1–4 height number Y 파일 세로 사이즈 [0-1080] 1–5 sensor string Y 카메라/LiDAR C(카메라)/L(라이다) 1–6 road string Y 18종 특이도로 [붙임-5]86 특이도로 코드 참조 701 1–7 time string Y 주간/야간 [light,night] 1–8 weather string Y 맑음/강수/안개 [clear,rainy,foggy] 1–9 flow string Y 원활/복잡 [smooth,traffic] 2 annotations Y 어노테이션 정보 2–1 id string Y 어노테이션 133578 아이디 2–2 category_id Y 객체 카테고리 번호 2–3 segmentation N line을 이루는 point정보로 위에서부터 순서대로(0,1)가 한쌍이며, 여러쌍으로 이루어져있음 label_type이 IMAGE_SEGMENTATION 일 때 필수 Y 2–3–1 0 float N 746.6 2–3–2 1 float N 815.48 2–4 polyline N label_type이 IMAGE_LINE 일 때 필수 Y line을 이루는 point정보로 위에서부터 순서대로(x,y)가 한쌍이며, 여러쌍으로 이루어져있음 2–4–1 0 float N 746.6 2–4–2 1 float N 815.48 2–5 bbox N 바운드박스 좌표값 (0,1,2,3) label_type이 IMAGE_BBOX 일 때 필수 Y 2–5–1 0 float N 2–5–2 1 float N 900.37 619.64 2–5–3 2 float N 46.49 2–5–4 3 float N 38.94 2–6 image_id string Y 파일아이디 14022 2–7 size string N 2D 객체 크기 SMALL <= 32 * 32 label_type이 IMAGE_BBOX 일 때 필수 Y 32* 32< MEDIUM <= 96 *96 LARGE > 96*96 2–8 area float N 2D 객체 넓이 label_type이 IMAGE_BBOX, IMAGE_SEGMENTATION 일 때 필수 Y 3 categories Y 객체 정보 3–1 supercategory string Y 객체 중분류 신호등 3–2 id string Y 객체 번호 356 3–3 name string Y 객체 이름 일반자동차 - 3D 어노테이션 포맷
2. 데이터 구성 3D 어노테이션 포맷 구분 항목명 타입 필수여부 설명 예시 비고 1 어노테이션 대상 데이터 정보 Y 어노테이션 작업을 진행하는 대상 데이터의 기본 정보 1–1 parent_path string N 데이터 경로 “0914_01\016\02”, 상위 3단계 폴더 “211007\0914_01\017” 1–2 pcd_filename string Y 라벨링 작업 파일명 “0101_light_clear_smooth_04000115.pcd” pcd 파일 1–3 img_resolution [int, int] Y 영상 파일 해상도 [1920, 1200] 1–4 sensor string Y 취득 장비 “L” 1–5 road string Y 도로 특성 “0701” 1–6 time string Y 취득 시간 “light” 1–7 weather string Y 취득 당시 날씨 “clear” 1–8 flow string Y 취득 당시 도로 상황 “traffic” 2 annotations Y 어노테이션 정보 2–1 id int Y 객체 ID 1 2–2 class string Y 객체 클래스 “Car” Car, Pedestrian, Rider 2–3 direction float Y 객체 방향 177.8740692 에고차량 진행 방향 기준 각도(degree) 2–4 type string Y 라벨링 방식 “3D_Cuboid” 2–5 3D_points [float, float, float], [], [], ... Y Cuboid 3D 좌표 8개 [12.132, 12.132, 12.132], [], [], ... world coordinate 2–6 2D_points [float, float], [], [], ... Y Cuboid 3D 좌표를 2D 이미지에 Projectin한 2D 좌표 8개 [12.132, 12.132], [], [], ... image coordinate
3. 라벨링데이터 실제 예시
[2D 라벨링 데이터 내용]
[3D 라벨링 데이터 내용]
- 데이터 Naming
-
데이터셋 구축 담당자
수행기관(주관) : ㈜컴버스테크
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최윤수 02-6299-5151 leo.choi.ys@combus.co.kr · 2차 정제 및 3D 가공 · AI 모델개발(객체검출 mAP) 수행기관(참여)
수행기관(참여) 기관명 담당업무 한국자동차연구원 · 수집 및 1차 정제 ㈜지오스토리 · 수집 및 1차 정제 ㈜와토시스 · 비식별화 ㈜씨이랩 · 2D 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 최윤수 02-6299-5151 leo.choi.ys@combus.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.