고정밀데이터 수집차량 주간 도심도로 데이터
- 분야교통물류
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-15 데이터 최종 개방 1.0 2023-07-31 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-15 산출물 전체 공개 소개
ㅇ 고정밀데이터 수집차량 주간 도심도로 데이터 - 도심도로 주행 상황에서 발생하는 다양한 교통환경 데이터의 학습을 통해 안전한 주행을 위한 지능형 운전 보조 시스템의 개선 연구에 활용 되어질 데이터 - 높은 수준의 자율주행 연구에서 가장 핵심적인 역할을 하는 라이다, 레이더, 카메라, GNSS/INS 등 각 센서별로 동기화되어진 데이터 - 다양한 요소 및 시나리오를 바탕으로 도심부 데이터 - 라이다, 카메라, 레이더, GNSS/INS 등 500 driving scenes 이상의 실도로 주행 원천 데이터
구축목적
ㅇ 국내 환경에 적합한 완전자율주행(Lv.4-5) 연구개발을 위한 한국형 자율주행 인공지능 학습데이터 구축 ㅇ 강건한 객체 인식 모델 개발을 위한 상호보완적인 이기종 센서 데이터를 1 Set으로 하는 데이터셋 구축
-
메타데이터 구조표 데이터 영역 교통물류 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 ㈜모빌테크 차량 수집 라벨링 유형 판옵틱 세그먼테이션 라벨링 형식 JSON 데이터 활용 서비스 ㅇ 딥러닝 분석을 통한 최적의 신호주기(TOD) 생성 ㅇ 구축된 데이터 공유를 통한 공공/산학연 연구 지원 데이터 구축년도/
데이터 구축량2022년/ㅇ 전방 RGB 이미지 원천 100,000장/라벨링 100,000개 ㅇ 360도 라이다 PCD 원천 100,000장/라벨링 100,000개 -
ㅇ 데이터 구축 규모
데이터 구축 규모 구분 취득센서 수량(장) 데이터 수량(장) 데이터셋 (8:1:1 비율) 가공유형 Training Validation Test 카메라 전방카메라 100,000 2D Panoptic Segmentation 100,000 80,000 10,000 1,000 3D Cuboid 100,000 80,000 10,000 1,000 후방카메라 100,000 3D Cuboid 100,000 80,000 10,000 1,000 우측방카메라 100,000 3D Cuboid 100,000 80,000 10,000 1,000 촤측방카메라 100,000 3D Cuboid 100,000 80,000 10,000 1,000 LiDAR 회전형라이다 100,000 3D Cuboid 100,000 80,000 10,000 1,000 3D Panoptic Segmentation 합계 500,000 600,000 480,000 60,000 6,000
ㅇ 데이터 분포- 주간 도심도로 주행데이터
1. 환경적 분포
데이터 분포 - 환경적 분포 구분 맑음 흐림 비/눈 합계 목표량 70,000장 20,000장 10,000장 100,000장 목표비율 80.00% 20.00% 10.00% 100.00% 구축량 70,000장 20,000장 10,000장 100,000장 구축비율 80.00% 20.00% 10.00% 100.00% 2. 요일 분포
데이터 분포 - 요일 분포 구분 평일 휴일 합계 목표량 70,000장 30,000장 100,000장 목표비율 70.00% 30.00% 100.00% 구축량 70,000장 30,000장 100,000장 구축비율 70.00% 30.00% 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드[라이다 스캐닝을 통한 도로 상태 분석 시스템]
- 본 사업에 구축된 라이다 데이터는 한국도로공사의 지점검지 데이터와 융합하여 도로의 혼잡도를 예측(밀도) 데이터를 생성함
• 정밀지도에서 정적객체 데이터와 차선 이미지 데이터를 맵핑시켜 도로 상태를 분석하는 시스템
• 기존 카메라 기반 교통감지 시스템의 한계를 개선할 수 있는 정밀지도 차선 감지 기반 도로 분석
• 구축된 정밀지도와 융합하여 도로 분석 시스템 자동화 가능
• 수집된 주행 데이터 셋을 활용하여 국내 환경에 맞는 차선 검출 알고리즘 Fine-tuning 및 최적화
• 카메라와의 Calibration으로 2D 이미지에서의 Classification을 통해 차선 검출 모델 고도화로 확대<그림> 라이다 스캐닝을 통한 도로 상태 분석 시스템 예시
[RCNN 기반 전측방 라이다를 3D 객체 검출 모델]
ㅇ 개발 방안
- 인접 차량 검출을 위한 인공지능 모델 활용과 이동체 검출을 위한 포인트처리 기반 방법 활용
- 본 사업에서 취득된 전측방 라이다 센서 데이터만을 이용하여 차량 검출 모델 개발
- RCNN 기반 모델 설계를 통한 인접 차량 검출<그림 > RCNN 기반 모델 구성도
ㅇ 적용 시나리오
- 전측방 라이다 센서 데이터를 이용한 인접 차량 (30m 이내) 검출 Network 학습
- Inferencing을 통해 Validation 진행
- 성능 지표 도출
ㅇ 기대효과
- 문턱치가 높은 라이다 인지 시스템의 적용을 통해 자율주행 적용을 용이하게 함.
- ADAS 및 자율주행 시스템 연동을 통해 능동형 안전 기술 개발에 활용 가능
- 저사양 라이다의 인지 성능 개발을 위한 방안 제시
[FPN 기반 융합 네트워크를 통한 Panoptic Segmentation 모델]
ㅇ 개발 방안
- Panoptic segmentation을 위한 출력 로직을 합독으로 통합한 panoptic 융합 모듈 개발
- 본 사업에서 취득된 전방위 카메라 센서 데이터만을 이용하여 Panoptic segmentation 모델 개발
- Instance 로직과 Semantic 로직을 융합한 panoptic 융합 로직 모듈 개발<그림 > FPN 기반 융합 네트워크 모델
ㅇ 적용 시나리오
- 전방위 카메라를 통해 가공된 Semantic segmentation, Instance segmentation 데이터를 이용한 Panoptic segmentation Network 학습
- 다양한 시나리오 적용에 따른 Panoptic segmentation 모델 개선
- Inferencing을 통해 Validation 진행
- 성능 지표 도출
ㅇ 기대효과
- 객체의 정보뿐 아닌 배경정보를 사용하여 국내 환경에 맞는 자율주행 적용을 용이하게 함.
- ADAS 및 자율주행 시스템 연동을 통해 능동형 안전 기술 개발에 활용 가능
- 국내 환경에 맞는 Panoptic Segmentation 모델 개발
- 폴리곤 형태의 가공(Instance Segmentation)을 통해 2D-Bounding BOX로의 변환과 배경정보를 제거한 객체의 피쳐 추출로 더 정교한 모델 개발이 가능 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 3D Object Detection 3D Object Classification Voxel R-CNN mAP 70 % 76.7 % 2 Panoptic Segmentation 인식 Image Classification EfficientPS PQ 50 % 50.34 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드ㅇ 대표 도면
대표 도면 데이터명 1-037-098. 고정밀데이터 수집차량 주간 도심도로 데이터 데이터포맷 - 원시데이터 : mp4 - 원천데이터 : jpg(1920*1200) - 라벨링데이터 : json 데이터 출처 - 데이터 수집 : ㈜모빌테크 - 데이터 정제 : ㈜모빌테크 - 데이터 가공 : 노아에스엔씨(주), ㈜모토브, 알토비전, 어노테이션에이아이, ㈜엠데이터싱크, 이인텔리전스(주), ㈜캔랩 데이터 구축 규모 - 주간 도심도로 전방 RGB 이미지 원천 100,000장/라벨링 100,000개 - 주간 도심도로 360도 라이다 PCD 원천 100,000장/라벨링 100,000개 ㅇ 라벨링데이터 구성
- 2D Panoptic Segmentation라벨링데이터 구성 - 2D Panoptic Segmentation 구분 항목명 타입 필수여부 설명 범위 예시 1 images Object 이미지정보 1-1 Segmentation.identifier String Y 이미지식별자
(파일명)1-2 Segmentation.type String Y 이미지 파일 확장자 예) jpg 1-3 Segmentation.width Number Y 이미지 가로 크기 (픽셀) 예) 1920 1-4 Segmentation.height Number Y 이미지 세로 크기 (픽셀) 예) 1080 1-5 Segmentation.data_captured String Y 이미지 생성 일자 yyyy-MM-dd HH:mm:ss 1-6 Segmentation.weather String Y 이미지 취득 당시 날씨 [clear, rain, snow] 맑음, 비, 눈 1-7 Segmentation.road_type String Y 이미지 취득 장소
(도로구분)[urban_old, urban_new, residential, rural, mountainous, coastal, highway, car_onl] 구도심, 신도심, 주거지역, 시골길, 산길, 해안도로, 고속도로, 자동차전용 1-8 Segmentation.frame_num Number Y 영상 내 이미지 프레임 순서 1-9 Segmentation.num_object Number Y 이미지 당 객체 수 1-10 Segmentation.num_trackid Number Y 해당 시퀀스에 등장하는 모든 고유한 추적 대상(trackID)의 개수 2 annotations Object 라벨링정보 2-1 Segmentation.id Number Y 세그멘테이션 식별자 2-2 Segmentation.category String Y 세그멘테이션 내 객체 유형 [car, truck, bus, other vehicles, pedestrian, motorcycle, bicycle, dontcare, etc.] 2-3 Segmentation.points List Y 세그멘테이션 내 점(x, y)의 집합 [[x1, y1], [x2, y2], [x3, y3]...] 2-4 Segmentation.type String Y 세그멘테이션 내 객체 타입 [정적,동적] - Lidar 3D Cuboid
라벨링데이터 구성 - Lidar 3D Cuboid 구분 항목명 타입 필수여부 설명 범위 예시 1 PointClouds Object 포인트클라우드 정보 별도의 Calibration Matrix 파일(.txt) 제공됨. 1-1 PointClouds.identifier String Y 포인트클라우드 식별자
(파일명)주행시나리오 구분을 위한 파일명 규칙 1-2 PointClouds.type String Y 포인트클라우드 파일 확장자 예) bin 1-3 PointClouds.data_captured String Y 포인트클라우드 생성 일자 yyyy-MM-dd HH:mm:ss 1-4 PointClouds.weather String Y 포인트클라우드 취득 당시 날씨 [clear, rain, snow] 맑음, 비, 눈 1-5 PointClouds.road_type String Y 포인트클라우드 취득 장소
(도로구분)[urban_old, urban_new, residential, rural, mountainous, coastal, highway, car_only] 구도심, 신도심, 주거지역, 시골길, 산길, 해안도로, 고속도로, 자동차전용 1-6 PointClouds.frame_num Number Y 포인트클라우드 프레임 순서 1-7 PointClouds.num_object Number Y 포인트클라우드 데이터 당 객체 수 1-8 PointClouds.num_trackid Number Y 해당 시퀀스에 등장하는 모든 고유한 추적 대상(trackID)의 개수 2 annotations Object 라벨링정보 2-1 3dbbox.id Number Y 3D 바운딩박스 식별자 2-2 3dbbox.category String Y 3D 바운딩박스 내 객체 유형 [car, truck, bus, other vehicles, pedestrain, motorcycle, bicycle, dontcare] 2-3 3dbbox.location List Y 3D 바운딩박스 중앙점 좌표 [x, y, z] 2-4 3dbbox.dimension List Y 3D 바운딩박스 가로,세로,높이정보 [가로, 세로, 높이] 2-5 3dbbox.distance Number Y 3D바운딩박스 거리(m) 2-6 3dbbox.rotation_y Number Y 3D 바운딩박스 헤딩각도 정보 2-7 3dbbox.occluded Number Y 객체 가려짐 여부 [0~3] 0: 온전함
1: 가려짐
(~50%)
2: 가려짐
(51~70%)2-8 3dbbox.type String Y 3D 바운딩박스 내 객체 타입 [정적,동적] ㅇ 라벨링데이터 실제 예시
라벨링데이터 실제 예시 주간 도심도로 2D Panoptic Segmentation <어노테이션파일 예시>
주간 도심도로 3D Cuboid 주간 도심도로 3D Cuboid <어노테이션파일 예시>
-
데이터셋 구축 담당자
수행기관(주관) : 한국전자기술연구원
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 박상현 02-6225-2095 shpark401@gmail.com 사업 총괄, 데이터 설계, 데이터 수집, 데이터 가공, 데이터 검사 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜모빌테크 데이터 수집, 데이터 정제 한국전자기술연구원 데이터 정제 노아에스엔씨(주) 2D 데이터 가공 ㈜알토비전 3D 데이터 가공 ㈜어노테이션에이아이 2D 데이터 가공 ㈜엠데이터싱크 3D 데이터 가공 ㈜이랜서 2D 데이터 가공 ㈜캔랩 2D 데이터 가공 코어디아이티㈜ 데이터 감사 ㈜모토브 응용서비스 개발 이인텔리전스㈜ 응용서비스 개발 한국도로공사 인공지능 모델 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박상현 02-6225-2095 shpark401@gmail.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.