-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2022-09-16 원천데이터, 라벨링데이터 재연결 1.0 2022-07-14 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-14 콘텐츠 최초 등록 소개
도로 시설물 분류와 시설물 파손인지를 목적으로 다양한 보행로 시설물(예. 안전시설, 관리시설, 환경시설, 편의시설 등) 유형별 양호 및 불량 상태 이미지 데이터를 바운딩박스 및 세그멘테이션을 활용하여 가공한 데이터셋으로, 검수와 비식별화를 통해 재사용에 제한이 없도록 저작권 문제를 완전히 해결한 데이터를 확보
구축목적
도로 시설물(예. 안전시설, 관리시설, 환경시설, 편의시설 등) 유형별 양호 및 불량 상태를 도출해낼 수 있도록 인공지능을 훈련하기 위한 이미지 데이터셋
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 jpg, jpeg 데이터 출처 자체수집 라벨링 유형 바운딩박스(이미지)/세그멘테이션(이미지) 라벨링 형식 JSON 데이터 활용 서비스 인공지능(AI) 기반의 도로 시설물 관리 자동화 소프트웨어(SW) 개발에 필요한 AI 모델 학습용 데이터셋으로 활용 및 도로 시설물 안전사고 예방에 필요한 지능형 기술 개발을 위한 기초 데이터로서의 역할 데이터 구축년도/
데이터 구축량2021년/보행로 안전 시설물 30종, 이미지 데이터 통합 100만장 이상 (일부 양호상태 포함) -
데이터 구축 규모
- 본 데이터셋은 이미지 총 102.5만장으로 구성되어 있다. 보행자 안전 도로시설물 관리를 목적으로 하는 인공지능 모델을 구축하는 과정에서 불량 시설물을 선별해 내기 위해서는 대조군(기준)이 필요하여 파손 및 훼손 이미지 수집과 더불어 양호 상태의 이미지 수집이 이루어졌다. 파손 및 훼손 이미지(이하 불량 이미지)와 양호 상태 이미지(이하 정상 이미지)는 불량 65.4%, 정상 34.6%의 수집 비율을 기준으로 하여 수집 진행하였다.
[표2] 양호/불량 구축 규모데이터 구축 규모 상태 정의 구축 수량 양호 외관 및 기능 상 정상 상태 34.6만 장 불량 설치 때와 달리 파손되거나 변형되어 보수 또는 교체가 필요한 상태 65.4만 장
데이터 분포
- 시설물별 규모
[표3] 시설물별 규모데이터 구축 규모 구분 대분류 중분류 시설물 수집 규모 합계 양호 불량 1 도로안전 시설 차량방호 안전시설 Bollard_스테인리스 16,000 6,400 9,600 2 Bollard_탄성고무 46,000 11,000 35,000 3 Bollard_대리석 25,500 7,000 18,500 4 Bollard_U자형 37,000 15,000 22,000 5 시선유도봉_2줄 28,000 9,640 18,360 6 시선유도봉_3줄 50,000 20,000 30,000 7 보행자용 방호울타리 24,000 12,000 12,000 8 교량용 방호울타리 10,000 5,000 5,000 9 장애인 안전시설 턱낮추기 44,000 22,000 22,000 10 경사로 16,000 3,000 13,000 11 점자블럭 30,000 14,850 15,150 12 도로
부속시설(도로안내표지) 지주 42,000 3,500 38,500 13 보도(시멘트 콘크리트) 36,000 12,400 23,600 14 보도 블록 46,000 13,800 32,200 15 자전거 도로 45,000 13,500 31,500 16 연석 52,000 10,000 42,000 17 무단횡단 방지 울타리 14,000 7,000 7,000 18 맨홀 67,000 31,000 36,000 19 보행자 계단 30,500 4,500 26,000 20 교통안전 시설 신호기 현장 신호제어기 10,000 5,000 5,000 21 시각장애인용 음향신호기 6,000 3,000 3,000 22 노면표시 과속방지턱 46,000 14,455 31,545 23 횡단보도 48,000 14,550 33,450 24 고원식횡단보도 17,500 3,000 14,500 25 안전표시 통합표지 6,100 3,050 3,050 26 정주식, 부착식 표지 34,500 17,000 17,500 27 기타 전기시설 (가로등) 지주 56,900 23,000 33,900 28 (전봇대) 빗금표시 47,000 22,500 24,500 29 기타 소화전 23,000 4,600 18,400 30 주차멈춤턱_블럭형 46,000 13,800 32,200 합계 1,000,000 345,545 654,455 - 권역별 규모
각 시설물 원천데이터 수집은 지역별로 편향되지 않도록 6개 권역으로 구분하여 분배하였다.
[표4] 권역별 규모권역별 규모 구분 소분류 권역별 수집규모 (장) 합계 수도권 충청권 호남권 대경권 동남권 강원권 1 Bollard_스테인리스 16,000 7,536 1,656 2,958 878 2,374 598 2 Bollard_탄성고무 46,000 28,202 3,829 2,324 3,825 6,830 990 3 Bollard_대리석 25,500 11,297 2,551 4,258 2,742 4,247 405 4 Bollard_U자형 37,000 18,238 2,988 6,728 3,114 4,968 964 5 시선유도봉_ 2줄 28,000 9,937 2,990 4,684 4,418 4,927 1,044 6 시선유도봉_3줄 50,000 22,474 4,840 7,298 5,819 8,097 1,472 7 보행자용 방호울타리 24,000 12,064 2,548 3,451 1,719 3,669 549 8 교량용 방호울타리 10,000 5,740 727 1,263 770 1,244 256 9 턱낮추기 44,000 20,483 4,560 5,022 4,699 7,436 1,800 10 경사로 16,000 8,910 1,619 1,608 1,513 1,914 436 11 점자블럭 30,000 16,248 1,829 1,630 4,061 5,414 818 12 (도로안내표지) 지주 42,000 21,284 3,823 6,609 3,503 6,097 684 13 보도(시멘트 콘크리트) 36,000 17,043 2,563 4,962 3,944 6,472 1,016 14 보도 블록 46,000 20,127 5,254 6,577 5,961 6,565 1,516 15 자전거 도로 45,000 18,366 3,958 6,943 6,438 8,136 1,159 16 연석 52,000 37,249 3,014 1,962 4,885 3,759 1,131 17 무단횡단 방지 울타리 14,000 6,364 1,447 1,807 1,250 2,464 668 18 맨홀 67,000 38,389 5,062 3,027 11,266 7,919 1,337 19 보행자 계단 30,500 14,888 5,525 2,167 2,284 5,103 533 20 현장 신호제어기 10,000 4,305 1,122 1,572 1,124 1,443 434 21 시각장애인용 음향신호기 6,000 2,610 628 1,088 766 767 141 22 과속방지턱 46,000 27,211 4,318 2,948 3,505 7,020 998 23 횡단보도 48,000 21,287 4,804 6,023 5,908 8,563 1,415 24 고원식횡단보도 17,500 7,073 3,054 1,255 1,425 3,641 1,052 25 통합표지 6,100 2,785 1,211 594 455 907 148 26 정주식, 부착식 표지 34,500 14,549 2,695 5,013 3,013 7,831 1,399 27 (가로등) 지주 56,900 26,828 6,103 7,911 6,210 8,144 1,704 28 (전봇대) 빗금표시 47,000 21,106 4,837 6,775 4,824 8,102 1,356 29 소화전 23,000 12,665 986 4,782 1,979 2,311 277 30 주차멈춤턱_블럭형 46,000 21,023 4,576 6,291 5,498 7,179 1,433 합 계 1,000,000 496,281 95,117 119,530 107,796 153,543 27,733
- 본 데이터셋은 이미지 총 102.5만장으로 구성되어 있다. 보행자 안전 도로시설물 관리를 목적으로 하는 인공지능 모델을 구축하는 과정에서 불량 시설물을 선별해 내기 위해서는 대조군(기준)이 필요하여 파손 및 훼손 이미지 수집과 더불어 양호 상태의 이미지 수집이 이루어졌다. 파손 및 훼손 이미지(이하 불량 이미지)와 양호 상태 이미지(이하 정상 이미지)는 불량 65.4%, 정상 34.6%의 수집 비율을 기준으로 하여 수집 진행하였다.
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드인공지능 데이터 활용 모델 개발 요약표
- [표5] 모델 개발 요약표
인공지능 데이터 활용 모델 개발 요약표 데이터명 AI 모델 모델 성능 지표 응용서비스(예시) 보행 안전을 위한 도로 시설물 데이터 Image Classification F1-score 지능형 도로 시설물 관리 서비스
도로시설물 파손 분류 모델 개발
- [그림2] 도로시설물 분류 및 파손인지 모델
(1) 개념 :‘도로시설물 분류 및 파손인지 모델’는 AI 학습 모델을 기반으로 실시간 주행 도로 파손여부를 분석하여, 도로파손 상태 세분화 및 카테고리별 분류를 통해, 파손 심각도를 시각화함 를 통해 관리/위험 대상의 시설물을 각 지자체 담당자에게 자동으로 알려줌으로써 광범위한 점검 대상의 시설물을 효과적으로 유지/관리할 수 있는 역할을 수행함
(2) 개발 목표 : 지능형 도로 시설물 관리 시스템을 목표로 보행 안전을 위한 도로 시설물 데이터를 활용한 CCTV기반의 AI 응용서비스 개발
(3) 주요 기능 : 시간 주행 도로 파손여부를 분석하여, 도로파손 상태 세분화 및 카테고리별 분류를 통해, 파손 심각도를 시각화
(4) 핵심 기술 : AI 기반 시설물 종류/상태 정보 분류 기술 - [그림3] 도로시설물 분류 및 파손인지 모델 활용 예시
서비스 개방 및 사업화 방안
- 서비스 개발 계획 : 학습된 데이터 안에서 이미지 내 객체 식별 및 상태 분류
ㅇ 구축된 운영 서비스로의 적용 가능성 확인
ㅇ 테스트 기능 서비스 공개 - 사업화 방안 : 도로 시설물 낙후 지역 대상의 지자체를 중심으로 매주 운행하는 청소차량 카메라 부착 및 이미지 실시간 전송으로 인한 적용을 목표로 함
ㅇ 지자체와의 사업 협력 체계 마련ㅇ 청소 및 쓰레기 수거 차량 운행업체를 대상으로 전략적 제휴 추진 - 부가가치 창출 방안
ㅇ 주기적 점검이 아닌 불량 상태의 시설물 정보를 관리자가 실시간으로 확인하고, 교체함으로써 불필요한 인건비 낭비 및 예산 소요를 줄일 수 있음
ㅇ 지자체 중심으로 매주 운행하는 청소차량 카메라 부착 및 이미지 실시간 전송으로 인공지능(AI) 기반의 지능형 서비스가 도입됨으로써 AI 산업 경쟁력 제고 및 신시장 창출 효과
- [표5] 모델 개발 요약표
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 도로시설물 분류 및 정상인지 모델 Image Classification VOLO-D1 F1-Score 0.7 점 0.913 점
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드대표도면
대표도면 이미지 대분류 도로 안전 시설 중분류 도로부속 시설 소분류 무단횡단 방지 울타리 불량상태 울타리 파손 어노테이션 타입 세그멘테이션 원본 이미지 라벨링 이미지(Segmentation) 라벨링데이터 구성
- 이미지에 대한 어노테이션에 적합하도록 포맷을 구성하고, 이미지 파일 1개당 1개의 json 파일을 생성하였다.
라벨링데이터 구성 구분 항목명 타입 필수여부 설명 1 info - Y 기본 정보 1-1 image_id String Y 이미지의 고유 아이디 1-2 date Date Y 촬영 일자 1-3 city_id String Y 촬영 지역 1-4 filename String Y 이미지 파일명 1-5 width Integer Y 이미지 넓이 1-6 height Integer Y 이미지 높이 2 description List - 데이터 수집 시 기본정보 2-1 facility String Y 도로 시설물 유형 (종류) 2-2 sub_class String - 중소분류 2-3 state String Y 객체 상태 정보 3 annotations Array Y 어노테이션 정보 3-1 annotation_id String Y 어노테이션 고유 아이디 3-2 label_id String Y 라벨 아이디 3-3 label_name String Y 라벨명 3-4 is_defect String Y 객체 파손 유무 (상태 정보) 3-5 annotation_type String Y 라벨 타입 3-6 annotation_info Array Y 바운딩박스: [top,left,width,height]
폴리곤 : [[x,y],[x,y],[x,y],...]
라벨링데이터 실제 예시
[그림 1] json 파일 - 이미지에 대한 어노테이션에 적합하도록 포맷을 구성하고, 이미지 파일 1개당 1개의 json 파일을 생성하였다.
-
데이터셋 구축 담당자
수행기관(주관) : 에프원소프트㈜
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 오승호 031-5183-5341 sacrege@f1soft.co.kr · 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 도로교통공단 · 데이터설계 ㈜메트릭스리서치 · 데이터 수집 및 정제 ㈜씨이랩 · 데이터 가공 및 검수 에프원소프트㈜ · AI모델 개발
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.