-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-14 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-14 콘텐츠 최초 등록 소개
도심 야간 사건사고 영상 분석을 위한 IR 및 열화상 영상 학습용 데이터를 구축하고 야간 상황을 분석하는 핵심적인 지표로 활용하는 AI데이터로 구성
구축목적
야간 사건사고 영상을 위한 학습용 데이터를 구축하고 야간 IR/열화상 CCTV 영상을 분석하는 핵심적인 지표로 활용하는 AI데이터로 구성
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 자체 수집(서초구 관내 CCTV) 라벨링 유형 바운딩박스(이미지) 라벨링 형식 JSON 데이터 활용 서비스 서초 스마트시티(도심혼잡 AI실증) 데이터 구축년도/
데이터 구축량2021년/2,212,000 -
데이터 구축 규모
데이터 구축 규모 구분 객체 이미지 데이터 사건사고데이터 라벨링
데이터용도 객체 검출용 객체 검출 및 사건사고 검출용 IR 이미지 수량 621,000장 485,000장 열화상 이미지 수량 621,000장 485,000장 합계 1,242,000장 970,000장 총합계 2,212,000장 비율 56.10% 43.90% 클래스 사람, 사람, 자전거 탄 사람, 자전거 탄 사람, 자전거, 킥보드 탄 사람, 킥보드 탄 사람, 킥보드, 오토바이 탄 사람 오토바이 탄 사람, 오토바이 데이터 분포
- 객체이미지데이터 클래스 분포도
데이터 분포 객체이미지데이터 클래스 분포도 라벨 종류 비율 사람 50% 오토바이 탄 사람 20% 자전거 탄 사람 20% 킥보드 탄 사람 10% 합계 100% - 사건사고이미지데이터 집계표
데이터 분포 사건사고이미지데이터 집계표 순번 구분 원시 라벨링 내용 수량(장) 학습방법 데이터 IR 열화상 사건사고유형 용도 1 사건 재연영상 사람 40,416 40,416 군집 객체 검출 2 40,416 40,416 배회 객체 검출 3 40,416 40,416 침입 객체 검출 4 40,416 40,416 따라감 사건사고검출 5 40,416 40,416 충돌
(사람VS사람)사건사고검출 6 40,420 40,420 쓰러짐 사건사고검출 7 킥보드 탄 사람
(+사람)18,187 18,187 킥보드주행 사건사고검출 8 18,187 18,187 킥보드낙차+사람 사건사고검출 9 18,187 18,187 킥보드 주행
(사람넘어짐)사건사고검출 10 킥보드 탄 사람 + 자전거 탄 사람 18,189 18,189 킥보드낙차 사건사고검출 11 자전거 탄 사람
(+사람)24,250 24,250 자전거 주행 사건사고검출 12 24,250 24,250 자전거 낙차+사람 사건사고검출 13 24,250 24,250 자전거 주행
(사람넘어짐)사건사고검출 14 실제영상 오토바이 탄사람
(+사람)97,000 97,000 오토바이 주행 객체 검출 합계 485,000 485,000
- 객체이미지데이터 클래스 분포도
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델학습
- Scaled YOLOv4 / EfficientDet 등 네트워크 학습 기술 개발
– 성능과 처리속도를 고려하여 Scaled YOLOv4와 EfficientDet을 선정하여 Object Detection 수행
– CNN 특징을 이용한 다중 물체 추적기술을 이용, 안전구역내에서의 침입/배회 알람서비스를 위한 다중물체 추적 기술 적용 - 사건사고데이터 모델(LSTM) 기반의 사건사고 검출 네트워크 적용
– 시나리오 데이터는 객체에 대한 box정보와 사건사고의 시작시간과 종료시간을 기록하여 학습데이터로 활용 함
– 시계열 데이터를 이용한 사건사고 검출을 위한 사건사고데이터 모델(LSTM)를 활용하여 구축된 학습 DB 검증 수행
서비스 활용 시나리오
모델학습 - 야간 영상 분석, IR카메라의 객체 분석 능력, 열화상을 통한 안전 관련 연구 활용 및 야간 CCTV 감시 시스템과 야간 실종자 수색 시스템에 이용
- 데이터셋을 이용하여 야간 저조도 영상에 대해 학습을 진행 후 서초구 관내의 위험 지역을 대상으로 서초 스마트시티 앱에 시험 운용 진행
- Scaled YOLOv4 / EfficientDet 등 네트워크 학습 기술 개발
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 객체 검출 학습 모델 (IR) Object Detection YOLO v4 mAP 70 % 90.24 % 2 객체 검출 학습 모델 (Thermal) Object Detection YOLO v4 mAP 70 % 95.36 % 3 객체 검출 학습 모델 (IR) Object Detection EfficientDet mAP 70 % 79.35 % 4 객체 검출 학습 모델 (Thermal) Object Detection EfficientDet mAP 70 % 82.8 % 5 평균 이벤트 검출 정확도 (IR) Object Detection RNN, DNN mAP 60 % 91.16 % 6 평균 이벤트 검출 정확도 (Thermal) Object Detection RNN, DNN mAP 60 % 85.98 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 객체이미지데이터 예시
- 사건사고이미지데이터 예시
- 데이터셋 폴더명 구성
- 데이터셋 파일명 구성
- 객체이미지데이터 어노테이션 포맷
객체이미지데이터 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 image dict Y 이미지 정보 1-1 data_type string Y 데이터 클래스 이름 “OBJ”,“EVENT” 1-2 camera_type string Y 카메라 타입 “IR”, “THERM” 1-3 file_name string Y 이미지 파일 이름 1-4 date_captured string Y 생성일 yyyymmdd_hhmmss 1-5 video_id string Y 사용 영상 번호 1-6 image_id string Y 이미지 번호 1-7 size dict Y 이미지 크기 1-8-1 depth int Y 이미지의 채널 수 1-8-2 width int Y 이미지의 너비 1-8-3 height int Y 이미지의 높이 2 annotation dict Y annotation 정보 2-1 id int Y 객체 고유 번호 2-2 area int Y 객체 면적 2-3 bndbox dict Y 바운딩 박스 정보 2-3-1 xmin int Y X축 최소값 2-3-2 ymin int Y Y축 최소값 2-3-3 xmax int Y X축 최대값 2-3-4 ymax int Y Y축 최대값 2-4 entity_box list Y 꼭지점 위치 정규값 2-5 occluded int Y 가려짐 여부 0, 1 2-6 property dict Y 세부 정보 2-6-1 supercategory string Y 객체 대분류 2-6-2 category_id int Y 객체 클래스 번호 2-6-3 name string Y 객체 클래스 이름 3 environment dict Y 환경 정보 3-1 location string Y 장소 3-2 resolution string Y 해상도 “1920*1080”, “1280*720”, “640*480”, “640*512” 3-3 weather string Y 날씨 “맑음”, “비” 3-4 temperature string Y 온도 3-5 wind_speed string Y 풍속 3-6 dust string Y 미세먼지 3-7 fov string Y 화각
- 사건사고이미지데이터 어노테이션 포맷
사건사고이미지데이터 어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 image dict Y 이미지 정보 1-1 data_type string Y 데이터 클래스 이름 “OBJ”,“EVENT” 1-2 camera_type string Y 카메라 타입 “IR”, “THERM” 1-3 file_name string Y 이미지 파일 이름 1-4 date_captured string Y 생성일 yyyymmdd_hhmmss 1-5 video_id int Y 사용 영상 번호 1-6 image_id int Y 이미지 번호 1-7 size dict Y 이미지 크기 1-8-1 depth int Y 이미지의 채널 수 1-8-2 width int Y 이미지의 너비 1-8-3 height int Y 이미지의 높이 1-9 event_id int Y 이벤트 아이디 1-10 event_name string Y 이벤트 이름 대분류 1-11 sub_event_name string Y 이벤트 이름 소분류 2 annotation dict Y annotation 정보 2-1 id int Y 객체 고유 번호 2-2 area int Y 객체 면적 2-3 bndbox dict Y 바운딩 박스 정보 2-3-1 xmin int Y X축 최소값 2-3-2 ymin int Y Y축 최소값 2-3-3 xmax int Y X축 최대값 2-3-4 ymax int Y Y축 최대값 2-4 entity_box list Y 꼭지점 위치 정규값 2-5 occluded int Y 가려짐 여부 0, 1 2-6 property dict Y 세부 정보 2-6-1 supercategory string Y 객체 대분류 2-6-2 category_id int Y 객체 클래스 번호 2-6-3 name string Y 객체 클래스 이름 2-7 attributes dict Y 트레킹 정보 2-7-1 track_id int N 트레킹 아이디 NA 2-7-2 value string N 트레킹 값 NA 2-7-3 color string N 트레킹 색상 NA 3 task dict Y task 정보 3-1 mode string Y cvat 모드 3-2 bugtracker string N 버그 추적 NA 3-3 created string Y 제작 시간 yyyy.mm.dd 3-4 updated string Y 업데이트 시간 yyyy.mm.dd 3-5 frame_size int Y 총 프레임 수 3-6 frame_id int Y 프레임 번호 3-7 frame_filter string N 프레임 필터 NA 3-8 start_frame int Y 시작 프레임 3-9 stop_frame int Y 종료 프레임 4 environment dict Y 환경 정보 4-1 location string Y 장소 4-2 resolution string Y 해상도 “1920*1080”, “1280*720”, “640*480”, “640*512” 4-3 weather string Y 날씨 “맑음”, “비” 4-4 temperature string Y 온도 4-5 wind_speed string Y 풍속 4-6 dust string Y 미세먼지 4-7 fov string Y 화각
- 객체이미지데이터 예시
-
데이터셋 구축 담당자
수행기관(주관) : 서초구청
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 임동현 주무관 02-2155-6098 dlaehdgus@seocho.go.kr · CCTV 관제센터 운영 및 공모사업 추진 등 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜씨프로 · 데이터 수집/정제
· 가이드라인 작성
· 라벨링 플랫폼 운영㈜비젼인 · 데이터 가이드라인 작성
· 학습
· 인공지능 모델 구현한국영상정보연구조합 · 크라우드소싱
· 라벨링
· 사회적 약자 지원
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.