-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-28 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-20 신규 샘플데이터 개방 2022-07-28 콘텐츠 최초 등록 소개
총 10곳 이상의 공원으로부터 CCTV 화각을 고려하여 연출된 데이터셋으로, 행위 클래스(불법행위, 정상행위), 객체 클래스(불법객체, 정상객체)로 나누어 구성, 촬영 시간, 촬영 날씨 등의 데이터의 다양성 확보 및 비식별화 처리한 데이터 셋
구축목적
공원 내 불법행위 및 불법객체를 탐지하기 위해서는 CCTV를 통한 관제가 이루어져야 하며 이는 여러 가지 한계점이 존재. 이런 한계점을 인공지능, 딥러닝 학습을 통해 해결할 수 있게 하는 데이터 셋 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 비디오 , 이미지 데이터 형식 행위클래스(mp4), 객체클래스(jpg) 데이터 출처 자체연출수집 라벨링 유형 바운딩박스 라벨링 형식 JSON 데이터 활용 서비스 딥러닝 기반 공원 내 불법행위 및 불법객체 탐지 서비스 데이터 구축년도/
데이터 구축량2021년/불법행위(270시간), 정상행위(10시간), 불법객체(36,000장, 30시간), 정상객체(21,600장, 18시간) -
1. 데이터 구축 규모
1. 데이터 구축 규모 구분 분류 항목 클립 수 구분 분류 항목 이미지수 1 불법행위 흡연 720 1 불법객체 쓰레기봉투 3600 2 낚시 660 2 좌판 3600 3 쓰레기무단투기 1440 3 노점상 3600 4 월담 1320 4 푸드트럭 3600 5 시설물 파손행위 440 5 현수막 3600 6 현수막부착 880 6 텐트 3600 7 전단지배부 880 7 연기 3600 8 텐트설치 440 8 불꽃 3600 9 정상행위 벤치에앉는행위 60 9 반려동물 7200 10 바닥에앉는행위 60 10 정상객체 위해방지시설 2400 11 이동 180 11 벤치 2400 12 서있기 180 12 공원화분 2400 13 쓰레기통 2400 14 휴게공간 2400 15 화장실 2400 16 비석 2400 17 가로등 2400 18 공원안내표지판 2400 - 불법행위 영상 수 : 6780 클립(1~3분 사이, 3FPS, 약 270시간 분량)
- 정상행위 영상 수 : 480 클립(1~2분 사이, 3FPS, 약 10시간 분량)
- 불법객체 이미지 수 : 36,000장(약 30시간 분량, 비식별화 처리)
- 정상객체 이미지 수 : 21,600장(약 18시간 분량, 비식별화 처리)
2. 데이터 분포
º 행위 클래스(불법행위, 정상행위) 데이터 분포- 시간대 및 날씨별 분포
시간대 및 날씨별 분포 시간대 분포 날씨별 분포 구분 클립 수 비율(%) 구분 클립 수 비율(%) 오후 4326 60 맑음 3927 54 오전 1591 22 비 213 3 야간 572 8 흐림 3120 43 일출 219 3 합계 7260 100 일몰 552 8 합계 7260 100
- 촬영장소별 분포
촬영장소별 분포 날씨별 분포 구분 클립 수 비율(%) 중앙공원 210 3 어린이대공원 744 10 시민공원 3495 48 대신공원 216 3 금강공원 246 3 민락수변공원 746 10 국가지질공원 516 7 송상현광장 193 3 태종대유원지 171 2 용두산공원 723 10 합계 7260 100
º 객체 클래스(불법객체, 정상객체) 데이터 분포
- 시간대 및 날씨별 분포
시간대 및 날씨별 분포 날씨별 분포 날씨별 분포 구분 이미지 수 비율(%) 구분 이미지 수 비율(%) 오후 38749 67 맑음 55346 96 오전 13359 23 흐림 2254 4 야간 1294 2 합계 57600 100 일출 1396 2 일몰 2802 5 합계 57600 100
- 촬영장소별 분포
촬영장소별 분포 날씨별 분포 구분 이미지 수 비율(%) 중앙공원 2203 4 어린이대공원 3100 5 시민공원 6018 10 대신공원 1380 2 금강공원 1763 3 민락수변공원 397 1 국가지질공원 930 2 송상현광장 892 2 태종대유원지 2843 5 용두산공원 1708 3 기타 36366 63 합계 7260 100
- 라벨링 분포
라벨링 분포 파일명에 따른 이미지 수 구분 클래스명 라벨링 수 불법객체 쓰레기봉투 4651 좌판 8290 노점상 4534 푸드트럭 4587 현수막 7862 텐트 8546 연기 4413 불꽃 4628 반려동물 8819 정상객체 위해방지시설 12795 벤치 15288 공원화분 7883 쓰레기통 4732 휴게공간 3669 화장실 2579 비석 3690 가로등 11624 공원안내표지판 7471 합계 126061
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드º 공원 불법행위 및 불법객체 인식 모델을 활용한 이상상황감지 서비스
- 구축되는 공원 내 불법행위 및 불법객체 데이터 셋을 이용하여 학습 모델(SlowFast, Yolov4)을 학습 시켜 불법행위와 불법객체에 대한 Detecting이 가능함
- 학습된 모델을 이용해 CCTV관제의 불편사항을 해소할 수 있으며, 이상상황(읍급상황 등)이 발생하였을 시 위험 알림을 제공하여 경찰서 및 여러 기관에 상황을 전파할 수 있을 것으로 기대
- 공원의 CCTV는 24시간 공원 내 객체 및 불법행위에 대하여 감시하며, 영상 데이터를 통합관제센터로 전송
- 전송된 영상 데이터를 인공지능 모델을 통해 분석하고 이상 상황 발생 시 알림이 발효되어 관제요원은 알람과 원본 영상을 비교하여 상황을 판단
- 영상 내 위험요소 또는 불법행위가 발생하였을 경우 경찰서 등 유관 기관에 상황을 전파하여 단속을 시행할 수 있음
- 또한, 알람 데이터의 로그들을 분석하여 특성 시간 또는 기간에 자주 행해지는 불법행위에 대한 집중단속을 시행할 수 있고, 공원의 안내문을 개정할 수 있음
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 행동 인식 모델 Action Recognition YOLO v4, SlowFast AccuracyTop-1 73 % 99.89 % 2 행동 인식 모델 Action Recognition YOLO v4, SlowFast AccuracyTop-5 90 % 10 % 3 객체 인식 모델 Object Detection YOLO v4, SlowFast mAP 45 % 86.57 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드º 행위클래스(불법행위, 정상행위) 포맷 예시
1. 데이터 구성
- 행위클래스의 경우 불법행위 및 정상행위로 나누어져 있음 - 정의된 불법행위 및 정상행위에 따라 연출을 이용하여 데이터를 수집
- 불법행위 및 정상행위에 대해 각 프레임별로 라벨링
- 행위 클래스는 모두 영상 데이터 이며 영상 하나당 하나의 JSON으로 구성
2. 어노테이션 포맷
º 행위클래스(불법행위, 정상행위) 포맷 예시 구분 항목명 타입 필수여부 설명 1 info Object 데이터셋 정보 01월 01일 info.file_name String Y 파일 이름 01월 02일 info.height Number Y 영상 크기(높이) 01월 03일 info.width Number Y 영상 크기(너비) 01월 04일 info.date_captured String Y 영상 촬영 날짜 01월 05일 info.time String Y 시간대 01월 06일 info.frame Number Y 영상 데이터 총 프레임 01월 07일 info.fps Number Y 영상의 fps 01월 08일 info.location String Y 영상 촬영 도시 및 장소 01월 09일 info.park_type String Y 촬영 영상의 공원 유형 01월 10일 info.weather String Y 영상 촬영 날짜의 날씨 01월 11일 info.video_length String Y 영상 데이터의 총 길이 01월 12일 info.username String Y 작업자 이름 2 events Object 행동 정보 02월 01일 events[].object_id Number Y 객체 클래스 넘버 02월 02일 events[].actor_id Number Y 지정된 연기자의 아이디 02월 03일 events[].start_time String Y 이벤트 시작 시간 02월 04일 events[].end_time String Y 이벤트 끝나는 시간 02월 05일 events[].ev_start_frame Number Y 이벤트가 시작되는 프레임 02월 06일 events[].ev_end_frame Number Y 이벤트가 끝나는 프레임 02월 07일 events[].class_description String Y 클래스 정의 3 annotations Object 라벨링 정보 03월 01일 annotations[].object_id String Y 객체 클래스 넘버 03월 02일 annotations[].class_name String Y 클래스 이름 03월 03일 annotations[].cur_frame Number Y 현재 프레임 03월 04일 annotations[].bbox Number[][] Y 어노테이션 위치 정보 03월 05일 annotations[].actor_id Number Y 지정된 연기자 아이디 3. 실제 예시
º 객체클래스(불법객체, 정상객체) 포맷 예시
1. 데이터 구성
- 객체클래스의 경우 불법객체 및 정상객체로 나누어져 있음 - 객체의 경우 공원 뿐만아니라 여러 곳을 다니며 객체를 촬영
- 이미지 내에 개인정보(얼굴, 번호판 등)가 있는 경우 비식별화 진행
- 객체 클래스는 모두 이미지 데이터이며 이미지 하나당 하나의 JSON으로 구성
2. 어노테이션 포맷
2. 어노테이션 포맷 구분 항목명 타입 필수여부 설명 1 info Object 데이터셋 정보 1–1 info.Year String Y 촬영 연도 1–2 info.date_created String Y json 수정 날짜 1–3 info.time String Y 시간대 1–4 info.username String Y 작업자 이름 2 images Object 이미지정보 2–1 images.file_name String Y 파일 이름 2–2 images.height Number Y 이미지 크기(높이) 2–3 images.width Number Y 이미지 크기(너비) 2–4 images.date_captured String Y 이미지가 촬영된 날짜 2–5 images.location String Y 이미지 촬영 도시 및 장소 2–6 images.park_type String Y 이미지 촬영 날짜의 공원 유형 2–7 images.weather String Y 영상 촬영 날짜의 날씨 3 annotations Object 라벨링정보 3–1 annotations[].object_id Number Y 객체의 클래스 넘버 3–2 annotations[].object_class String Y 클래스 이름 3–3 annotations[].bbox Number[][] Y 어노테이션 위치 정보 4 category Object 클래스 정보 4–1 category[].id Number Y 객체 클래스 넘버 4–2 category[].object_class_name String Y 클래스 이름 4–3 category[].supercategory String Y 중분류 이름 4–4 category[].class_description String Y 클래스 정의 3. 실제 예시
-
데이터셋 구축 담당자
수행기관(주관) : ㈜디아이솔루션
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 하석주 051-717-2503 sjha@di-solution.co.kr · 실무책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜나래솔루션 · 데이터 수집 및 가공
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.