※ 25년 신규 개방되는 데이터로, 데이터 활용성 검토, 이용자 관점의 개선의견 수렴 등을 통해 수정/보완될 수 있으며 최종데이터, 샘플데이터, 산출물 등은 변경될 수 있습니다
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2025-04-23 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2025-04-23 산출물 전체 공개 소개
실제 CCTV 데이터(지자체 및 공공기관으로부터 공수)를 활용하여 안전사고 6종(침입, 싸움, 쓰러짐, 군집, 인파밀집, 침수)가 포함된 영상 총 300건
구축목적
지능형 CCTV 구축에 활용할 수 있는 안전사고 관련 AI 학습 데이터 구축
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 비디오 데이터 형식 mp4 데이터 출처 자체수집(지자체로부터 공수) 라벨링 유형 구간태깅/캡션 라벨링 형식 json 데이터 활용 서비스 ● 어린이 보호 및 안전 확보어린이 보호구역에서 어린이들의 동선을 모니터링하고, 필요한 경우 부모 또는 담당자에게 알림을 보내어 어린이 안전 확보에 기여 ● 교통 안전 및 교통 흐름 관리어린이 보호구역에서 교통 흐름을 모니터링하여 교통사고 예방과 교통 효율성 향상에 기여 데이터 구축년도/
데이터 구축량2024년/300건 -
데이터 구축 규모
가. 데이터 구축 수량데이터 구축 규모-가.데이터 구축 수량 원천데이터
주분류구축 수량(건) 구축 비율 원천데이터
세분류라벨링 데이터(JSON)
구축 수량(건)안전사고 4종을 포함한
실제 CCTV 영상200 66.70% 침입 이벤트 영상 55 쓰러짐 이벤트 영상 45 싸움 이벤트 영상 30 군집 이벤트 영상 70 소계 200 특화 데이터 100 33.30% 인파밀집 이벤트 영상 40 침수 이벤트 영상 60 소계 100 총 합계 300 100% 총 합계 300 데이터 분포
가. 데이터 다양성
● 이벤트별 분포데이터 분포-가.데이터 다양성-이벤트별 분포 주분류 이벤트 분류 수량(건) 비율(%) 안전사고 4종을 포함한
실제 CCTV 영상침입 이벤트 영상 55 18.33 쓰러짐 이벤트 영상 45 15 싸움 이벤트 영상 30 10 군집 이벤트 영상 70 23.33 특화 데이터 인파밀집 이벤트 영상 40 13.33 침수 이벤트 영상 60 20 총 합계 총 합계 300 100 ● 이벤트별 영상 길이 분포
데이터 분포-가. 데이터 다양성-이벤트별 영상 길이 분포 이벤트 영상 시간 수량(건) 비율(%) 침입 1분 미만 42 14 1분 이상 2분 미만 9 3 2분 이상 4 1.33 쓰러짐 1분 미만 11 3.67 1분 이상 2분 미만 4 1.33 2분 이상 30 10 싸움 1분 미만 2 0.67 1분 이상 2분 미만 5 1.67 2분 이상 23 7.67 군집 1분 미만 3 1 1분 이상 2분 미만 0 0 2분 이상 67 22.33 인파밀집 1분 미만 0 0 1분 이상 2분 미만 14 4.67 2분 이상 26 8.67 침수 1분 미만 0 0 1분 이상 2분 미만 0 0 2분 이상 60 20 총 합계 300 100
● 캡션 분포데이터 분포-가. 데이터 다양성-캡션 분포 구분 개수 비율 9 24건 8.00% 10 38건 12.67% 11 48건 16.00% 12 39건 13.00% 13 35건 11.67% 14 23건 7.67% 15 20건 6.67% 16 18건 6.00% 17 9건 3.00% 18 10건 3.33% 19 6건 2.00% 20 3건 1.00% 21 1건 0.33% 22 1건 0.33% 23 4건 1.33% 24 4건 1.33% 25 3건 1.00% 26 2건 0.67% 28 1건 0.33% 29 2건 0.67% 30 2건 0.67% 31 1건 0.33% 32 1건 0.33% 33 1건 0.33% 35 1건 0.33% 36 1건 0.33% 37 1건 0.33% 47 1건 0.33% 합계 300 100 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드활용 AI모델 설명 데이터명 AI모델 task AI모델 성능 지표 및 목표값 Data I/O (재난안전)
지능형 관제서비스에
필요한 데이터Anomaly Detection In Surveillance Videos PEL4VAD AUC(80%) Input data : Video
output data : Json(event time)PEL4VAD 아키텍쳐 Weakly-Supervised 비디오 이상 탐지에서 효율적인 컨텍스트 모델링과 의미론적 분별력 향상을 달성함.
제안된 Temporal Context Aggregation (TCA) 모듈은 기존의 병렬 구조 기반 방법들과 비교해 더 효율적으로 컨텍스트 정보를 캡처하여 모델의 파라미터 수와 계산 비용을 감소시킴. 이로써 UCF-Crime 데이터셋에서 AUC 기준 85.72%를 달성하고, XD-Violence 데이터셋에서는 AP 기준 83.28%의 성능을 보여 기존의 RTFM이나 HL-Net과 같은 최첨단 방법 대비 우수한 성능을 보임.
Prompt-Enhanced Learning (PEL) 모듈의 도입을 통해서는 비디오 내 이상 클래스 간의 세분화된 탐지 성능을 크게 향상시킴. 특히 PEL 모듈을 적용한 후 UCF-Crime 데이터셋에서 AUC가 86.76%로 상승하였으며, XD-Violence에서는 AP 기준 85.59%를 달성함. 이는 특히 다양한 유형의 이상 행동이 혼재된 XD-Violence 데이터셋에서 기존 방법 대비 3% 이상의 AP 향상을 보여줌.
또한, 제안된 프레임워크는 일부 세분화된 이상 클래스에서 약 10%의 탐지 정확도 향상을 보이며, 특히 UCF-Crime 데이터셋 내에서 Abuse나 Assault와 같은 클래스에 대해 다른 모델 대비 뛰어난 분별력을 나타냄. -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드가. 데이터 포맷
데이터 포맷 대분류(이벤트 분류) 데이터 소분류 데이터 세분류 수량 침입 55 쓰러짐 45 싸움 30 군집 70 인파밀집 할로윈데이
1주 전 week금 40 토 할로윈데이
포함 week일 목 금 침수 0단계 골목길 60 교차로 대로 1단계 골목길 교차로 대로 기타 2단계 골목길 나. 어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 video object 필수 1-1 video.filename number 필수 1-2 video.width number 필수 1-3 video.height number 필수 1-4 video.frame_count number 필수 1-5 video.data_speed number 필수 1-6 video.bit_speed number 필수 1-7 video.cctv_distribution string 필수 cctv가 촬영한 개소명(가칭) 1-8 video_date string 필수 촬영 날짜 1-9 video_night boolean 필수 촬영된 영상의 밤/낮 여부 2 annotations object 필수 2-1 annotations.event_class string 필수 발생 이벤트 명 (영문) 2-2 annotations.event_length number 필수 이벤트 발생 시간의 합 2-3 annotations.event_frame array 필수 이벤트 발생 시작 프레임, 이벤트 발생 끝 프레임 2-4 annotations.event_caption string 필수 이벤트 설명 캡션 2-5 annotations.depersonalization boolean 필수 개인정보 비식별화 여부 다. 영상구간 태깅 데이터(JSON) 예시
● 한 영상에 한가지 이벤트가 발생한 경우{
"metadata": {
"file_name": "E01_021.mp4",
"width": 1920,
"height": 1080,
"frame_count": 4171,
"data_speed": 501683.69621491025,
"bit_speed": 4003424,
"cctv_distribution": "E01_021",
"date": "240928",
"night": false
},
"annotations": {
"event_class": "Invasion",
"event_frame": [
[
1927,
2360
]
],
"event_length": 14.83,
"event_caption": "학교 안에 침입해 있던 두 사람이 학교 담장을 넘어 밖으로 나감",
"depersonalization": true
}
● 한 영상에 두 가지 이상의 이벤트가 발생한 경우{
"metadata": {
"file_name": "E01_039.mp4",
"width": 1920,
"height": 1080,
"frame_count": 3908,
"data_speed": 250155.55930746562,
"bit_speed": 1990669,
"cctv_distribution": "E01_039",
"date": "240929",
"night": false
},
"annotations": {
"event_class": "Invasion",
"event_frame": [
[
363,
1005
],
[
2358,
3539
],
[
1599,
2303
]
],
"event_length": 84.23,
"event_caption": "횡단보도를 건너온 세 사람이 철제 울타리를 넘어 학교로 침입함/울타리를 넘어 학교로 함께 침입했던 3명의 무리에서 2명이 먼저 학교 밖으로 나가고 잠시 뒤 검은색 상의를 입은 사람이 학교 안에서 바깥으로 나옴/울타리를 넘어 학교로 침입했던 한 사람이 밖으로 나가고 동시에 횡단보도를 건너온 한 무리의 사람들이 울타리를 넘어 학교로 침입함",
"depersonalization": true
} -
데이터셋 구축 담당자
수행기관(주관) : 힌국딥러닝(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 천효창 파트장 070-8805-2612 hcc@koreadeep.com 데이터 품질관리 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 쿠도커뮤니케이션(주) 데이터 획득(CCTV 데이터 수집), 데이터 정제 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 한국딥러닝(주) 천효창 010-8853-0465 hcc@koreadeep.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 한국딥러닝(주) 천효창 010-8853-0465 hcc@koreadeep.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 한국딥러닝(주) 천효창 010-8853-0465 hcc@koreadeep.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.