-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-04-19 원천데이터 추가 1.0 2021-06-25 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
동일 인물 및 차량 추적 솔루션에 활용할 수 있는 CCTV 영상 데이터
- 데이터 영역 : 재난안전환경
- 데이터 유형 : 이미지
- 구축년도 : 2020년
- 구축량 : 50만
구축목적
도시철도역 내 CCTV를 이용 동일인물 추적을 통한 승객 교통안전 증대, 사회범죄 예방 및 교통약자 편의성 제공을 위한 AI 학습용 데이터 구축과 AI 학습 모델 제시
-
구축 내용 및 제공 데이터량
객체 추적을 위한 동일 대상 추적 6종에 대한 총 500시간 이상 영상 데이터셋 구축
구축 내용 및 제공 데이터량 표 데이터 종류 데이터 형식 목표 수량 객체추적 6종
(휠체어, 시각장애인, 유모차 이용자, 아동 등)mp4, json (xml) 6종 클래스 총 500시간의 데이터셋
(휠체어 160시간, 시각장애인 80시간, 유모차 이용자 60시간, 아동 110시간 등) -
-
저작도구 설명서 및 저작도구 다운로드
저작도구 다운로드 -
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 재식별 정확도 Re-Identification YOLO v5 AccuracyTop-1 90 % 10 % 2 객체 추적 학습 Object Detection YOLO v5 MOTA 55 % 65.79 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.25 데이터 최초 개방 구축 목적
- 도시철도역 내 CCTV를 이용 동일인물 추적을 통한 승객 교통안전 증대, 사회범죄 예방 및 교통약자 편의성 제공을 위한 AI 학습용 데이터 구축과 AI 학습 모델 제시
활용 분야
- 개발 알고리즘과 데이터셋을 통해 도시철도역내, 기차역내, 백화점, 종합 쇼핑몰, 영화관, 아파트 그리고 다양한 관공서들 등의 유동인구가 많은 실내 공간의 지능형 CCTV 영상에 적용 가능
소개
- 도시철도 역사내에서 교통약자 추적 서비스를 위한 객체추적 6종의 대상을 정의하고 이를 감지할 수 있는 AI 알고리즘 개발 및 각 클래스별 데이터셋 구축을 통해 도시철도에서 실제적으로 활용할 수 있는 응용 서비스를 개발
구축 내용 및 제공 데이터량
- 객체추적을 위한 동일 대상 추적 6종에 대한 총 500시간 이상 영상 데이터셋 구축
구축 내용 및
제공 데이터량 표데이터 종류 데이터 형식 목표 수량 객체추적 6종(휠체어, 시각장애인, 유모차 이용자, 아동 등) mp4, json(xml) 6종 클래스 총 500시간의 데이터셋(휠체어 160시간, 시각장애인 80시간, 유모차 이용자 60시간, 아동 110시간 등) 대표도면
필요성
- 매년 도시철도(지하철) 역사에서는 다양한 안전사고와 범죄가 발생하고 있으며 운영 기관의 예방 노력에도 꾸준히 증가하고 있는 추세임
- 또한 최근 코로나 19 확산을 막기 위한 조치로 지자체에서는 감염자 동선파악 등 적극적인 방역지침을 수행하고 있으며 대중교통 및 공공장소에서의 방역 및 위생관리가 필수사항이 되고 있음
- 도시철도 역사에서의 이상행동 및 추적 영상 학습 데이터 구축을 통해 안전사고, 범죄 및 코로나 19로부터 도시철도 이용객을 보호하고 이를 위해 인공지능을 활용한 CCTV 개발 및 적용 등 적극적이고 선제적인 대처가 요구되고 있음
- 이에 도시철도역 CCTV를 이용하여 안전사고, 사회범죄를 조기에 감지하여 신속히 대응하고, 교통약자의 경우 추적 관찰을 통하여 적기의 돌봄 서비스를 제공하기 위해 역사내 CCTV에 AI를 접목하여 지능화 및 고도화시키기 위해 검증된 학습용 데이터를 구축하고자 함
데이터 구조
- 데이터구성(객체추적)
어노테이션 포맷 표 Key Description Type id - - - 아이디 String file - - - 참조 영상명 String metadata - - - 메타 데이터 JsonObjArr width - - 영상 너비 Number height - - 영상 높이 Number duration - - 영상 길이 Number fps - - 영상 fps Number frames - - 영상 frame 개수 Number created - - 영상 생성일 Datetime frames - - - 프레임 정보 JsonObjArr number - - 프레임 넘버 Number image - - 프레임 이미지 파일명 String annotations - - 어노테이션 정보 JsonObjArr label - 어노테이션 객체 박스 정보 JsonObj x 박스 좌측 상단 x 좌표 Number y 박스 좌측 상단 y 좌표 Number width 박스 너비 Number height 박스 높이 Number category - 어노테이션 객체 클래스 정보 JsonObj code 어노테이션 객체 클래스 명 String attributes 어노테이션 객체 추가 속성 정보 JsonObjArr - 어노테이션 포맷
- 객체추적 어노테이션 포맷
- root 포맷어노테이션 포맷 (root)표 패러미터명 데이터타입 설명 id number · 데이터 고유번호 file string · 원본 영상 파일 경로 metadata object · 원본 영상 메타데이터 frames Object[] · 추적 대상 객체 존재 프레임 목록
- root > metadata 포맷어노테이션 포맷 (root > metadata 포맷)표 패러미터명 데이터타입 설명 width number · 영상 너비 height number · 영상 높이 duration number · 영상 길이 fps number · 초당 프레임 수 frames number · 총 프레임 수 created datetime · 촬영 날짜 및 시간
- root > frame 포맷어노테이션 포맷 (root > frame)표 패러미터명 데이터타입 설명 number number · 프레임숫자 image string · 프레임 이미지 파일 경로 annotations object[] · 어노테이션 정보 목록
- root > event > frame > annotation 포맷어노테이션 포맷 (root > event > frames > annotation)표 패러미터명 데이터타입 설명 label object · 바운딩박스 정보 global_id string · 객체 글로벌 고유번호 category string · 객체 분류명
- root > event > frame > annotation > label 포맷어노테이션 포맷 (root > event > frame > annotation > label)표 패러미터명 데이터타입 설명 x number · 바운딩박스 좌측상단 포인트 x 좌표 y number · 바운딩박스 좌측상단 포인트 y 좌표 width number · 바운딩박스 너비 height number · 바운딩박스 높이
-
데이터셋 구축 담당자
수행기관(주관) : 대전도시철도공사
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 이경복 042-539-3920 kblee@djtc.kr · 사업 및 데이터 구축 총괄 · 응용 서비스 구축 및 활용 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 데이터메이커 · CCTV 영상 데이터 수집ㆍ정제ㆍ가공ㆍ검수 한국창직협회 · CCTV 영상 데이터 가공ㆍ검수 한국기계연구원 · 이상행동 13종 감지를 위한 AI 모델 및 응용서비스 개발 한밭대학교 · 객체추적 6종 감지를 위한 AI 모델 및 응용서비스 개발 알에프컴 · AI CCTV 응용서비스 개발을 위한 시스템 구축 플랜아이 · CCTV 영상 데이터 수집 및 해커톤 대회 개최 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 오석일(데이터메이커) 070-4105-4370 seokil.oh@rdproject.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.