지역안전재난(산불) 방재의 고도화를 위한 대규모 인공지능 데이터베이스 구축
- 분야재난안전환경
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-12-01 데이터 최종 개방 1.0 2023-05-04 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-12-08 산출물 전체 공개 소개
산불의 초기 발화 상황을 카메라 영상 기반으로 자동 감지할 수 있도록, AI 학습용 대규모 데이터를 구축하고, AI 학습모델을 개발 및 검증하며, 산악지형에 적용한 응용서비스를 제공할 수 있는 데이터셋의 구축
구축목적
강릉시 지자체에서 관리중인 산림 현장에서 모의발화를 진행하여 실제 화재, 연막탄, 연기발생기와 같은 장치를 사용해 실제 초기 산불 데이터와 유사한 동영상을 수집
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 자체 수집 라벨링 유형 세그멘테이션 (이미지) 라벨링 형식 JSON 데이터 활용 서비스 산불 조기 감지를 위한 지능형 CCTV 시스템, 산불 감시를 위한 Drone 감지 시스템 데이터 구축년도/
데이터 구축량2022년/이미지 700,000장 -
데이터 분포
1. 다양성(통계)
1.1 Synthetic 이미지의 배경 분포Synthetic 이미지의 배경 분포 구분 수량 비율 강원도강릉시강동면모전리 1,874 0.27% 강원도강릉시경포대공터 16,653 2.38% 강원도강릉시경포대입구 16,304 2.33% 강원도강릉시경포저수지 1,088 0.16% 강원도강릉시구정면 14,174 2.02% 강원도강릉시 2,087 0.30% 강원도강릉시모래고개입구 11,402 1.63% 강원도강릉시사천면 2,004 0.29% 강원도강릉시성산면 22,676 3.24% 강원도강릉시솔향수목원 158,982 22.71% 강원도강릉시시루봉정상입구 47,442 6.78% 강원도강릉시옥계면 1,695 0.24% 강원도강릉시옥천면 6,103 0.87% 강원도강릉시장현동 16,304 2.33% 강원도강릉시저동 1,234 0.18% 강원도강릉시죽헌저수지 1,098 0.16% 강원도강릉시죽헌저수지삼거리 54,993 7.86% 강원도강릉시춘갑봉공터 38,298 5.47% 강원도강릉시춘갑봉등산로 8,068 1.15% 강원도강릉시춘갑봉민가 7,470 1.07% 강원도강릉시춘갑봉샛길 2,031 0.29% 강원도강릉시칠성저수지 1,037 0.15% 강원도삼척시교동 2,507 0.36% 강원도평창군대관령면 1,877 0.27% 경기도광명시 10,223 1.46% 경기도김포시하성면석탄리 14,158 2.02% 경기도남양주시와부읍 5,026 0.72% 경기도안산시단원구 20,478 2.93% 경기도양주시남면 4,031 0.58% 경기도양평군강상면 15,491 2.21% 경기도파주시 3,221 0.47% 경기도포천시북면신평리 15,643 2.23% 경포대후문 35,695 5.10% 구라미휴게소 2,730 0.39% 김포시월곶면포내리 8,461 1.21% 대기리안반데기옥녀봉 4,953 0.71% 대전대덕구대청로 22,879 3.27% 대전영동군초강소류지 766 0.11% 모산로모래고개 28,992 4.14% 백봉령 8,646 1.24% 서울시 2,059 0.29% 시루봉 28,560 4.08% 시청옥상 9,937 1.42% 인천시 7,501 1.07% 죽헌저수지공터 11,220 1.60% 충북청주시상당구문의면 818 0.12% 기타 1,011 0.14% 합계 700,000 100% 1.2 수집 방법별 분포
수집 방법별 분포 구분 수량 비율 CCTV 112,000 16.00% 모의발화 360,000 51.43% 크라우드소싱 228,000 32.57% 합계 700,000 100% 1.3 촬영 날씨별 분포
촬영 날씨별 분포 구분 수량 비율 맑음 410,425 58.63% 비 144,116 20.59% 흐림 145,459 20.78% 합계 700,000 100% 1.3 촬영 습도별 분포
촬영 습도별 분포 구분 수량 비율 0 ~ 25 57,014 8.14% 25.1 ~ 35 43,597 6.23% 35.1 ~ 45 54,399 7.77% 45.1 ~ 60 95,212 13.60% 60.1 ~ 100 449,778 64.25% 합계 700,000 100%
2. 다양성(요건)
2.1 산불 객체 최소 수량산불 객체 최소 수량 구분 수량 비율 화염 142,945 12.64% 흑색연기 220,213 19.47% 백색/회색연기 386,373 34.16% 구름 180,256 15.94% 굴뚝연기 132,236 11.69% 안개/안무 69,151 6.11% 합계 1,131,174 100% 2.2 객체 유형별 분포
객체 유형별 분포 구분 수량 비율 Positive Real DB 360,000 51.43% Positive Synthetic DB 140,000 20.00% Negative DB 200,000 28.57% 합계 700,000 100% 2.3 촬영 기기별 분포
촬영 기기별 분포 구분 수량 비율 육상카메라 560,000 80% 드론 140,000 20% 합계 700,000 100% 2.4 촬영 시간대별 분포
촬영 시간대별 분포 구분 수량 비율 오전(06-10) 173,584 24.80% 정오(11-13) 171.931 24.56% 오후(14-18) 172.923 24.70% 야간(19-05) 181.562 25.94% 합계 700,000 100% 2.5 촬영 거리별 분포
촬영 거리별 분포 구분 수량 비율 근거리(2.5m~50m) 247,841 35.41% 중거리(50m~300m) 242,480 34.64% 원거리(300m~1km) 209,679 29.95% 합계 700,000 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드모델 모델명 Swin Transformer 모델 설명 1. Swin Transformer는 구글에서 제안한 비전 트랜스포머의 단점을 개선한 Transformer 계열 모델 2. swin은 shifted window를 말하며, 이는 네트워크가 깊어질수록 이미지의 window가 이동하여 self-attention을 수행해 선형적인 연산을 가지면서도 작은 객체까지 검출이 가능해 높은 성능을 보임 3. 모델 소스 깃헙: https://github.com/open-mmlab/mmdetection 모델 아키텍쳐 Input imag, Output image (B, H, W, 3), (B, H, W, 3) Task Instance segmentation Training dataset 훈련 셋 80% (199,928), 검증 셋 10%(24,880), 테스트 셋 10%(24,963) 학습 조건 image(resize, normalize, randomflip), workers_per_gpu=4, lr=1e-4, weight_decay = 5e-2, Epochs = 50, evaluation = [box, segm], warmup_iters = 1000, warmup_ratio = 1e-3 평가 메트릭 mAP
저작권 표기 SPDX-FileCopyrightText: © 2022 ONSS CO., LTD. SPDX-License-Identifier:Apache-2.0 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 산불 객체 탐지 성능(real DB) Object Detection Swin Transformer mAP 50 % 54.3 % 2 산불 객체 탐지 성능(synthetic DB) Object Detection SwinTransformer-based MaskRCNN mAP 55 % 65.2 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드1.데이터 설명
1.데이터 설명 구분 획득(수집) 단계 정제 단계 가공(라벨링) 단계 데이터 구분 원시데이터 원천데이터 최종데이터 데이터 형태 모의발화 등 촬영 → 동영상 동영상 → 스틸 컷 이미지 및 가공데이터 데이터 포멧 데이터포맷 : MP4파일 이미지 규격 상세 : JPG 이미지: JPG (컬러) FHD / 해상도 1920*1280 가공데이터: JSON (1920*1280) 컬러 2.데이터 포맷
2.데이터 포맷 구분 카테고리 객체 이미지 가공기준 Positive Smoke 흑색연기 육상 촬영 및 드론촬영으로 생성된 원천데이터의 육안으로 확인가능한 모든 흑색연기 Real DB Smoke 백색/회색연기 육상 촬영 및 드론촬영으로 생성된 원천데이터의 육안으로 확인가능한 모든 백색/회색 연기 Fire 화염 육상 촬영 및 드론촬영으로 생성된 원천데이터의 육안으로 확인가능한 모든 화재 Positive Smoke 흑색연기 합성으로 만들어진 데이터의 육안으로 확인가능한 모든 흑색연기 Synthetic DB Smoke 백색/회색연기 합성으로 만들어진 데이터의 육안으로 확인가능한 모든 백색/회색 연기 Fire 화염 합성으로 만들어진 데이터의 육안으로 확인가능한 모든 화재 Negative DB Non-Fire 구름 하늘에 있는 모든 구름 (하얀 구름, 먹구름 등) 안개/연무 산배경에 육안으로 보이는 모든 안개 굴뚝연기 굴뚝에서 나오는 모든 연기(수증기) 2.데이터 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 info object 데이터셋정보 1-1 info[].name string Y 데이터셋명 PositiveRealDB, PositiveSyntheticDB, NegativeDB 1-2 info[].license string Y 라이센스 ㈜데이터메티카 1-3 info[].description string 데이터셋상세설명 1-4 info[].date_created string Y 데이터셋생성일자 yyyymmdd 1-5 info[].camera_id string 데이터셋 카메라번호 1-6 info[].video_id string 데이터셋 클립번호 001~999 2 categories object 클레스 종류 및 클레스식별자 2-1 categories[].id int Y 클레스 아이디 2-2 categories[].name string Y 클레스 이름 2-3 categories[].supercategory string 클레스 분류 3 images object 이미지정보 3-1 images[].id int Y 이미지식별자 3-2 images[].width int Y 이미지너비 3-3 images[].height int Y 이미지높이 3-4 images[].file_name string Y 이미지파일명 4 annotations object 라벨링정보 4-1 annotations[].id int Y 라벨링식별자 4-2 annotations[].image_id int Y 이미지식별자 4-3 annotations[].category_id int Y 클래스식별자 1~6 1:classA 2:classB ... 4-4 annotations[].segmentation float Y 라벨링값 4-5 annotations[].area int Y 라벨링 면적정보 4-6 annotations[].bbox array Y 라벨링 Bounding Box값 [x1, y1, x2, y2] 4-7 annotations[].iscrowd int Y 라벨링 겹쳐짐 여부 5 environment object 환경정보 5-1 environment[].address string Y 원시데이터 수집 장소 구분 5-2 environment[].datetime string Y 원시데이터 수집 시간 구분 yyyymmdd_HHMMSS 5-3 environment[].timezone string Y 원시데이터 수집 시간대 구분 오전(06~10), 정오(11~13), 오후(14~18), 야간(19~05) 5-4 environment[].device string Y 원시데이터 수집 촬영도구 구분 육상카메라 cctv gopro phone etc 드론 drone 5-5 environment[].collection string Y 원시데이터 수집 방법에 대한 구분 모의발화 크라우드소싱 관제센터CCTV 5-6 environment[].weather string Y 원시데이터 수집 날씨 구분 맑음, 흐림, 비 5-7 environment[].humidity float Y 원시데이터 수집 습도 구분 0.0~25.0, 25.1~35.0, 35.1~45.0, 45.1~60.0, 60.1~100 5-8 environment[].distance string 원시데이터 수집시 촬영 기기와 객체까지의 거리 구분 null, 근거리 (2.5~49), 중거리 (50~299), 원거리 (300이상) 5-9 environment[].gps string 원시데이터 수집 위도, 경도 5-10 environment[].elevation string 원시데이터 수집 고도 3. 데이터 폴더명 및 파일명 구성
3. 데이터 폴더명 원천데이터/라벨링데이터 DB형태_객체 장소_카메라번호 동영상번호_발화재 원천데이터 PositiveRealDB_화염 강원도강릉시경포대공터_RD061031 067_액체연료 3. 데이터 폴더명 DB형태 객체 장소 카메라번호 동영상번호 발화재 프레임번호 확장자 (jpg, json) PositiveRealDB 화염 강원도강릉시경포대공터 RD061031 67 액체연료 29 jpg PositiveRealDB_화염_강원도강릉시경포대공터_RD061031_067_액체연료_00000029.jpg 4. 실제 예시
{
"info": {
"name": "PositiveRealDB",
"license": "(주)데이터메티카",
"description": "",
"date_created": "20221205",
"camera_id": "RD030055",
"video_id": "012"
},
"categories": [
{
"id": 1,
"name": "흑색연기",
"supercategory": ""
},
{
"id": 2,
"name": "백색/회색연기",
"supercategory": ""
},
{
"id": 3,
"name": "화염",
"supercategory": ""
},
{
"id": 4,
"name": "구름",
"supercategory": ""
},
{
"id": 5,
"name": "안개/연무",
"supercategory": ""
},
{
"id": 6,
"name": "굴뚝연기",
"supercategory": ""
}
],
"images": [
{
"id": 1,
"width": 3840,
"height": 2160,
"file_name":"PositiveRealDB_백색회색연기_강원도강릉시솔향수목원_RD030055_012_연막탄(흑색)_00000209.jpg"
}
],
"annotations": [
{
"id": 1,
"image_id": 1,
"category_id": 2,
"segmentation": [
[
1915.41,
1077.17,
1909.29,
1075.53,
1902.76,
1073.49,
1896.63,
1071.04,
1892.55,
1066.14,
1890.92,
1059.61,
1890.1,
1053.08,
1890.51,
1046.95,
1892.96,
1040.42,
1895.81,
1034.71,
1900.71,
1029.81,
1905.21,
1024.91,
1911.33,
1021.64,
1917.45,
1020.42,
1923.99,
1020.42,
1929.7,
1017.97,
1935.01,
1014.29,
1941.54,
1011.03,
1947.26,
1008.17,
1953.38,
1007.35,
1959.1,
1010.62,
1962.36,
1016.33,
1964.81,
1022.46,
1966.86,
1028.58,
1967.26,
1035.11,
1967.26,
1042.46,
1964.41,
1048.59,
1959.51,
1054.3,
1954.2,
1058.79,
1948.89,
1062.06,
1942.77,
1064.51,
1937.05,
1066.96,
1931.74,
1070.23,
1929.7,
1071.04
]
],
"area": 3649.0,
"bbox": [
1890.1,
1007.35,
77.16,
69.82
],
"iscrowd": 0
}
],
"environment": {
"address": "강원도강릉시솔향수목원",
"datetime": "20221031_110000",
"timezone": "정오",
"device": "drone",
"collection": "모의발화",
"weather": "맑음",
"humidity": 59.0,
"distance": "120",\
"gps": "37.697849, 128.861917",
"elevation": "93"
}} -
데이터셋 구축 담당자
수행기관(주관) : (주)비젼인
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김학일 02-867-7386 hikim@vision-in.co.kr 총괄책임자 수행기관(참여)
수행기관(참여) 기관명 담당업무 (주)데이터메티카 데이터 가공 (주)에스에스엘 데이터 검수 및 검증 (주)상상할수없는 데이터 학습, AI모델 개발 강릉과학산업진흥원 데이터 검수 및 검증 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김학일 02-867-7386 hikim@vision-in.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.