-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2024-06-24 최종데이터 추가 개방 Training(원천/라벨링 데이터) 1.0 2021-06-18 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-12 신규 샘플데이터 개방 소개
해저면에 침적되어 있는 쓰레기 탐지를 위한 수중 촬영 이미지 데이터
구축목적
해양 침적 쓰레기의 수거를 위해 실시, 설계 조사를 보다 빠르고 효율적으로 수행하고자 조사 과정에서 생성되는 소나 조사 이미지와 수중 촬영 이미지를 통해 침적 쓰레기를 자동 인식하고 분류할 수 있도록 인공지능을 훈련하기 위한 데이터셋
-
메타데이터 구조표 데이터 영역 재난안전환경 데이터 유형 이미지 데이터 형식 데이터 출처 라벨링 유형 라벨링 형식 데이터 활용 서비스 데이터 구축년도/
데이터 구축량2020년/4.8만 -
구축 내용 및 제공 데이터량
- 구축된 AI데이터의 총 이미지 건수는 48,000건으로 소나 조사 이미지 33,000건 수중 촬영 이미지 15,000건임. 구축된 이미지 내에 포함되어 있는 카테고리별 오브젝트 건수는 아래와 같음
- 소나 조사 이미지 카테고리별 오브젝트 구축 건수구축 내용 및 제공 데이터량 타이어 로프 나무 통발 어망 대조구 계 1,869 5,844 3,069 5,429 1,858 28,619 46,688
- 수중 촬영 이미지 카테고리별 오브젝트 구축 건수구축 내용 및 제공 데이터량 타이어 로프 나무 통발류 어망류 계 4,027 4,587 3,133 5,930 1,253 18,930
- 구축된 AI데이터의 총 이미지 건수는 48,000건으로 소나 조사 이미지 33,000건 수중 촬영 이미지 15,000건임. 구축된 이미지 내에 포함되어 있는 카테고리별 오브젝트 건수는 아래와 같음
-
-
AI 모델 상세 설명서 다운로드
AI 모델 다운로드 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 수중 촬영 이미지 객체검출 성능 Object Detection YOLO v5 mAP@IoU 0.5 75 % 89.8 % 2 소나 조사 이미지 객체검출 성능 Object Detection YOLO v5 mAP@IoU 0.5 50 % 53.5 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2021.06.18 데이터 최초 개방 구축 목적
- 해양 침적 쓰레기의 수거를 위해 실시, 설계 조사를 보다 빠르고 효율적으로 수행하고자 조사 과정에서 생성되는 소나 조사 이미지와 수중 촬영 이미지를 통해 침적 쓰레기를 자동 인식하고 분류할 수 있도록 인공지능을 훈련하기 위한 데이터셋
활용 분야
- 바다나 하천, 호소 지역의 수중에 가라앉아 있는 침적 쓰레기 조사 사업에 활용할 수 있는 AI기반 수중조사 솔루션 개발
소개
- 해양 침적 쓰레기 조사 이미지로부터 각 원시데이터별 주요 쓰레기 유형을 분류하고 이에 대한 AI학습용 데이터셋을 구성함 침적 쓰레기 조사에 가장 널리 사용되는 소나 조사 이미지와 수중 촬영 이미지 2종에 대한 가공을 통해 라벨링 데이터를 생성함
<소나 조사 이미지 원천 데이터>
<수중 촬영 이미지 원천 데이터>
구축 내용 및 제공 데이터량
- 구축된 AI데이터의 총 이미지 건수는 48,000건으로 소나 조사 이미지 33,000건 수중 촬영 이미지 15,000건임. 구축된 이미지 내에 포함되어 있는 카테고리별 오브젝트 건수는 아래와 같음
- 소나 조사 이미지 카테고리별 오브젝트 구축 건수구축 내용 및 제공 데이터량 타이어 로프 나무 통발 어망 대조구 계 1,869 5,844 3,069 5,429 1,858 28,619 46,688
- 수중 촬영 이미지 카테고리별 오브젝트 구축 건수구축 내용 및 제공 데이터량 타이어 로프 나무 통발류 어망류 계 4,027 4,587 3,133 5,930 1,253 18,930
대표도면
- 소나 조사 이미지
- 라벨링 데이터
- 어노테이션 파일
- 수중 촬영 이미지
- 라벨링 데이터
- 어노테이션 파일
필요성
- 국내 해양 환경문제 해결을 위한 기초데이터 수집현황은 해외 선진국에 비해 대단히 낙후한 수준임
- 최근 20여년 동안 해양쓰레기 수거를 위한 조사활동은 소수 전문가에 의한 수작업으로 진행되어 왔으며 날로 심각해져가는 환경문제를 감당하기 힘든 상황에 한계상황을 보이고 있음
- 해양에서의 데이터 수집은 대단히 많은 예산을 필요로 하고 작업 자체도 난이도가 높고 위험하기 때문에, 국제적으로도 수집된 데이터가 적고 구하기 힘들다는 특성이 있음
- 이에 관련 기술의 확보와 수준 향상을 위해 검증된 학습용 데이터를 구축하여 국가 경쟁력 확보에 기여하고자 함
데이터 구조
- 데이터 구성
데이터 구성 표1 설계분류 설계 및 규칙 Format&codec - JPG Resolution - Sonar image
- 640 X 640 Pixel
- Camera image
- SD : 640 X 480(360) pixel
- HD : 1280 X 720 pixel
- FHD : 1920 X 1080 pixelLabeling - Bounding box Spec.
Camera image : min. 20 X 20 Pixel
- .xml<이미지 데이터 포맷>
데이터 구성 표2 대분류 중분류 소분류 영문명 소나 타이어 타이어 tire 통발류 스프링통발 spring fish trap 원형통발 circular fish trap 어망류 어망 fish net 나무 나무 wood 로프 로프 rope 대조군 암반군 bedrock group 연흔 ripple marks 인공어초 artificial reef 인공어초군 artificial reef group 콘크리트블럭 contrete block 기타 객체 other objects 객체없는지형 no object 수중
촬영타이어 타이어 tire 통발류 스프링통발 spring fish trap 원형통발 circular fish trap 사각통발 rectangular fish trap 장어통발 eel fish trap 어망류 어망 fish net 나무 나무 wood 로프 로프 rope 로프뭉치 bundle of rope <객체 카테고리 분류>
- 어노테이션 포맷
어노테이션 포맷 표1 NO 영문명 데이터 설명 최대길이 타입 필수 여부 작성 규칙 1 folder 파일 상위 폴더 이름 100 string Y 2 filename 이미지 파일 이름 100 string Y 3 path 이미지 파일 경로(상대경로) 100 string Y 4 size 이미지 크기 정보 4-1 size width 이미지 넓이 4 int Y 4-2 size height 이미지 높이 4 int Y 4-3 size depth 이미지 채널 4 int Y 5 commoninfo 데이터셋 일반정보 5-1 commoninfo.datasetname 데이터셋 이름 100 string Y 5-2 commoninfo.createdate 데이터셋 생성 일자 100 string 6 metainfo 부가 정보 6-1 metainfo.device 촬영 기기 모델명 100 string Y 6-2 metainfo.location 위치 정보 6-3 metainfo.location.name 촬영 해역 이름 100 string east sea / south sea / west sea 6-4 metainfo.location.latitude 촬영 위치 위도 6-5 metainfo.location.latitude.DD 촬영 위치 위도(DD) 30 string Y 6-6 metainfo.location.latitude.DMS 촬영 위치 위도(DMS) 30 string 6-7 metainfo.location.latitude.DMM 촬영 위치 위도(DMM) 30 string 6-8 metainfo.location.longitude 촬영 위치 경도 6-9 metainfo.location.longitude.DD 촬영 위치 경도(DD) 30 string Y 6-10 metainfo.location.longitude.DMS 촬영 위치 경도(DMS) 30 string 6-11 metainfo.location.longitude.DMM 촬영 위치 경도(DMM) 30 string 6-12 metainfo.viewername 이미지 변환 프로그램 이름 100 string Y 6-13 metainfo.viewerversion 이미지 변환 프로그램 버전 100 string Y 6-14 metainfo.depth-of-water 촬영 위치 평균 수심 4 int Y depth-of-water > 0 6-15 metainfo.temperature 수온(℃) 30 string 6-16 metainfo.NTU 바다의 탁도(NTU) 30 string 7 object 객체 정보 7-1 object.name 객체 이름 100 string Y 객체 카테고리 분류 표 참조 7-2 object.grade 객체 품질 등급 10 string A/B 7-3 object.bndbox 바운딩박스 정보 7-4 object.bndbox.xmin 바운딩박스 x축 최소값 4 int Y 0 < xmin < size.width 7-5 object.bndbox.ymin 바운딩박스 y축 최소값 4 int Y 0 < ymin < size.height 7-6 object.bndbox.xmax 바운딩박스 x축 최대값 4 int Y xmin < xmax < size.width 7-7 object.bndbox.ymax 바운딩박스 y축 최대값 4 int Y ymin < ymax < size.height 7-8 object.bndbox.width 바운딩박스 넓이 4 int 0 < width < size.width 7-9 object.bndbox.height 바운딩박스 높이 4 int 0 < height < size.height <소나 조사 이미지 메타데이터 표>
어노테이션 포맷 표2 NO 영문명 데이터 설명 최대길이 타입 필수 여부 작성 규칙 1 folder 파일 상위 폴더 이름 100 string Y 2 filename 이미지 파일 이름 100 string Y 3 path 이미지 파일 경로(상대경로) 100 string Y 4 size 이미지 크기 정보 4-1 size width 이미지 넓이 4 int Y 4-2 size height 이미지 높이 4 int Y 4-3 size depth 이미지 채널 4 int Y 5 commoninfo 데이터셋 일반정보 5-1 commoninfo.datasetname 데이터셋 이름 100 string Y 5-2 commoninfo.createdate 데이터셋 생성 일자 100 string 6 metainfo 부가 정보 6-1 metainfo.device 촬영 기기 모델명 100 string 6-2 metainfo.location 위치 정보 6-3 metainfo.location.name 촬영 해역 이름 100 string 수중촬영 위치 정보 표 참조 6-4 metainfo.location.latitude 촬영 위치 위도 6-5 metainfo.location.latitude.DD 촬영 위치 위도(DD) 30 string Y 6-6 metainfo.location.latitude.DMS 촬영 위치 위도(DMS) 30 string 6-7 metainfo.location.latitude.DMM 촬영 위치 위도(DMM) 30 string 6-8 metainfo.location.longitude 촬영 위치 경도 6-9 metainfo.location.longitude.DD 촬영 위치 경도(DD) 30 string Y 6-10 metainfo.location.longitude.DMS 촬영 위치 경도(DMS) 30 string 6-11 metainfo.location.longitude.DMM 촬영 위치 경도(DMM) 30 string 6-14 metainfo.depth-of-water 촬영 위치 평균 수심 4 int 6-15 metainfo.temperature 수온(℃) 30 string 6-16 metainfo.NTU 바다의 탁도(NTU) 30 string 7 object 객체 정보 7-1 object.name 객체 이름 100 string Y 객체 카테고리 분류 표 참조 7-2 object.grade 객체 품질 등급 10 string A/B 7-3 object.bndbox 바운딩박스 정보 7-4 object.bndbox.xmin 바운딩박스 x축 최소값 4 int Y 0 < xmin < size.width 7-5 object.bndbox.ymin 바운딩박스 y축 최소값 4 int Y 0 < ymin < size.height 7-6 object.bndbox.xmax 바운딩박스 x축 최대값 4 int Y xmin < xmax < size.width 7-7 object.bndbox.ymax 바운딩박스 y축 최대값 4 int Y ymin < ymax < size.height 7-8 object.bndbox.width 바운딩박스 넓이 4 int 20 < width < size.width 7-9 object.bndbox.height 바운딩박스 높이 4 int 20 < height < size.height <수중 촬영 이미지 메타데이터 표>
-
데이터셋 구축 담당자
수행기관(주관) : 씨에스피아이
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 신현덕 02-3460-8800 hdshin@cspi.co.kr · 데이터 구축 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 해양기술이엔지 · 원시데이터 수집 에프와이디 · 원천데이터 생성(데이터 정제) 중앙대 산학협력단 · 소나 조사 이미지 라벨링 및 검수 한성대 산학협력단 · 수중 조사 이미지 라벨링 및 검수 비퍼플 · AI 모델링 메가뉴스 · 홍보 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 문동준(씨에스피아이) 02-3460-8851 djmoon@cspi.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.