-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-21 신규 샘플데이터 개방 2022-07-13 콘텐츠 최초 등록 소개
ㅇ 지능형 스마트 양식(가리비) 통합 데이터 – 가리비 개체를 분류하고 성장 예측이 가능할 수 있는 가리비 성장 이미지 데이터 – 가리비가 성장한 해양물리환경데이터 – 가리비에 부착된 부착 생물의 여부 및 종류를 판별할 수 있는 이미지 ㅇ 지능형 스마트 양식(가리비) 데이터 기반 AI 모델 개발 – 가리비 이미지 데이터를 활용한 지능형 스마트 선별 AI알고리즘 개발 – 가리비의 성장 데이터 + 해양물리환경 데이터 최적에 양식 환경 AI알고리즘 개발
구축목적
ㅇ 양식장은 제한된 자원과 위험한 환경 등으로 인해 스마트 시스템 구축이 필수적으로 요구됨. 또한, 양식 어가의 고령화 및 급격한 해양환경 변화에 대응할 수 있는 스마트 양식 시스템 구축을 위한 양식 환경 DATA 구축은 필수적으로 요구됨
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 JPG, JSON 데이터 출처 Sea-station(크기 측정 촬영박스) 장비를 이용한 가리비 이미지 데이터 직접 수집 라벨링 유형 바운딩박스(이미지), 폴리곤(이미지) 라벨링 형식 JSON 데이터 활용 서비스 가리비 성장조건 솔루션 웹/앱 서비스, 가리비 개체 판별 솔루션 웹/앱서비스 데이터 구축년도/
데이터 구축량2021년/가리비 이미지 데이터 도합 120,000SET, 해양물리환경데이터 120,000SET -
데이터 구축 수량
- 가리비 객체 세부 수량 (단위: 개)
데이터 구축 수량 객체 가리비 부착생물 정상 비정상 분류 - 따개비, 다모류 수량 6,268 114,314 총 수량 120,582
- 가리비 객체 세부 수량 (단위: 개)
-
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 바운딩 박스 객체 인식 Object Detection General (A1) mAP 60 % 87.07 % 2 폴리곤 객체 인식 Object Detection HRNet mIoU 70 % 98.85 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드데이터 명 데이터 명 가리비 AI데이터, 해양환경물리데이터 데이터 포맷 JPG데이터, CSV데이터 활용 분야 AI 학습을 통한 지능형 스마트 양식장 구축 가리비 AI 알고리즘 개발 및 배포 및 실시간 해양물리환경 배포 가리비 내에 다모류와 따개비의 구분 AI 모델 이미지 내에 가리비 영역 정의 문제 AI모델 데이터 요약 가리비 성장 이미지데이터, 해양물리환경데이터 데이터 출처 가리비 구축 양식 인프라에서 원시데이터 확보 데이터 이력 배포버전 1_210401_G_1_1_180_F.JPG 개정이력 신규 작성자/배포자 ㈜씨뱅크 정선진 데이터 통계 데이터 구축 규모 Sea-Station을 이용하여 7개월간 해양물리환경데이터 및 가리비 성장이미지 데이터 수집 데이터 분포 해양물리환경 데이터 수집 120,000SET 원시이미지 수집 가리비 총 120,000장 기타 정보 대표성 해당사항 없음 독립성 유의사항 관련 연구 해당사항 없음 대표 이미지
대표 이미지 데이터셋 명 스마트양식장 통합 데이터(가리비) 데이터 종류 image 데이터 형식 jpg,json 목표 수량 가리비 120,000개 전체 가공 이미지 수량 가리비 120,904개 - 이미지 예시
- 라벨링 데이터 구성
라벨링 데이터 구성 No 속성명 데이터 타입 설명 필수 예시 1 file_name string 파일명 Y oyster_210415_01.jpg 2 type string 데이터 형식 Y PNG, JPG 3 resolution string 해상도 Y 1920X1080 4 license string 라이센스 Y Seabank 5 width number 이미지 너비 Y 1920 6 height number 이미지 높이 Y 1080 7 size string 객체 크기 Y small/medium/large 8 batch number 촬영회차 Y 1, 2, 3 9 data_created string 촬영일자 Y 2021. 05. 21 10 class string 촬영 객체 분류 Y O, G 11 cage number 가리비 성장 cage 번호 Y 1, 2, ... 12 angle number 촬영 각도 Y 0, 45, 90 13 direction string 촬영시 객체 방향 Y front, back 14 temperature number 촬영일 수온 Y 15 15 do number 촬영일 용존 산소량 Y 5.9712 16 psu number 촬영일 염도 Y 30.21314 17 chl number 촬영일 클로로필 농도 Y 0.157604 18 ph number 촬영일 산성도 Y 7.232 - 어노테이션 포맷
어노테이션 포맷 구분 항목명 타입 필수여부 설명 범위 비고 1 image 1–1 - Object Y 이미지 정보 - - 1–2 metadata Object Y 이미지 메타데이터 - - 1–2–1 file_name string Y 파일명 - - 1–2–2 type string Y 데이터 형식 - - 1–2–3 resolution string Y 해상도 - - 1–2–4 license string Y 라이센스 - - 1–2–5 width number Y 이미지 너비 1920,
19201–2–6 height number Y 이미지 높이 1080,
1080- 1–2–7 size string Y 객체 크기 “small”, “medium”, “large” - 1–2–8 batch number Y 촬영회차 0, 50 - 1–2–9 data_created string Y 촬영일자 - - 1–2–10 class string Y 촬영 객체 분류 - 0, 45, 90 1–2–11 cage number Y 가리비 성장 cage 번호 1, 100 - 1–2–12 angle number Y 촬영 각도 0, 360 - 1–2–13 direction string Y 촬영 시 객체 방향 “front”, “back“ - 1–2–14 temperature number Y 촬영일 수온 -50, 100 - 1–2–15 do number Y 촬영일 용존 산소량 0, 50 - 1–2–16 psu number Y 촬영일 염도 0, 100 - 1–2–17 chl number Y 촬영일 클로로필 농도 0, 500 - 1–2–18 ph number Y 촬영일 산성도 0, 50 - 2 annotations Arr[Object] Y 어노테이션 리스트 - - 2–1 id string Y 어노테이션 식별자 - - 2–2 label Object Y - 2–2–1 data Arr[Object] Y 폴리곤 좌표계, - {x: “11”, 바운딩 박스 객체 정보 y: “12”} 2-2-1-1 - Object Y 폴리곤 좌표계 - 2-2-1-1-1 x number N 폴리곤 구성 포인트의 x좌표 0, 1920 - 2-2-1-1-2 y number N 폴리곤 구성 포인트의 y좌표 0, 1080 - 2–2–2 category string Y 카테고리(BBox, Polygon 등) “polygon”, “rect” 가리비 2–3 classification Object Y - - 2–3–1 code string Y 객체 분류 “Oyster”, “Scallops“ - 2–3–2 attachments Arr[Object] N - 2-3-2-1 - Object N 부착생물 객체 정보 - 2-3-2-1-1 id string N 부착생물 라벨링 ID 2-3-2-1-1 label Object N 부착생물 라벨링 정보 2-3-2-1-1-1 data Object N 바운딩 박스 정보 2-3-2-1-1-1-1 x number N 바운딩박스 좌측 상단점 x 좌표 0, 1920 2-3-2-1-1-1-2 y number N 바운딩박스 좌측 상단점 y 좌표 0, 1080 2-3-2-1-1-1-3 width number N 바운딩박스 너비 0, 1920 2-3-2-1-1-1-4 height number N 바운딩박스 높이 0, 1080 - 2-3-2-1-1-2 category string N 카테고리(BBox, Polygon 등) “polygon”, “rect” 따개비, 다모류 2-3-2-1-2 classification Object N - – 2-3-2-1-2-1 code string N 객체 분류 ”attachment_seaacorn“, ”attachment_seaacorn“ – 2-3-2-1-2-2 attributes Object N 부착생물 객체속성 - 2-3-2-1-2-2-1 code string N 부착생물 객체 속성명 “kind” 2-3-2-1-2-2-2 value string N 부착생물 객체 속성값 “each”,
“group”- 어노테이션 파일 예시
- 가리비 Json 예시
- 가리비 Json 예시
클래스 정의
클래스 정의 라벨링 방법 클래스 명 코드 값 폴리곤 가리비 Scallops 바운딩박스 따개비 군집 attachment_seaacorn group 개별 each 다모류 군집 attachment_polychaeta group 개별 each -
데이터셋 구축 담당자
수행기관(주관) : ㈜씨뱅크
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강한빈 051-629-7828 seabankhanbin@gmail.com · 경영지원 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜데이터메이커 · 데이터 가공(라벨링) 동의대학교 산학협력단 · AI모델개발 ㈜새라 · 데이터수집 장비 설계·개발 뉴엔엑스수산 · 양식장 관리 및 데이터 수집 장비 관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 강한빈 051-629-7828 seabankhanbin@gmail.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.