-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2022-07-13 데이터 최초 개방 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2022-10-21 신규 샘플데이터 개방 2022-09-16 데이터셋 담당자 정보 변경 2022-07-13 콘텐츠 최초 등록 소개
농업 노동력 부족 문제로 잡초를 인식·탐지하여 제거하는 농기계 개발을 위해, 잡초 14종에 대해 지상에서 촬영하는 2D RGB 이미지 데이터, 적외선 촬영 온도값, 토양 및 환경 센서 데이터를 통합적으로 융합한 학습데이터셋
구축목적
잡초를 인식 탐지하기 위한 학습 데이터로써 향후 관련 농기계에 적용할 수 있는 데이터 구축
-
메타데이터 구조표 데이터 영역 농축수산 데이터 유형 이미지 데이터 형식 jpg, json 데이터 출처 자체 수집 라벨링 유형 세그멘테이션(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 인공지능 기반 잡초 탐지 및 분류 모델 개발 데이터 구축년도/
데이터 구축량2021년/학습용 데이터 (목표량) 358,000개 / (구축량) 388,879개, 토양 및 환경센서 데이터 (목표량) 120,000set / (구축량) 170,205set, 적외선 데이터 (목표량) 89,000개 / (구축량) 107,579개 -
학습용 데이터 – 2D RGB 이미지 데이터
학습용 데이터 – 2D RGB 이미지 데이터 품종 구축 수량 비율 품종 구축 수량 비율 강피(논피) 34,177 9% 흰명아주 27,622 7% 물달개비 28,819 7% 한련초 22,399 6% 올방개 34,803 9% 좀명아주 21,659 6% 올챙이고랭이 38,905 10% 닭의장풀 27,732 7% 바랭이 27,860 7% 개비름 31,437 8% 쇠비름 28,008 7% 개여뀌 24,126 6% 깨풀 23,149 6% 미국가막사리 18,183 5% 총 구축 목표 358,000개 실제 구축 규모 388,879개
학습용 데이터 품종별 분포
학습용 데이터 이외 추가 데이터 구축 규모추가 데이터 종류 구축 목표 실제 구축 규모 토양 및 환경센서데이터 120,000set 170,205set 적외선 데이터 89,000개 107,579개 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드향후 활용 분야 및 활용 서비스 내역
- 구축되는 학습데이터를 활용 Mask R-CNN 기반 컬러 이미지에서 잡초 라벨링 데이터를 학습하여 잡초를 탐지하고 Segmentation을 통해서 잡초 분포 영역 및 잡초 크기를 예측할 수 있는 모델 개발
- 잡초제거 로봇에 적용 가능한 잡초 탐지 및 분류 모델을 개발하여, 라즈베리 파이에 탑재하여 바로 활용 가능
-
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 폴리곤 객체 인식 Object Detection MASK R-CNN(resnet101) mAP@IoU 0.5 85 % 95 % 2 바운딩박스 객체 인식 (농작지, RGB) Object Detection darknet YOLO v4 mAP@IoU 0.5 80 % 95.49 % 3 바운딩박스 객체 인식 (농작지, NIR) Object Detection darknet YOLO v4 mAP@IoU 0.5 80 % 95.72 % 4 폴리곤 객체 인식 (농작지, RGB) Object Detection segformer mIoU 80 % 88 % 5 폴리곤 객체 인식 (농작지, NIR) Object Detection segformer mIoU 80 % 87.38 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드객체 클래스 정의
- 객체의 품종명
객체 클래스 정의 품종명 품종코드 품종명 품종코드 강피(논피) A 흰명아주 H 물달개비 B 한련초 I 올방개 C 좀명아주 J 올챙이고랭이 D 닭의장풀 K 바랭이 E 개비름 L 쇠비름 F 개여뀌 M 깨풀 G 미국가막사리 N
라벨링데이터 구성
구분 항목명 설명 타입 필수여부 범위 1. info-기본 정보 1–1 description 데이터셋 이름 string Y weed_detection 1–2 url 데이터셋 제작자 url string Y https://www.jeonbuk.go.kr/ 1–3 version 제작버전 string Y v.1.0 1–4 year 제작년도 number Y 2021 1–5 type 데이터셋 타입 string Y jpg 1–6 img_path 이미지데이터 폴더 경로 string Y /품종명/img 1–7 label_path 라벨링데이터 폴더 경로 string Y /품종명/json 2. collection - 수집 정보 2–1 obj_num 객체 번호(위치) string Y 001~999 2–2 tod_attribute 적외선 촬영 장비 속성 string FLIR C3X 2–3 tod_temper 객체 표면 온도 number -20 ~ 300 2–4 soil_ec 토양 전기전도도(EC) number Y 0~10 2–5 soil_temper 토양 온도 number Y 0~60 2–6 soil_humidity 토양 습도 number Y 0~100 2–7 soil_potential 토양 수분장력 number Y 0 ~ -1000000 2–8 temperature 온도 number Y -40 ~ 124 2–9 humidity 습도 number Y 0~100 2–10 sunshine 일사량 number Y 0~2000 2–11 sunrise_time 일출시간 string Y 04:00~09:59 2–12 sunset_time 일몰시간 string Y 16:00~22:59 2–13 img_attribute 촬영 장비 속성 string Y SM-G965N 등 2–14 img_time 촬영일시 string Y YYYY-MM-DD 2–15 img_part 잡초 촬영 범위 string Y [whole, part] 2–16 img_dist 촬영 거리(cm) number 1~1000 2–17 img_angle 촬영 각도 number 0~360 3. licenses – 저작권 정보 3–1 licenses_id 라이센스 고유 번호 number 1 3–2 licenses_name 라이센스 이름 string weed01 4. images – 이미지 데이터 정보 4–1 img_file_name 원천데이터 이름(파일명) string Y 예:20210803_RGB_A_0_001 _05.jpg 4–2 img_height 세로 number Y 1080~4800 img_width 가로 number Y 1080~4800 5. annotations – 어노테이션 정보 5–1 segmentation segmentation 좌표 string Y 예: [2.14474345,114.3444656] 5–2 area 어노테이션 면적 number Y 0~ 23040000 5–3 bbox bounding box 정보 string Y 예: [0.0, 0.0, 440.0, 273.0] 5–4 weeds_kind 잡초명 string Y [A, B, C, D, E, F, G, H, I, J, K, L, M, N]
라벨링 데이터 실제 예시 - 객체의 품종명
-
데이터셋 구축 담당자
수행기관(주관) : 전라북도
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 강초희 063-280-3956 kch0219@korea.kr · 업무 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 전라북도농업기술원 · 데이터 검증 국립농업과학원 · 데이터 수집, 검증 완주군 · 잡초 데이터 수집 지원 및 자문 캠틱종합기술원 · 크라우드소싱 인력관리 ㈜업데이터 · 데이터 가공. 모델 개발 ㈜디에스엔전주 · 데이터 전처리 ㈜이레아이에스 · 데이터 수집 ㈜엔에이치네트웍스 · 수집데이터 검사
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.