BETA 부품 품질 검사 영상 데이터(선박·해양플랜드) (고도화) - LNG탱크 품질 검사 영상 데이터
- 분야제조
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- LNG 추진선 및 운반선의 LNG 탱크 품질 결함을 조기 감지 할 수 있는 기술 개발을 위한 LNG 탱크 품질 검사용 이미지 데이터 구축
구축목적
- 고부가가치 선박인 LNG 운반선 및 추진선의 지속적인 경쟁력 확보를 위한 LNG 탱크의 안전 품질 관리를 위해, LNG 탱크 제작 중에 자동으로 품질 결함을 발견하여 조치하기 위한 인공지능 학습용 데이터 구축을 목적으로 함
-
메타데이터 구조표 데이터 영역 제조 데이터 유형 이미지 데이터 형식 jpg 데이터 출처 직접 수집 라벨링 유형 바운딩박스(이미지)/세그멘테이션(이미지)/분류(이미지) 라벨링 형식 json 데이터 활용 서비스 LNG 추진선 및 운반선의 LNG 탱크 품질 판정 서비스 등 데이터 구축년도/
데이터 구축량2023년/원시데이터 이미지(340,000장) 원천데이터 이미지 (310,356장), 라벨링(어노테이션) 데이터 (332,274개) -
- 공정유형별 분포
공정유형별 분포 공정유형 구축건수(장) 분포비율 용 접 24,767 7.98% 표면처리 187,464 60.40% 파 이 프 15,133 4.88% 케 이 블 31,641 10.20% 절 단 31,747 10.23% 폼스프레이 19,604 6.32% 합 계 310,356 100.00% - 품질상태별 분포
품질상태별 분포 품질상태 구축건수(장) 분포비율 양품 90,096 29.03% 불량품 220,260 70.97% 합 계 310,356 100.00% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 모델학습
- LNG탱크 품질검사는 ViT, EfficientDet, maskDINO등 3가지 모델을 이용하여 품질유형분류, 바운딩박스객체탐지, 세그먼테이션 객체탐지 기능을 하며, 모델학습 과정은 전체 데이터의 80%(이미지 수가 아닌 실제 라벨링한 데이터 기준. 이미지 한 장에 복수의 라벨링 데이터가 존재하는 것도 다수 있음)를 학습하고, 10%는 Validation에 활용하며, 10%는 학습결과 Test에 이용합니다. 모델학습에 이용된 AI 모델은 다음과 같음모델학습에 이용된 AI 모델 품질특성 TASK 명 모델명 지표 목표치 결과값 유효성 품질 유형 분류 성능 ViT F1-Score 86.34 99.97 바운딩 박스
객체 탐지 성능EfficientDet mAP 86.54 88.43 세그멘테이션
객체 탐지 성능MaskDINO mAP 79.43 95.72 [표] 모델학습에 이용된 AI 모델
- LNG탱크 품질 검사 이미지 데이터 중 탱크클리닝 불량, 표면양품, 폼 스프레이(양품, 불량품) 등 4개의 class 데이터는 ViT모델을 이용하여 각각의 클래스로 분류하도록 개발되었습니다. 학습에 이용된 데이터 수는 다음과 같음
품질유형 분류 학습 데이터 class name training(80%) validation(10%) test(10%) 탱크 클리닝 불량 18,443 2,305 2,306 표면 양품 44,497 5,562 5,562 폼 스프레이 불량 11,011 1,377 1,376 폼 스프레이 양품 4,672 584 584 [표] 품질유형 분류 학습 데이터
- LNG탱크 품질 검사 이미지 데이터 중 볼트체결 양품, 불량과 케이블설치 양품, 불량 등 4개의 class는 EfficientDet모델을 이용하여 바운딩박스형태로 해당객체를 탐지
class name training(80%) validation(10%) test(10%) 볼트 체결 불량 8,933 1,101 1,127 볼트 체결 양품 3,161 395 416 케이블 설치 불량 4,132 505 484 케이블 설치 양품 2,530 344 318 [표] 바운딩박스 객체탐지 학습 데이터
- LNG탱크 품질 검사 이미지 데이터 중 용접불량, 절단불량, 균열 등 15개 class는maskDiNO모델을 이용하여 세그먼테이션형태로 해당객체를 탐지
세그멘테이션 객체탐지 학습 데이터 클래스명 training(80%) validation(10%) test(10%) 용접불량 5,383 668 669 용접블로우홀 8,946 1,066 1,158 용접양품 5,497 700 680 균열 19,537 2,402 2,436 도장흐름 9,972 1,217 1,203 도막떨어짐 9,765 1,166 1,238 도막분리 9,516 1,200 1,197 스크래치 28,666 3,642 3,566 보온재손상 9,667 1,212 1,187 케이블손상 4,785 591 606 케이블양품 2,175 301 268 바인딩불량 9,698 1,193 1,236 바인딩양품 1,974 235 266 절단불량 17,838 2,303 2,231 절단양품 7,485 968 922 [표] 세그멘테이션 객체탐지 학습 데이터
- 서비스 활용 시나리오○ 서비스명 :LNG탱크 품질 검사 자동화
- 구축된 LNG탱크 품질 검사 이미지 학습 데이터셋과 학습 모델을 활용
- LNG탱크 제작 과정 상의 품질 육안 검사 ➜ 드론 또는 비전기반의 AI기술을 활용한 자동화 검사
- 공정별,위치별,부품별 품질 검사 결과 자동 산출 ➜ 시간과 비용 절감,작업자 안전 지원- 기타정보
○ 대표성: 선박용 LNG탱크 제작과정을 고려하여, 상태검증이 필요한 전체영역을 23개 클래스로 구분하여 구성
○ 독립성: 선박용 LNG탱크 제작과정에서 클래스별로 데이터를 직접 촬영하여 중복되지 않도록 자료를 수집하고 검증
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 Key Description Type Child Type file_name 원천데이터 이름 string image_id 원천데이터 ID number JsonObject date_captured 원천데이터 촬영일시 string date_created 라벨링데이터 생성일자 string width 원천데이터 가로길이 number height 원천데이터 세로길이 number license.name 원천데이터 라이선스명 string supercategory 라벨링 객체 상위 분류명 string category.name 라벨링 객체 클래스명(품질유형) string 한글명 annotation.id 라벨링 객체의 ID number JsonObject segmentation 라벨링 객체의 폴리곤 좌표 목록 array JsonArray bbox 라벨링 객체의 bounding box 영역 정보 array JsonArray area 라벨링 객체의 영역 크기 number tank_type LNG탱크의 유형
- B, Cstring 한글명 volume LNG탱크의 용량
- 단위 : CBMnumber material LNG탱크의 소재, string 한글명 location LNG탱크의 위치
- 외벽, 내부, 외부string 한글명 sub-location tank_type과 location에 따라 다름
외벽,내부,외부string 한글명 work 부품/의장품의 공정유형
(품질유형 대분류)string 한글명 part 부품/의장품의 이름 string 한글명 quality 부품/의장품의 품질 상태
- 양품, 불량품string 한글명 - 어노테이션 포맷
데이터 통계 No 항목 길이 타입 필수여부 비고 한글명 영문명 1 데이터셋정보 JsonObject Y 1-1 데이터셋명 info.name string Y 1-2 데이터셋상세설명 info.description string Y 1-3 데이터셋생성일자 info.date_created string Y datetime 1-4 데이터셋제공기관 info.date_contributor string Y 1-5 데이터셋버전 info.date_version string Y 2 이미지정보 JsonObject 2-1 이미지식별자 images[].id number Y 2-2 이미지너비 images[].width number Y 2-3 이미지높이 images[].height number Y 2-4 이미지파일명 images[].file_name string Y 2-5 이미지라이선스ID images[].license number Y licenses[].id 2-6 이미지촬영일자 images[].date_captured string Y datetime 3 라이선스정보 JsonObject 3-1 라이선스식별자 licenses[].id number Y 3-2 라이선스명 licenses[].name string Y 고정값 3-3 라이선스URL licenses[].url string Y 고정값 4 라벨링객체클래스정보 string Y 4-1 상위클래스명 categories[].supercategory number Y 고정값 4-2 라벨링객체클래스ID categories[].id string Y 품질유형코드목록 4-3 라벨링객체클래스명 categories[].name 품질유형목록 5 라벨링객체정보 JsonObject 5-1 라벨링객체식별자 annotations[].id number Y 5-2 이미지식별자 annotations[].image_id number Y 5-3 라벨링객체클래스ID annotations[].category_id number Y 5-4 라벨링객체 폴리곤 annotations[].segmentation array N (number) 5-5 라벨링객체 바운딩박스 annotations[].bbox array N (number) 5-6 라벨링객체 영역크기 annotations[].area number N 5-7 라벨링크라우드여부 annotations[].iscrowd number Y 5-8 라벨링객체 속성정보 annotations[].attributes JsonObject Y 5-8-1 LNG탱크 유형 annotaions[].attributes.tank_type string Y 5-8-2 LNG탱크 용량 annotaions[].attributes.volume number Y 5-8-3 LNG탱크 소재 annotaions[].attributes.material string Y 5-8-4 부품/의장품 위치 annotaions[].attributes.location string Y 5-8-5 부품/의장품 세부위치 annotaions[].attributes.sub_location string Y 5-8-6 부품/의장품의 공정유형 annotaions[].attributes.work string Y 5-8-7 부품/의장품 이름 annotaions[].attributes.part string Y 5-8-8 부품/의장품 품질상태 annotaions[].attributes.quality string Y - 데이터 포맷
- 원시데이터 포맷
- 원천데이터 포맷(라벨링 작업후)
- json형식 예
json형식 예
"annotations": [
{
"id": 1,
"image_id": 1,
"category_id": 1102,
"attributes": {
"tank_type": "C",
"location": "외부",
"sub_location": "지지대",
"work": "용접",
"part": "조인트",
"quality": "불량품",
"volume": 2500,
"material": "9%니켈강"
},
"iscrowd": 0,
"area": 1875758.2,
"segmentation": [
0.3,
1999.0,
104.0,
2058.9,- json 실제 예시
-
데이터셋 구축 담당자
수행기관(주관) : 미래아이티(주)
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 임성훈 02-6241-0101 idos72@miraeit.net 주관, 사업관리, 크라우드워커 관리, 총괄품질관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 미래아이티(주) 총괄 및 수집, 가공 네오텍 데이터 수집 관리 애플스 AI모델 올시데이터 품질관리 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 임성훈 02-6241-0101 idos72@miraeit.net 박길주 02-6241-0103 gjpark@miraeit.net AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김진한 031-387-5878 jinhan63@hanmir.com 백용창 031-387-5878 pof2020@daum.net 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 박길주 02-6241-0103 gjpark@miraeit.net 조안나 02-6241-0101 mirae@miraeit.net
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.