콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#제조

BETA 부품 품질 검사 영상 데이터(선박·해양플랜드) (고도화) - LNG탱크 품질 검사 영상 데이터

부품 품질 검사 영상 데이터 (선박·해양플랜드) (고도화) - LNG탱크 품질 검사 영상 데이터 아이콘 이미지
  • 분야제조
  • 유형 이미지
구축년도 : 2023 갱신년월 : 2024-06 조회수 : 1,275 다운로드 : 24 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.0 2024-06-28 데이터 개방 Beta Version

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-06-28 산출물 공개 Beta Version

    소개

    - LNG 추진선 및 운반선의 LNG 탱크 품질 결함을 조기 감지 할 수 있는 기술 개발을 위한 LNG 탱크 품질 검사용 이미지 데이터 구축

    구축목적

    - 고부가가치 선박인 LNG 운반선 및 추진선의 지속적인 경쟁력 확보를 위한 LNG 탱크의 안전 품질 관리를 위해, LNG 탱크 제작 중에 자동으로 품질 결함을 발견하여 조치하기 위한 인공지능 학습용 데이터 구축을 목적으로 함
  • - 공정유형별 분포

    공정유형별 분포
    공정유형 구축건수(장) 분포비율
    용 접 24,767 7.98%
    표면처리 187,464 60.40%
    파 이 프 15,133 4.88%
    케 이 블 31,641 10.20%
    절 단 31,747 10.23%
    폼스프레이 19,604 6.32%
    합 계 310,356 100.00%

    유형별 구축 건수 및 분포 비율

     

    - 품질상태별 분포

    품질상태별 분포
    품질상태 구축건수(장) 분포비율
    양품 90,096 29.03%
    불량품 220,260 70.97%
    합 계 310,356 100.00%

    품질상태별 구축 건수 및 분포 비율

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    - 모델학습
      - LNG탱크 품질검사는 ViT, EfficientDet, maskDINO등 3가지 모델을 이용하여 품질유형분류, 바운딩박스객체탐지, 세그먼테이션 객체탐지 기능을 하며, 모델학습 과정은 전체 데이터의 80%(이미지 수가 아닌 실제 라벨링한 데이터 기준. 이미지 한 장에 복수의 라벨링 데이터가 존재하는 것도 다수 있음)를 학습하고, 10%는 Validation에 활용하며, 10%는 학습결과 Test에 이용합니다. 모델학습에 이용된 AI 모델은 다음과 같음

    모델학습에 이용된 AI 모델
    품질특성 TASK 명 모델명 지표 목표치 결과값
    유효성 품질 유형 분류 성능 ViT F1-Score 86.34 99.97
    바운딩 박스
    객체 탐지 성능
    EfficientDet mAP 86.54 88.43
    세그멘테이션
    객체 탐지 성능
    MaskDINO mAP 79.43 95.72

    [표] 모델학습에 이용된 AI 모델

     

      - LNG탱크 품질 검사 이미지 데이터 중 탱크클리닝 불량, 표면양품, 폼 스프레이(양품, 불량품) 등 4개의 class 데이터는 ViT모델을 이용하여 각각의 클래스로 분류하도록 개발되었습니다. 학습에 이용된 데이터 수는 다음과 같음

    품질유형 분류 학습 데이터
    class name training(80%) validation(10%) test(10%)
    탱크 클리닝 불량 18,443 2,305 2,306
    표면 양품 44,497 5,562 5,562
    폼 스프레이 불량 11,011 1,377 1,376
    폼 스프레이 양품 4,672 584 584

    [표] 품질유형 분류 학습 데이터

     

      - LNG탱크 품질 검사 이미지 데이터 중 볼트체결 양품, 불량과 케이블설치 양품, 불량 등 4개의 class는 EfficientDet모델을 이용하여 바운딩박스형태로 해당객체를 탐지

    class name training(80%) validation(10%) test(10%)
    볼트 체결 불량 8,933 1,101 1,127
    볼트 체결 양품 3,161 395 416
    케이블 설치 불량 4,132 505 484
    케이블 설치 양품 2,530 344 318

    [표] 바운딩박스 객체탐지 학습 데이터

     

      - LNG탱크 품질 검사 이미지 데이터 중 용접불량, 절단불량, 균열 등 15개 class는maskDiNO모델을 이용하여 세그먼테이션형태로 해당객체를 탐지

    세그멘테이션 객체탐지 학습 데이터
    클래스명 training(80%) validation(10%) test(10%)
    용접불량 5,383 668 669
    용접블로우홀 8,946 1,066 1,158
    용접양품 5,497 700 680
    균열 19,537 2,402 2,436
    도장흐름 9,972 1,217 1,203
    도막떨어짐 9,765 1,166 1,238
    도막분리 9,516 1,200 1,197
    스크래치 28,666 3,642 3,566
    보온재손상 9,667 1,212 1,187
    케이블손상 4,785 591 606
    케이블양품 2,175 301 268
    바인딩불량 9,698 1,193 1,236
    바인딩양품 1,974 235 266
    절단불량 17,838 2,303 2,231
    절단양품 7,485 968 922

    [표] 세그멘테이션 객체탐지 학습 데이터

     
    - 서비스 활용 시나리오

    ○ 서비스명 :LNG탱크  품질 검사 자동화
      - 구축된 LNG탱크 품질 검사 이미지 학습 데이터셋과 학습 모델을 활용
      - LNG탱크 제작 과정 상의 품질 육안 검사 ➜ 드론 또는 비전기반의 AI기술을 활용한 자동화 검사
      - 공정별,위치별,부품별  품질 검사 결과 자동 산출 ➜ 시간과 비용 절감,작업자 안전 지원

    - 기타정보

    ○ 대표성: 선박용 LNG탱크 제작과정을 고려하여, 상태검증이 필요한 전체영역을 23개 클래스로 구분하여 구성

    ○ 독립성: 선박용 LNG탱크 제작과정에서 클래스별로 데이터를 직접 촬영하여 중복되지 않도록 자료를 수집하고 검증

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    - 데이터 구성

    데이터 구성
    Key Description Type Child Type
    file_name 원천데이터 이름 string  
    image_id 원천데이터 ID number JsonObject
    date_captured 원천데이터 촬영일시 string  
    date_created 라벨링데이터 생성일자 string  
    width 원천데이터 가로길이 number  
    height 원천데이터 세로길이 number  
    license.name 원천데이터 라이선스명 string  
    supercategory 라벨링 객체 상위 분류명 string  
    category.name 라벨링 객체 클래스명(품질유형) string 한글명
    annotation.id 라벨링 객체의 ID number JsonObject
    segmentation 라벨링 객체의 폴리곤 좌표 목록 array JsonArray
    bbox 라벨링 객체의 bounding box 영역 정보 array JsonArray
    area 라벨링 객체의 영역 크기 number  
    tank_type LNG탱크의 유형
    - B, C
    string 한글명
    volume LNG탱크의 용량
    - 단위 : CBM
    number  
    material LNG탱크의 소재, string 한글명
    location LNG탱크의 위치
    - 외벽, 내부, 외부
    string 한글명
    sub-location tank_type과 location에 따라 다름
    외벽,내부,외부
    string 한글명
    work 부품/의장품의 공정유형
    (품질유형 대분류)
    string 한글명
    part 부품/의장품의 이름 string 한글명
    quality 부품/의장품의 품질 상태
    - 양품, 불량품
    string 한글명

     

    - 어노테이션 포맷

    데이터 통계
    No 항목 길이 타입 필수여부 비고
        한글명 영문명        
    1 데이터셋정보     JsonObject Y  
      1-1 데이터셋명 info.name   string Y  
      1-2 데이터셋상세설명 info.description   string Y  
      1-3 데이터셋생성일자 info.date_created   string Y datetime
      1-4 데이터셋제공기관 info.date_contributor   string Y  
      1-5 데이터셋버전 info.date_version   string Y  
    2 이미지정보     JsonObject    
      2-1 이미지식별자 images[].id   number Y  
      2-2 이미지너비 images[].width   number Y  
      2-3 이미지높이 images[].height   number Y  
      2-4 이미지파일명 images[].file_name   string Y  
      2-5 이미지라이선스ID images[].license   number Y licenses[].id
      2-6 이미지촬영일자 images[].date_captured   string Y datetime
    3 라이선스정보     JsonObject    
      3-1 라이선스식별자 licenses[].id   number Y  
      3-2 라이선스명 licenses[].name   string Y 고정값
      3-3 라이선스URL licenses[].url   string Y 고정값
    4 라벨링객체클래스정보     string Y  
      4-1 상위클래스명 categories[].supercategory   number Y 고정값
      4-2 라벨링객체클래스ID categories[].id   string Y 품질유형코드목록
      4-3 라벨링객체클래스명 categories[].name       품질유형목록
    5 라벨링객체정보     JsonObject    
      5-1 라벨링객체식별자 annotations[].id   number Y  
      5-2 이미지식별자 annotations[].image_id   number Y  
      5-3 라벨링객체클래스ID annotations[].category_id   number Y  
      5-4 라벨링객체 폴리곤 annotations[].segmentation   array N  
    (number)
      5-5 라벨링객체 바운딩박스 annotations[].bbox   array N  
    (number)
      5-6 라벨링객체 영역크기 annotations[].area   number N  
      5-7 라벨링크라우드여부 annotations[].iscrowd   number Y  
      5-8 라벨링객체 속성정보 annotations[].attributes   JsonObject Y  
      5-8-1 LNG탱크 유형 annotaions[].attributes.tank_type   string Y  
      5-8-2 LNG탱크 용량 annotaions[].attributes.volume   number Y  
      5-8-3 LNG탱크 소재 annotaions[].attributes.material   string Y  
      5-8-4 부품/의장품 위치 annotaions[].attributes.location   string Y  
      5-8-5 부품/의장품 세부위치 annotaions[].attributes.sub_location   string Y  
      5-8-6 부품/의장품의 공정유형 annotaions[].attributes.work   string Y  
      5-8-7 부품/의장품 이름 annotaions[].attributes.part   string Y  
      5-8-8 부품/의장품 품질상태 annotaions[].attributes.quality   string Y  

     

    - 데이터 포맷

      - 원시데이터 포맷

    원시데이터 포맷

     

      - 원천데이터 포맷(라벨링 작업후)

    원천데이터 포맷(라벨링 작업후)

     

     - json형식 예

    json형식 예

    "annotations": [
            {
                "id": 1,
                "image_id": 1,
                "category_id": 1102,
                "attributes": {
                    "tank_type": "C",
                    "location": "외부",
                    "sub_location": "지지대",
                    "work": "용접",
                    "part": "조인트",
                    "quality": "불량품",
                    "volume": 2500,
                    "material": "9%니켈강"
                },
                "iscrowd": 0,
                "area": 1875758.2,
                "segmentation": [
                    0.3,
                    1999.0,
                    104.0,
                    2058.9,

     

     - json 실제 예시

    json 실제 예시
  • 데이터셋 구축 담당자

    수행기관(주관) : 미래아이티(주)
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    임성훈 02-6241-0101 idos72@miraeit.net 주관, 사업관리, 크라우드워커 관리, 총괄품질관리
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    미래아이티(주) 총괄 및 수집, 가공
    네오텍 데이터 수집 관리
    애플스 AI모델
    올시데이터 품질관리
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    임성훈 02-6241-0101 idos72@miraeit.net
    박길주 02-6241-0103 gjpark@miraeit.net
    AI모델 관련 문의처
    AI모델 관련 문의처
    담당자명 전화번호 이메일
    김진한 031-387-5878 jinhan63@hanmir.com
    백용창 031-387-5878 pof2020@daum.net
    저작도구 관련 문의처
    저작도구 관련 문의처
    담당자명 전화번호 이메일
    박길주 02-6241-0103 gjpark@miraeit.net
    조안나 02-6241-0101 mirae@miraeit.net
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.