BETA 창원 지역 특화산업 고도화 및 디지털 전환 촉진을 위한 용접 AI 학습 데이터 구축
- 분야제조
- 유형 이미지
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 용접 자동화를 위한 검사 유형별(육안검사(VT), 방사선검사(RT)) 용접 이미지 데이터
구축목적
- 전문 인력의 용접 데이터를 DB화하고, 인공지능이 학습하도록 함으로써 용접산업의 스마트화 촉진, 인공지능 생태계 구축‧확대에 기여
-
메타데이터 구조표 데이터 영역 제조 데이터 유형 이미지 데이터 형식 JPG 데이터 출처 조선소 및 선박 제조 현장 자체 수집 라벨링 유형 폴리곤(이미지) 라벨링 형식 JSON 데이터 활용 서비스 품질 검사 자동화 데이터 구축년도/
데이터 구축량2023년/144,019개 -
- 데이터 구축 규모
- 육안검사(VT) 데이터육안검사(VT) 데이터 VT 원천데이터
수량(장)라벨링 데이터
수량(개)일반강재
(Steel)정상 35,934 35,934 기공
(Porosity)3,408 3,408 용입부족
(Incomplete penetration)16,180 16,180 용합불량
(Lack of Fusion)6,302 6,302 언더컷
(Undercut)12,195 12,195 계 74,019 74,019 - 방사선검사(RT) 데이터
방사선검사(RT) 데이터 RT 원천데이터
수량(장)라벨링 데이터
수량(개)일반강재
(Steel)정상 26,287 26,287 균열
(Cracks)2,277 2,277 기공
(Porosity)27,040 27,040 용합불량
(Lack of Fusion)3,256 3,256 슬래그혼입
(Slug inclusion)1,140 1,140 소계 60,000 60,000 알루미늄 정상 5,242 5,242 균열
(Cracks)332 332 기공
(Porosity)2,945 2,945 용합불량
(Lack of Fusion)329 329 슬래그혼입
(Slug inclusion)1,152 1,152 소계 10,000 10,000
- 데이터 분포
- 육안검사(VT) 데이터육안검사(VT) 데이터 데이터명 원천데이터 구분 구축 비율 정상 VT 용접검사 합격 48.55% 용접 결함 기공
(Porosity)4.60% 용입부족
(Incomplete penetration)21.86% 융합불량
(Lack of fusion)8.51% 언더컷
(Undercut)16.48% 계 100% - 방사선검사(RT) 데이터
방사선검사(RT) 데이터 데이터명 원천데이터 구분 구축 비율 정상 RT 용접검사 합격 45.04% 용접 결함 균열
(Cracks)3.73% 기공
(Porosity)42.84% 융합불량
(Lack of fusion)5.12% 슬래그혼입
(Slag inclusion)3.27% 계 100% -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 활용 AI 모델: YOLOv5x-seg
- 모델 학습
- 모델 선정: YOLOv5x-seg 모델을 제조업에서의 용접 결합 부위를 탐지하고 분류하기 위한 목적으로 개발
- 데이터셋 구성: 전체 데이터셋은 훈련(Train), 검증(Validation), 테스트(Test)로 8:1:1 비율로 분할하였으며, 이는 모델이 다양한 용접 결합 상황을 학습하고, 더 정확하고 일반화된 성능을 검증하며, 실세계 데이터에 대한 모델의 성능을 평가하기 위함
- 특이 사항: YOLOv5x-seg는 객체 탐지와 함께 세그먼테이션 기능을 제공하여, 용접 결함의 정확한 위치와 유형을 파악할 수 있으며, 이를 통해 더 상세하고 정밀한 검출이 가능하여 제조 품질 관리에 기여- 서비스 활용 시나리오
- 품질 검사 자동화: 제조 라인에서 YOLOv5x-seg 모델을 활용하여 용접 부위의 결함을 실시간으로 탐지하고 분류하며, 이를 통해 생산 공정 중에 결함이 발견되면 즉시 조치를 취하여 불량률을 감소시키고 전반적인 제품 품질을 향상시킬 수 있음
- 데이터 기반 유지보수: 용접 결합 부위의 데이터를 지속적으로 수집하고 분석하여, 잠재적인 문제를 사전에 예측하고 예방할 수 있으며, 이는 유지보수 비용을 절감하고, 장비의 수명을 연장하는 데 도움이 됨
- 생산 리포팅 및 피드백: 분석된 데이터와 모델의 탐지 결과를 바탕으로 생산 효율성과 품질 관련 리포트를 생성할 수 있으며, 이러한 정보는 지속적인 프로세스 개선과 직원 교육에 활용될 수 있음 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 구분 내용 정상 - 정상적인 비드면 균열
(Crack)- 일반적으로 용접비드 상에 일직선의 형태로 검고 길게 나타남 기공
(Porosity)- 일반적으로 구형이며 발생 위치가 일정하지 않음 융합불량
(Lack of fusion)- 비드의 중앙부분에 일직선의 형태로 검고 길게 나타남 용입부족
(Incomplete penetration)- 비드의 모재쪽으로 일직선으로 길게 또는 단락된 직선의 형태로 나타남 슬래그 혼입
(Slag inclusion)- 면이 불규칙하고 길이가 길지 않으며, 여러 개가 동시에 존재할 수도 있음 언더컷
(Undercut)- 비드면 좌우로 가늘고 긴 검은 선으로 나타남 - 어노테이션 포맷
어노테이션 포맷 구분 속성명 타입 필수여부 설명 범위 비고 1 촬영정보 1-1 id number 필수 라벨링데이터 ID ex) ‘8696495’ 1-2 type string 필수 데이터 종류
(육안검사 : VT, 방사선검사 : RT)‘VT/RT’ 중 택 1 1-3 material string 필수 용접 모재
(강재 : ST, 알루미늄 : AL)‘ST/AL’ 중 택 1 2 이미지 정보 2-1 filename string 필수 원천데이터 이름 ex) ‘VT_ST_12319737.jpg’ 2-2 format string 필수 포맷 jpg 2-3 information string 필수 이미지의 유형 정보 ‘정상/균열/기공/용입불량/융합
부족/슬래그혼입/언더컷’ 중 택 12-4 width number 필수 정지영상 가로길이 1280*720
픽셀 이상2-5 height number 필수 정지영상 세로길이 3 메타 정보 3-1 is_crowd number 필수 클래스 단일‧다중 여부
(단일클래스 : 0, 다중클래스 : 1)‘0/1’ 중 택 1 3-2 annotation_case object 필수 어노테이션 종류 ‘crack/porosity/ incomplete
penetration/lack of fusion/slag
inclusion/undercut’ 중 택 13-3 total_case object 필수 전체 어노테이션 ‘crack/porosity/ incomplete
penetration/lack of fusion/slag
inclusion/undercut’ 중 택 14 라벨링 정보 4-1 tool string 필수 라벨링 방법
(ex. polygon, bbox...)‘polygon’ 4-2 coordinate object 필수 polygon 좌표 정보
(결함 1개 랜드마크 정보)‘0’ 이상 ex)
"coordinate“
[“x” : 198,
196,
195,
195,
196,
...
“y” :
239,
241,
242,
243,
244,
…
]4-3 class string 필수 정상, 결함 라벨링 정보 ‘normal/defect’ 중 택 1 4-4 case string 선택 결함별 라벨링 분류 ‘crack/porosity/ incomplete
penetration/lack of fusion/slag
inclusion/undercut’ 중 택 1
- 실제 예시실제 예시 {
"info": {
"id": 8662160,
"type": "RT",
"material": "AL"
},
"image_data": {
"file_name": "RT_AL_00_00063097",
"format": "jpg",
"information": "정상",
"width": 3051,
"height": 848
},
"meta": {
"is_crowd": 0,
"annotation_case": [
"normal"
],
"total_case": [
"normal"
]
},
"annotations": [
{
"tool": "polygon",
"coordinate": {
"x": [
10,
4,
1191,
2701,
3040,
3022,
2335
],
"y": [
275,
461,
448,
437,
434,
271,
260
]
},
"class": "normal",
"case": ""
}
]
} -
데이터셋 구축 담당자
수행기관(주관) : (재)경남테크노파크
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 이창석 055-259-5020 cslee@gntp.or.kr 사업관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 경남대학교 산학협력단 AI모델 개발 위미르㈜ 데이터 구축/가공/검수 ㈜제이엔이웍스 데이터 구축/가공/검수 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 김영주 (육안검사(VT) 데이터) 055-299-6652 wimiryj@naver.com 민경록 (육안검사(VT) 데이터) 055-299-6651 wimiryj79@naver.com 장민호 (방사선검사(RT) 데이터) 070-7788-8661 mhjang@jneworks.com 정지훈 (방사선검사(RT) 데이터) 070-7788-8661 jhjung@jneworks.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 신병주 055-249-2256 bjshin@kyungnam.ac.kr 정민성 055-249-2386 jms01121@naver.com 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 정은규 070-7139-9784 eungyu.jung@datamaker.io
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.