-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.2 2024-12-04 서브라벨링 추가 개방 1.1 2024-10-30 데이터 최종 개방 1.0 2024-08-05 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-08-05 산출물 공개 Beta Version 소개
- 대표적인 한국 전통 스포츠인 씨름에 대한 경기분석, 자세교정, 교육 및 훈련 프로그램 개발을 위한 주요 동작 영상 데이터
구축목적
- AI 학습용 한국 씨름 동작 데이터 구축 - 대표적인 한국 전통 스포츠인 씨름에 대한 경기분석, 자세교정, 교육 및 훈련 프로그램 개발을 위한 주요 동작 영상 데이터 셋 구축
-
메타데이터 구조표 데이터 영역 스포츠 데이터 유형 비디오 , 이미지 데이터 형식 mp4, jpg 데이터 출처 훈련영상: 용인대학교 씨름 실기장에서 촬영일정에 맞추어 직접 촬영, 경기영상: 샅바TV 및 MBC 방송국의 데이터 구입을 통한 영구적 권리수집 라벨링 유형 구간 세그멘테이션(동영상) , 2D Bounding Box(이미지), 2D Keypoint(이미지), 3D Keypoint(이미지) 라벨링 형식 json 데이터 활용 서비스 씨름에 대한 경기분석, 자세교정, 교육 및 훈련 프로그램 데이터 구축년도/
데이터 구축량2023년/동영상: 62,769 set, 이미지: 220,000 set -
- 데이터 구축 규모 및 분포
1) 영상 데이터(단위: 시간)
데이터 구축 규모 및 분포 1) 영상 데이터 성별 소속 체급 경기영상
41%훈련영상
59%남자
89%프로
51%태백
18%54 48 금강
16%45 45 한라
9%27 25 백두
9%27 25 대학
38%경장
7%12 27 소장
6%11 26 청장
6%10 26 용장
5%9 19 용사
5%9 19 역사
5%8 20 장사
4%7 19 여자
11%프로
9%매화
3%7 11 국화
3%9 11 무궁화
2%5 9 대학
2%매화
1%0 5 국화
1%0 5 소계 240 340 ※ 소수점 반올림이 필요한 경우, 해당 수치는 반올림하여 작성함
2) 이미지 데이터
(단위: set)
데이터 구축 규모 및 분포 2) 이미지 데이터 기술명 세부기술명 구분 기술계 남자
85%여자
15%프로
42%대학
43%프로
11%대학
4%손기술
21%앞무릎치기
6%7,013 2,804 1,936 736 12,489 뒷무릎치기
7%5,750 8,627 1,432 680 16,489 오금당기기
8%6,716 7,991 2,071 888 17,666 다리기술
17%밭다리걸기
6%5,453 4,885 1,156 616 12,110 안다리걸기
7%5,443 7,038 1,000 1,312 14,793 덮걸이
5%4,543 4,734 1,144 808 11,229 발기술
15%호미걸이
4%4,052 3,944 1,032 - 9,028 빗장걸이
6%4,963 6,076 1,320 160 12,519 낚시걸이
5%4,450 4,845 1,176 896 11,367 허리기술
14%왼배지기
6%7,869 3,851 808 - 12,528 차돌리기
3%2,950 3,121 920 - 6,991 돌림배지기
5%3,920 5,185 1,512 817 11,434 들기술
17%들며 차내어 배지기
7%8,420 6,814 1,256 - 16,490 들어 잡채기
5%3,818 5,373 2,143 - 11,334 들어 호미걸이
4%3,160 3,575 2,128 802 9,665 혼합기술
15%잡채기
4%5,805 3,131 880 - 9,816 뿌려치기
7%4,838 10,144 1,094 204 16,280 등채기
4%4,082 1,917 1,248 525 7,772 소 계 93,245 94,055 24,256 8,444 220,000 ※ 분포 비율은 소수점 반올림이 필요한 경우, 해당 비율은 반올림하여 작성함
-
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드AI 모델 설명 데이터 명 AI 모델 task AI 모델 성능지표 및
목표값Data I/O 한국씨름
동작 데이터동작 분류 PoseC3D Top-3
ACC(90%)- input data : 씨름 Skeleton 데이터
- output : 씨름 동작※모델 아키텍쳐
- PoseC3D
- PoseC3D는 2D 스켈레톤 조인트들을 그래프 기반으로 나타내지 않고 3D 히트맵(heatmap)으로 표현
- 서로 다른 시점의 2D 히트맵을 쌓아 3D 히트맵으로 모델링하고 이에 3D-CNN을 적용하는 방식
- 해당 방식은 기존의 GCN 기반 모델에 비해 계산 복잡도가 낮으며 다수의 데이터셋에서 더 좋은 성능을 보임. 또한, 기존과 다른 상황과 다른 방식으로 습득한 데이터에 대해서도 좋은 성능을 보인다는 점을 실험을 통해 확인함- 도커사용가이드
Posec3d 모델을 활용하여 주어진 영상의 종류를 분류하는 도커 환경 사용 가이드이다. 도커란 미리 만들어진 서버 환경을 사용할 수 있게 해주는 것으로, 도커 이미지를 사용할 경우별도의 환경 설정 없이 제작한 모델을 바로 사용할 수 있다. 도커를 사용하여 모델을 활용하는방법은 아래와 같은 단계에 따라 이뤄진다.1. 도커이미지불러오기
다운로드받은 도커 이미지 TAR파일을 불러온다. 이를 위해 도커가 설치된 환경에서 아래와 같은 코드를 터미널에서 실행한다.도커이미지불러오기 dockerload-i[DOCKERIMAGEPATH]
[DOCKERIMAGEPATH]:다운로드받은도커이미지TAR파일이위치한경로2. 도커컨테이너생성
위의 코드의 실행 결과 도커 이미지가 저장되었을 것이다. 이제 저장된 도커 이미지를 사용해 컨 테이너를 생성한다. 이를 위해서는 아래 코드를 터미널에서 실행한다.도커컨테이너생성 dockerrun-it--ipc=host–name[COTAINERNAME:NAME][IMAGENAME:TAG]
[CONTAINERNAME:NAME]:생성할컨테이너의이름및버전
[IMAGENAME:TAG]:실행할이미지의이름및버전3. 컨테이너터미널접속
생성되었던 컨테이너의 터미널에 접속하는 방법은 다음과 같다. 터미널에 접속하기 위해 아래와 같은 명령어를 실행하며, 이것의 결과로 도커 컨테이너내의 터미널로 이동한다.컨테이너터미널접속 dockerexec-it[CONTAINERID]
[CONTAINERID]:이미지로부터생성한컨테이너의아이디4. test.py파일실행
이제 모델을 사용하기 위해 코드 파일을 실행한다. 파일 실행에 필요한 여러 가지 명령어를 입력하고 tools폴더 내 test.py파일을 실행하면 된다. 이를 위해 아래와 같은 코드를 실행한다.test.py파일실행 Pythontools/test.py[CONFIGFILE][PTHFILE]
[CONFIGFILE]: 모델의 config파일, 모델의config 파일 아래와 같음
configs/skeleton/posec3d/wrestling6.py: 6개의 큰 동작 분류 모델의 config파일
configs/skeleton/posec3d/wrestling18.py:
18개의 세부 동작 분류 모델의 config파일
[PTHFILE]: 학습이 완료된 가중치를 불러올 파일로 각각의 파일 아래
wrestling6/best_acc_top1_epoch_22.pth: 6개의 큰 동작 분류 모델의 pth 파일
wrestling18/best_acc_top1_epoch_21.pth: 18개의 세부 동작 분류 모델의pth 파일※유효성 검증 결과
유효성 검증 결과 품질특성 TASK 명 모델명 지표 목표치 결과값 유효성 - 씨름 기술 자세 추정 Pose
C3DTop-3
Accuracy90% 99.07% - 씨름 기술 동작 인식 및 분류 96.92% - 서비스 활용 예시 및 시나리오
▶ 활용 방안- 씨름 지도자 교육 및 경기 분석에 활용
. 중앙협회와 지방협회를 중심으로 씨름의 보급을 위한 지도자, 선수, 예비선수 등을 위한 경기분석 프로그램 개발로 국내 보급 대상 확보- 씨름 시범 학교 교수 방법 보급에 활용
. 기본적인 초등학교 씨름 프로그램 1회 1시간 기준 운영 씨름 인공지능 데이터를 활용한 정량화된 기술과 개인별 신체에 적합한 방법 교수 및 학습- 가상현실(VR) 스포츠실에 활용
. 시도교육청의 시범 학교 가상현실 스포츠실 적극 활용
. 2023년부터 전국 145개 초등학교 보급- 씨름의 세계화에 활용
. 가상(Virture) 씨름대회 개최,
. 현 온라인 세계 무역마스터십 종목 채택을 통한 No비자, No항공권 등으로 저개발국가 대회 참가 독려
. WMC를 통한 국제 보급▶ 보급 방안
- 국내 보급 방안
. (1)대한씨름협회 지도자, 선수, 예비선수, (2)교육청 AI 씨름 프로그램 개발, (3)대학교 씨름부 및 사범대 체육학과용 AI 프로그램 등 보급
- 해외 보급 방안
. (1)세계무예마스터십위원회(WMC) 유네스코 상임자문기구 연계, (2)WMC의 국제무예아카데미 교육사업, (3)각 국가 무예마스터십위원회(NMC) 보급 등 국제기구 연계를 통해 보급 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 구성
데이터 구성 No 속성명 타입 구분 속성 및 내용 1 video.id Number 필수 비디오 아이디 2 video.file_name String 필수 비디오 파일명 3 video.camera_number Number 선택 카메라 번호 4 video.format String 필수 비디오 확장자 5 video.width Number 선택 비디오 가로길이 6 video.height Number 선택 비디오 세로길이 7 video.ratio String 선택 비디오 종횡비 8 video.fps Number 선택 원본영상 FPS 9 video.export_fps Number 선택 추출영상 FPS 10 video.length String 선택 비디오 길이 11 video.category String 필수 비디오 카테고리 12 video.created_date String 선택 비디오 촬영날짜 - 어노테이션 포맷
어노테이션 포맷 1) 영상 데이터어노테이션 포맷 1) 영상 데이터 구분 항목명 타입 필수
여부설명 비고 1 info Object Y 데이터셋 정보 1-1 info.description String Y 데이터셋 명칭 1-2 info.version String Y 데이터셋 버전 1-3 info.date_created number Y 데이터셋 생성년도 2023 2 categories Arr[Obj] Y 카테고리 정보 2-1 category.id Number Y 카테고리 아이디 2-2 category.supercatagory String Y 카테고리 대분류 “손기술” 등 2-3 category.name String N 기술명 “호미걸이” 등 3 video Object Y 비디오 정보 3-1 video.id Number Y 비디오 아이디 비디오 식별 id 3-2 video.file_name String Y 비디오 파일명 3-3 video.camera_number Number N 카메라 번호 1~8 “훈련영상에만 존재” 3-4 video.format String Y 비디오 확장자 3-5 video.width Number N 비디오 가로길이 3-6 video.height Number N 비디오 세로길이 3-7 video.ratio String N 비디오 종횡비 3-8 video.fps Number N 원본영상 FPS 3-9 video.export_fps Number N 추출영상 FPS 3-10 video.length String N 비디오 길이 “HH:mm:ss” 3-11 video.category String Y 비디오 카테고리 경기, 훈련영상 3-12 video.created_date String N 비디오 촬영날짜 “yyyymmdd” 4 video_annotations Arr[Obj] Y 비디오 구간
어노테이션 정보4-1 video_annotations[].id Number Y 비디오 구간
어노테이션 아이디4-2 video_annotations[].start Number N 비디오 구간 시작점 4-3 video_annotations[].end Number N 비디오 구간 끝점 4-4 video_annotations[].action_id Number Y 비디오 구간
분류 아이디1 4-5 video_annotations[].action String Y 비디오 구간 분류 “들배지기” 4-6 video_annotations[].attacker Number N 공격 선수 아이디 4-7 video_annotations[].
attacker_descriptionString N 공격 선수 설명 “홍샅바” 4-8 video_annotations[].winner Number N 승자 선수 아이디 Null(무승부시) 4-9 video_annotations[].
winner_descriptionString N 승자 선수 설명 “홍샅바” 4-10 video_annotations[].
subsectionsArr[Obj] N 비디오 세부
구간 리스트4-10-1 video_annotations[].
subsections.startNumber N 비디오 세부
구간 시작점4-10-2 video_annotations[].
subsections.endNumber N 비디오 세부
구간 끝점4-10-3 video_annotations[].
subsections.categoryString N 비디오 세부
구간 분류“동작1” 2) 이미지 데이터
어노테이션 포맷 2) 이미지 데이터 구분 항목명 타입 필수
여부설명 비고 1 info Object Y 데이터셋 정보 1-1 info.description String Y 데이터셋 명칭 1-2 info.version String Y 데이터셋 버전 1-3 info.date_created number Y 데이터셋 생성년도 2023 2 categories Arr[Obj] Y 카테고리 정보 2-1 category.id Number Y 카테고리 아이디 2-2 category.name String Y 카테고리 이름 2-3 category[].keypoints Arr[string] N 카테고리 키포인트 정보 [“head”, “Leye” ...] 3 video Object Y 비디오 정보 3-1 video.id Number Y 비디오 아이디 비디오 식별 id 3-2 video.file_name String Y 비디오 파일명 3-3 video.camera_number Number N 카메라 번호 1~8 “훈련영상에만 존재” 3-4 video.format String Y 비디오 확장자 3-5 video.width Number N 비디오 가로길이 3-6 video.height Number N 비디오 세로길이 3-7 video.ratio String N 비디오 종횡비 3-8 video.fps Number N 원본영상 FPS 3-9 video.export_fps Number N 추출영상 FPS 3-10 video.length String N 비디오 길이 “HH:mm:ss” 3-11 video.category String Y 비디오 카테고리 3-12 video.created_date String N 비디오 촬영날짜 “yyyymmdd” 4 video_annotations Arr[Obj] Y 비디오 구간
어노테이션 정보4-1 video_annotations[].id Number Y 비디오 구간
어노테이션 아이디4-2 video_annotations[].start Number N 비디오 구간 시작점 4-3 video_annotations[].end Number N 비디오 구간 끝점 4-4 video_annotations[].action_id Number Y 비디오 구간 분류 아이디 1 4-5 video_annotations[].action String Y 비디오 구간 분류 “들배지기” 4-6 video_annotations[].attacker Number N 공격 선수 아이디 4-7 video_annotations[].
attacker_descriptionString N 공격 선수 설명 “홍샅바” 4-8 video_annotations[].winner Number N 승자 선수 아이디 Null(무승부시) 4-9 video_annotations[].
winner_descriptionString N 승자 선수 설명 “홍샅바” 4-10 video_annotations[].
subsectionsArr[Obj] N 비디오 세부 구간 리스트 4-10-1 video_annotations[].
subsections.startNumber N 비디오 세부 구간 시작점 4-10-2 video_annotations[].
subsections.endNumber N 비디오 세부 구간 끝점 4-10-3 video_annotations[].
subsections.categoryString N 비디오 세부 구간 분류 “동작1” 5 image Arr Y 이미지 정보 5-1 image.id Number Y 이미지 식별자 5-2 image.file_name String Y 이미지 파일명 5-3 image.frame Number Y 프레임 번호 5-4 image.format String N 이미지 확장자 5-5 image.width Number N 이미지 가로길이 5-6 image.height Number N 이미지 세로길이 5-7 image.ratio String N 이미지 종횡비 5-8 image.video_range_id Number Y 이미지가 속한
비디오 구간 아이디5-9 image.caption String N 이미지 설명문 6 annotations Arr[Obj] Y 어노테이션정보 6-1 annotations[].id Number Y 어노테이션 아이디 6-2 annotations[].image_id Number Y 이미지 아이디 6-3 annotations[].player_id Number Y 선수 아이디 6-4 annotations[].category_id Number Y 카테고리ID 6-5 annotations[].bbox Arr[Num] Y 객체 Bounding Box 정보 [x, y, width, height] 6-6 annotations[].keypoints Arr[Obj] Y 객체 Keypoints 정보 6-6-1 annotations[].keypoints.class String Y 객체 Keypoints 명칭 6-6-2 annotations[].keypoints.
coordinate valueArr[Num] N 객체 Keypoints 좌표값 6-6-3 annotations[].keypoints.
presumptive_statusString Y 객체 Keypoints 추정여부 7 players Arr[Obj] Y 선수정보 7-1 players.id Number Y 선수 아이디 7-2 players.description String N 공격 선수 설명 “홍샅바” 7-3 players.gender String Y 선수 성별 7-4 players.age String N 선수 연령 “20대” 7-5 players.affiliation String N 선수 소속 “프로” 7-6 players.weight_class String Y 선수 체급 “금강” 7-7 players.height Number N 선수 신장 훈련영상에만 존재 7-8 players.weight Number N 선수 체중 훈련영상에만 존재 7-9 players.thigh_circumference Number N 선수 허벅지 둘레 훈련영상에만 존재 - 데이터 포맷
1) json 형식데이터 포맷 1) json 형식 영상 이미지
2) 실제 예시어노테이션 포맷 2) 실제 예시 영상 이미지 -
데이터셋 구축 담당자
수행기관(주관) : ㈜이랜서
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 김신표 02-3468-0042 pure@elancer.co.kr 사업 총괄 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜데이터메이커 학습용 데이터 정제·가공·검수 및 품질관리 인하대학교 산학협력단 AI 알고리즘, 데이터 검증 용인대학교 산학협력단 학습용 데이터 구축 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 박우진 02-545-0042 loyd@elancer.co.kr 김신표 02-3468-0042 pure@elancer.co.kr AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 이우기 032-860-7371 trinity@inha.ac.kr 김혜진 032-860-7371 hjkim1213@inha.ac.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 안희수 070-7139-9784 heesu.an@datamaker.io 이다희 070-7139-9784 dahee.lee@datamaker.io
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.