-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.1 2023-11-17 데이터 최종 개방 1.0 2023-05-30 데이터 개방(Beta Version) 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2023-11-27 산출물 전체 공개 소개
사람의 집단행동을 논리를 통해 정의된 규칙 정보를 바탕으로 인식할 수 있는 인공지능 학습용 데이터로서 8개 방향의 카메라를 활용한 다시점 영상 촬영, 추출된 이미지를 바운딩 박스, 폴리곤을 사용하여 라벨링
구축목적
규칙기반 집단행동 인식 비디오 데이터 : 사람의 집단행동을 논리를 통해 정의된 규칙 정보를 바탕으로 인식할 수 있는 인공지능 학습용 데이터 구축
-
메타데이터 구조표 데이터 영역 영상이미지 데이터 유형 비디오 , 이미지 데이터 형식 mp4 데이터 출처 자체 수집 라벨링 유형 바운딩박스, 폴리곤, 지식기반 입력 라벨링 형식 jpg, json 데이터 활용 서비스 스포츠 비디오 공격성공-득점성공 자동요약/ 경기 주요장면 자동 분석 기록, 요약 서비스 데이터 구축년도/
데이터 구축량2022년/60,000 -
1. 데이터 구축 규모
1) 원시데이터 획득1. 데이터 구축 규모 1) 원시데이터 획득 파일포맷 수량 해상도 FPS DAT 60,000개 1920*1080 120FPS 2) 원천데이터 획득(가공)
1. 데이터 구축 규모 2) 원천데이터 획득(가공) 파일포맷 수량 해상도 FPS MP4 60,000개 1920*1080 120FPS 3) 라벨 (가공)데이터
1. 데이터 구축 규모 3) 라벨 (가공)데이터 파일포맷 수량 라벨내용 JPG 192,980개 선수, 경기장 구성요소
선수, 경기장 메타정보
집단행동 지식기반정보JSON 192,980개 2. 데이터 분포
2. 데이터 분포 종목 유형 클래스 세부유형 소계 농구
(12,000)공격성공 속공 스틸-패스 3000 리바운드-패스 블로킹-패스 지공 컷인 플레이 3000 하이-로우 플레이 득점성공 2점 슛 득점 레이업 슛 3000 레이업슛 이외 3점 슛 득점 3점 슛 3000 배구
(12,000)공격성공 블로킹 성공 블로킹 3000 서드스텝어택 리시브-토스-스파이크 3000 득점성공 서브득점 서브득점 3000 스파이크 득점 오픈공격 득점 3000 속공 득점 후위공격 득점 핸드볼
(9,000)공격성공 지공 피벗 플레이 3000 크로싱 플레이 속공 차단-패스 3000 득점성공 슈팅득점 점프 슛 3000 야구
(12,000)공격성공 타자출루 스윙-1루 3000 볼넷-1루 진루 진루 3000 도루 득점성공 타점-번트 번트 3000 타점-안타 안타 3000 축구
(15,000)공격성공 연속적인 패스성공 연속패스 3000 슈팅성공 중거리 3000 근거리 득점성공 어시스트 득점 어시스트 3000 세트피스 득점 프리킥 3000 코너킥 페널티킥 득점 페널티킥 3000 -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드1. 개요
- 학습 알고리즘은 객체와 각 객체에 따른 속성을 이용하여 장면을 기술 하는 과정으로 객체 검출과 검출된 객체의 속성을 인식하는 두 단계 인공지능 모델로 이루어짐2. 객체 검출
- 객체 검출은 객체의 특징에 따라 바운딩박스와 폴리곤이 혼합된 형태로 라벨링 되어 있어, 폴리곤을 기준으로 인식을 하되, 바운딩박스 또한 사각 폴리곤 형식으로 적용하고, 사용한 모델은 YOLOv5 임
- YOLOv5는 Real-time Instance Segmentation on MSCOCO 영역에서 SOTA 성능인 45% 인식율을 나타내고, 기준 눈문(Kexin Yi, ...,Joshua B. Tenenbaum, "Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding" 2019)에서 객체 검출 용으로 사용 된 Mask R-CNN(34.6%, 16위) 대비 더 좋을 성능을 나타냄< Real-time Instance Segmentation on MSCOCO 순위 >
< YOLOv5 개념도 >
3. 속성인식
- 속성 인식은 객체에 대한 각각의 라벨링 정의에 따른 속성을 인식하는데 있어 AttNet(ResNet-50)을 사용함
- AttNet은 기준 눈문(Kexin Yi, ...,Joshua B. Tenenbaum, "Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding" 2019)에서 객체의 속성 인식용으로 사용된 모델임< AttNet의 개념도 >
4. 활용예시
- 최종적으로 인식된 객체의 속성은 지식기반 집단 행동을 검색하여 골 장면 중심으로 경기를 요약하는 등의 용도로 활용 할 수 있음 -
데이터 성능 점수
측정값 (%)기준값 (%)데이터 성능 지표
데이터 성능 지표 번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수 1 객체 검출 성능 Object Detection AttNet(ResNet-50) Accuracy 40 % 72 % 2 집단 행동 인식 성능 Object Detection GCN + MLP + HGP-SL layer Accuracy 65 % 83 %
※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.
※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)
-
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드대표적인 단체종목 농구, 배구, 핸드볼, 야구, 축구 중 주요 집단행동을 선정하여 실제 경기장에서 선수들이 수행하는 집단행동을 촬영
스포츠 전문가가 촬영데이터를 공격성공, 득점성공으로 분류하고, 이를 다시 4개에서 8개의 세부 집단행동으로 분류하고 각 집단행동의 핵심동작을 중간점으로 지정하고 시작지점과 종료지점의 이미지를 추출
각 이미지의 선수, 경기장 요소를 폴리곤, 바운딩 박스로 라벨링하고, 규칙기반의 설문작성을 통해 지식기반 데이터를 입력데이터 종류 1. 집단행동 명칭_ID : 종목과 집단행동별
2. 집단행동 시작 – core activity
-집단행동(종료, 결과)태깅정보
3. 사람 – 객체 어노테이션: 바운딩박스, 폴리곤1. 논리규칙 : 집단행동 영상의
‘객체-객체’, ‘사람-사람’, ‘사람-
객체 ‘간 관계 정보
2. 객체, 사람의 상태, 속성정보
2. ‘주어- 서술어’텍스트 표현데이터 구성 메타데이터 + 라벨링 정보 메타데이터 + 라벨링 정보 데이터 포맷 json json 데이터 수량 원천데이터와 동일 -
데이터셋 구축 담당자
수행기관(주관) : ㈜에어패스
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 최상훈 02-561-1511 shchoi@airpass.co.kr 데이터설계, 데이터 가공 수행기관(참여)
수행기관(참여) 기관명 담당업무 가치랩스 AI 알고리즘, 데이터 전처리, 검증 대한스포츠문화산업협회 데이터 획득, 정제, 라벨링 검수 컴아트시스템 데이터 획득, 영상촬영, 데이터 정제도구 개발 경희대학교 산학협력단 AI 알고리즘, 검증 미소정보기술 저작도구 개발운영, 유지보수, 데이터 뷰어 개발 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 최상훈 02-561-1511 shchoi@airpass.co.kr
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.
오프라인 데이터 이용 안내
본 데이터는 K-ICT 빅데이터센터에서도 이용하실 수 있습니다.
다양한 데이터(미개방 데이터 포함)를 분석할 수 있는 오프라인 분석공간을 제공하고 있습니다.
데이터 안심구역 이용절차 및 신청은 K-ICT빅데이터센터 홈페이지를 참고하시기 바랍니다.
국방데이터 개방 안내
본 데이터는 국방데이터로 군사 보안에 따라 AI허브에서 데이터를 제공하지 않으며,
군 담당자를 통한 별도의 사용 신청이 필요합니다.