BETA 학습태도 및 성향관찰 데이터
- 분야교육
- 유형 오디오 , 이미지 , 비디오
-
데이터 변경이력
데이터 변경이력 버전 일자 변경내용 비고 1.0 2024-06-28 데이터 개방 Beta Version 데이터 히스토리
데이터 히스토리 일자 변경내용 비고 2024-06-28 산출물 공개 Beta Version 소개
- 전연령층의 학습 성향 및 태도를 몰입도+감정으로 5가지 항목(집중-흥미로움, 집중-차분함, 집중하지않음-차분함, 집중하지않음-지루함, 졸음)으로 구분하여 학습대상자에게 적합한 학습 방향을 소개하고 관리할 수 있는 메타데이터 모음
구축목적
- 학습자의 학습 태도 영상 및 소음을 인식하여 성향 유형 분류를 통한 학습자의 성격 특성에 따른 학습양식과 흥미에 따라 선호하는 학습 방법 제시 및 학습자의 태도를 분석
-
메타데이터 구조표 데이터 영역 교육 데이터 유형 오디오 , 이미지 , 비디오 데이터 형식 MP4, WAV, JPG, CSV 데이터 출처 데이터 수집 (성인: 한국기술교육대학교, 미성년: 네오모듈) 라벨링 유형 바운딩박스(이미지/동영상)/키포인트(이미지/동영상) 라벨링 형식 JSON 데이터 활용 서비스 1) 각종 연구원에서 학습성향 연구 근거 자료로 활용 2) 한국기술교육대학교등 각종 대학교에서 학습 성향에 관련된 연구 논문에 근거 자료로 활용 3) 학습 콘텐츠 제작업체 참고 자료로 활용 4) 학교, 학원에서 수준별 학습 지도 데이터로 활용 5) 다양한 학습자(입시생/고시생/공시생)들의 학습시 표정과 태도 수집으로 자기 주도적 학습 도움 서비스 활용 6) 기타 : 학습 영상에서 개별 표정을 인식하여 몰입도+감정(집중함-흥미로움, 집중함-차분함, 집중하지 않음-차분함, 집중하지 않음-지루함, 졸음) 5단계로 분류하여 원격 교육 시 인터넷으로도 학생 지도 가능 데이터 구축년도/
데이터 구축량2023년/영상 14,465,700초 (4,018시간), 이미지 1,446,570건 (JSON), 소음 6,737,050초 (1,871시간) (JSON), 뇌파 20개 파일/1,344건 (JSON) -
데이터 통계 데이터 종류 데이터 형태 원시규모 원천규모 어노테이션규모 영상 데이터 동영상 (MP4) 17,197,540초 14,465,700초 1. 이미지 (JPG)를
기반으로 한 JSON파일
→ 1,446,570건
2.소음 기반
→ 6,737,050초
(1,871시간)
3.뇌파
→ 20개 파일
(1,344건)이미지 데이터 이미지 (JPG/JSON) - 1,446,570장 / 7,670건 소음 데이터 소음 (WAV) 8,103,330초
(2,251시간) / 7,670건6,737,050초
(1,871시간) / 7,670건뇌파 데이터 뇌파 (CSV) 20개 파일/1,613건 20개 파일/1,344건 메타 데이터 발화 (WAV,JSON) 1,588건 1,588건 1,588건 설문지 (CSV) 1건 (1,534건 취합) 1건 (1,534건 취합) 1건 (1,534건 취합) -
-
AI 모델 상세 설명서 다운로드
AI 모델 상세 설명서 다운로드 AI 모델 다운로드- 모델 학습
■ 본 과제를 통해 구축되는 데이터셋은 학습태도 및 성향 관찰을 판별하여
라벨링된 데이터이며 이를 이용한 모델은 학습자의 학습 태도 영상 및 음성을 인식하여 학습 성향 유형 분류, 학습자 분석하는 기술을 개발함■ 사용된 데이터는 몰입도 이미지, 소음, 뇌파이며, 몰입도 판별을 위해 활용하고, 인공지능을 통해 학습자의 학습태도를 파악하기 위한 구조로 학습자의 학습 몰입도 분류 모델을 개발함
■ 입력 데이터 종류와 특성에 따라 이미지만 입력될 경우에는 "동영상 데이터 학습 태도 및 감정 판별 모델", 음성과 뇌파까지 포함할 경우에는 "학습 태도 및 감정 분류 성능“ 따라
2개의 모델을 선정하여 사용함■ 영상, 음성, 뇌파, 로그 등의 데이터를 활용하기 위해 멀티모달 형태로 분류 모델을 개발함
■ 모델 학습 과정
카메라 촬영 > 얼굴 바운딩 박스 > 얼글 랜드마트 키포인트 > 동영상 데이터 학습 태도 및 감정 판별 모델- 서비스 활용 시나리오
■ 온 디바이스 AI 개발으로 개인정보의 유출을 방지하기 위해 학습자의 데이터 (음성, 영상 등)는 서버로 전송하지 않으며 모델의 출력값인 몰입도 수준만 서버로 전송하여 관리자용 대시보드, 콘텐츠 추천 등에 활용할 수 있게 경량화 모델로 개발함 -
설명서 및 활용가이드 다운로드
데이터 설명서 다운로드 구축활용가이드 다운로드- 데이터 설명 (이미지)
데이터 설명 (이미지) Key Description Type Child Type Image 이미지 object filename 원천데이터 이름 string date 데이터 수집일자 string format 이미지 화일명 string category 카테고리 object category.id 카테고리 식별자 number category.name 카테고리 명 string emotion 감정 구분 string gender 성별 number birth 나이 number education 학력 string grade 학년 string subject 선호과목 string method 학습 방법 선호도 string place 학습 방법 유형 string student_type 학습자 유형 string student_thou 학습자_사고 유형 string student_char 학습자_학습 성격 string student_act 학습자_행동 조절 string ignition_type 발화 타입 string content_type 컨텐츠 타입 string timeline 하이라이트 object timeline.id 하이라이트 구간 식별자 number timeline.start 구간 시작 string timeline.end 구간 종료 string imgsize 이미지 파일 크기(MB) number width 이미지 가로길이 number height 이미지 세로길이 number face_box 안면 바운딩 박스 x,y 좌표 array [] 좌표 array $value$ 좌표값 number face_points 안면 랜드마크 array 68개 points x,y [] 좌표 array $value$ 좌표값 number skeleton 스캘래톤 x,y 좌표 array [] 좌표 array $value$ 좌표값 number area_nm 지역 string hh 수집시간 string - 데이터 설명 (소음)
데이터 설명 (소음) Key Description Type Child Type filename 원천데이터 이름 string id 소음 라벨링 데이터 아이디 string date 데이터 수집일자 string format 파일 형식 string start_time 원본동영상 시작 타임스탬프 string end_time 원본동영상 종료 타임스탬프 string wavsize 음성 파일 용량 number bit 비트수(16,32) number samplerate 44100HZ, 48000HZ number noise 소음 구간 식별자 number noise_start 소음 구간 시작 string noise_end 소음 구간 종료 string noise_type 소음 카테고리 string decibel_avg 음성 파일의 평균 데시빌 number decibel 음성 파일의 데시빌 리스트 array $value$ 음성 파일 데시빌 값 number - 데이터 설명 (뇌파)
데이터 설명 (뇌파) Key Description Type Child Type filename 원천데이터 이름 string id 뇌파 라벨링 데이터 아이디 string date 데이터 수집일자 string format 파일 형식 string category 카테고리 object category.id 카테고리 식별자 number category.name 카테고리 명 string emotion 감정 구분 string brain_start 뇌파 구간 시작 string brain_end 뇌파 구간 종료 string brain_alpha 몰입도 태깅된 알파정보 array $value$ 몰입도 태깅된 알파정보값 number brain_beta 몰입도 태깅된 베타정보 array $value$ 몰입도 태깅된 베타정보값 number brain_theta 몰입도 태깅된 세타정보 array $value$ 몰입도 태깅된 세타정보값 number brain_delta 몰입도 태깅된 델타정보 array $value$ 몰입도 태깅된 델타정보값 number brain_gamma 몰입도 태깅된 감마정보 array $value$ 몰입도 태깅된 감마정보값 number psn_std_cctrt_alpha 집중함 개인 기준 알파 정보 array $value$ 집중함 개인 기준 알파 정보값 number psn_std_cctrt_beta 집중함 개인 기준 베타 정보 array $value$ 집중함 개인 기준 베타 정보값 number psn_std_cctrt_theta 집중함 개인 기준 세타 정보 array $value$ 집중함 개인 기준 세타 정보값 number psn_std_cctrt_delta 집중함 개인 기준 델타 정보 array $value$ 집중함 개인 기준 델타 정보값 number psn_std_cctrt_gamma 집중함 개인 기준 감마 정보 array $value$ 집중함 개인 기준 감마 정보값 number psn_std_dstrt_alpha 집중하지 않음 개인
기준 알파 정보array $value$ 집중하지 않음 개인
기준 알파 정보값number psn_std_dstrt_beta 집중하지 않음 개인
기준 베타 정보array $value$ 집중하지 않음 개인
기준 베타 정보값number psn_std_dstrt_theta 집중하지 않음 개인
기준 세타 정보array $value$ 집중하지 않음 개인
기준 세타 정보값number psn_std_dstrt_delta 집중하지 않음 개인
기준 델타 정보array $value$ 집중하지 않음 개인
기준 델타 정보값number psn_std_dstrt_gamma 집중하지 않음 개인
기준 감마 정보array $value$ 집중하지 않음 개인
기준 감마 정보값number psn_std_spns_alpha 졸음 개인 기준 알파 정보 array $value$ 졸음 개인 기준 알파 정보값 number psn_std_spns_beta 졸음 개인 기준 베타 정보 array $value$ 졸음 개인 기준 베타 정보값 number psn_std_spns_theta 졸음 개인 기준 세타 정보 array $value$ 졸음 개인 기준 세타 정보값 number psn_std_spns_delta 졸음 개인 기준 델타 정보 array $value$ 졸음 개인 기준 델타 정보값 number psn_std_spns_gamma 졸음 개인 기준 감마 정보 array $value$ 졸음 개인 기준 감마 정보값 number - 어노테이션 포맷 (이미지)
어노테이션 포맷 (이미지) No 항목 길이 타입 필수여부 비고 한글명 영문명 1 이미지 object Y 1-1 원천데이터 이름 filename string Y "psj-2-23-1.mp4" 1-2 데이터 수집일자 date string Y 2023.02.15 1-3 이미지 화일명 format string Y “psj-2-23-1-0001.jpg" 1-4 카테고리 category object Y 1-4-1 카테고리 식별자 category.id number Y [1,2,3] 1-4-2 카테고리 명 category.name string Y [집중,집중하지않음,졸음] 1-5 감정 구분 emotion string Y [흥미로움,차분함,지루함] 1-6 성별 gender number Y 남:1/여:2 1-7 나이 birth number Y 23 1-8 학력 education string Y [초등학교,중학교,고등학교,대학교] 1-9 학년 grade string Y [1, 2, 3, 4, 5, 6] 1-10 선호과목 subject string Y [수학,영어] 1-11 학습 방법 선호도 method string Y [개인,집단,개인/집단 혼형] 1-12 학습 방법 유형 place string Y [오프라인,온라인,하이브리드] 1-13 학습자 유형 student_type string Y [확산형, 동화형, 수렴형, 적용형] 1-14 학습자_사고 유형 student_thou string Y [총체적,분석적] 1-15 학습자_학습 성격 student_char string Y [자기지향,사회지향] 1-16 학습자_행동 조절 student_act string Y [이성,감성] 1-17 발화 타입 ignition_type string N [질문형:1/요약형:2/의문형:3/직관형:4] 1-18 컨텐츠 타입 content_type string N [초등 저학년 융합교육, 초등학교 고학년 국어 ....] 1-19 하이라이트 timeline object Y 1-19-1 하이라이트 구간 식별자 timeline.id number Y 1 1-19-2 구간 시작 timeline.start string Y “00:00:00“ 1-19-3 구간 종료 timeline.end string Y “00:00:10“ 1-20 이미지 파일 크기(MB) imgsize number Y 5.6 1-21 이미지 가로길이 width number Y 1080 1-22 이미지 세로길이 height number Y 720 1-23 안면 바운딩 박스 x,y 좌표 face_box array Y "face_box":{
"h" : 698.14,
"w" : 690.14,
"x" : 189.11,
"y" : 520.97,
}1-23-1 좌표 [] array Y 1-23-2 좌표값 $value$ number Y 1-24 안면 랜드마크
68개 points x,yface_points array Y "face_points" :
[[222.56], [534.76, 123.08], ...]
1-24-1 좌표 [] array Y 1-24-2 좌표값 $value$ number Y 1-25 스캘래톤 x,y 좌표 skeleton array N "skeleton": [
[290, 322],
[414,327],
...
]1-25-1 좌표 [] array N 1-25-2 좌표값 $value$ number N 1-26 지역 area_nm string N 경기도 1-27 수집시간 hh string Y [10, 12, 14 ...] - 어노테이션 (소음)
어노테이션 (소음) No 항목 길이 타입 필수여부 비고 한글명 영문명 2 소음 object Y 2-1 원천데이터 이름 filename string Y "psj-2-23-1.wav" 2-2 소음 라벨링 데이터 아이디 id string Y "psj-2-23-1-1-1" 2-3 데이터 수집일자 date string Y “2023.02.15“ 2-4 파일 형식 format object Y “wav“ 2-5 원본동영상 시작 타임스탬프 start_time number Y “00:00:00“ 2-6 원본동영상 종료 타임스탬프 end_time string Y “00:00:10“ 2-7 음성 파일 용량 wavsize string Y 5.6 2-8 비트수(16,32) bit number Y 16 2-9 44100HZ, 48000HZ samplerate number Y 44100 2-10 소음 구간 식별자 noise string Y 미포함:0, 포함:1 2-11 소음 구간 시작 noise_start string Y “08:10:00“ 2-12 소음 구간 종료 noise_end string Y “08:20:00“ 2-13 소음 카테고리 noise_type string Y 무음:0, 자동차:1, 싸이랜:2,
키보드소리:3, 웅성웅성(대화):42-14 음성 파일의 평균 데시빌 decibel_avg string Y 100 2-15 음성 파일의 데시빌 리스트 decibel string Y [100,102,103,..] 2-15-1 음성 파일의 데시빌 값 $value$ string Y - 어노테이션 (뇌파)
어노테이션 (뇌파) No 항목 길이 타입 필수여부 비고 한글명 영문명 string 3 뇌파 string Y 3-1 원천데이터 이름 filename string Y "psj-2-23-1.csv" 3-2 뇌파 라벨링 데이터 아이디 id string N "psj-2-23-1-1-1" 3-3 데이터 수집일자 date object Y “2023.02.15“ 3-4 파일 형식 format number Y “csv“ 3-5 카테고리 category string Y 3-5-1 카테고리 식별자 category.id string Y [1,2,3] 3-5-2 카테고리 명 category.name string Y [집중,집중하지않음,졸음] 3-6 감정 구분 emotion string Y [흥미로움,차분함,지루함,알수없음] 3-7 뇌파 구간 시작 brain_start array Y “00:00:00“ 3-8 뇌파 구간 종료 brain_end number Y “00:00:10“ 3-9 몰입도 태깅된 알파정보 brain_alpha array Y "alpha“:{ 91.5, 91.6, 92.7, ..., } 3-9-1 몰입도 태깅된 알파정보값 $value$ number Y 3-10 몰입도 태깅된 베타정보 brain_beta array Y "beta“:{ 88.5, 88.6, 88.7, .., } 3-10-1 몰입도 태깅된 베타정보값 $value$ number Y 3-11 몰입도 태깅된 세타정보 brain_theta array Y "theta“:{ 88.5, 88.6, 88.7, .., } 3-11-1 몰입도 태깅된 세타정보값 $value$ number Y 3-12 몰입도 태깅된 델타정보 brain_delta array Y "delta“:{ 88.5, 88.6, 88.7, .., } 3-12-1 몰입도 태깅된 델타정보값 $value$ number Y 3-13 몰입도 태깅된 감마정보 brain_gamma array Y "gamma“:{ 88.5, 88.6, 88.7, .., } 3-13-1 몰입도 태깅된 감마정보값 $value$ number Y 3-14 집중함 개인 기준 알파 정보 psn_std_cctrt_alpha array Y "psn_std_cctrt_alpha“:{ 91.5, 91.6, 92.7, ..., } 3-14-1 집중함 개인 기준 알파 정보값 $value$ number Y 3-15 집중함 개인 기준 베타 정보 psn_std_cctrt_beta array Y "psn_std_cctrt_beta“:{ 88.5, 88.6, 88.7, .., } 3-15-1 집중함 개인 기준 베타 정보값 $value$ number Y 3-16 집중함 개인 기준 세타 정보 psn_std_cctrt_theta array Y "psn_std_cctrt_theta“:{ 88.5, 88.6, 88.7, .., } 3-16-1 집중함 개인 기준 세타 정보값 $value$ number Y 3-17 집중함 개인 기준 델타 정보 psn_std_cctrt_delta array Y "psn_std_cctrt_delta“:{ 88.5, 88.6, 88.7, .., } 3-17-1 집중함 개인 기준 델타 정보값 $value$ number Y 3-18 집중함 개인 기준 감마 정보 psn_std_cctrt_gamma array Y "psn_std_cctrt_gamma“:{ 88.5, 88.6, 88.7, .., } 3-18-1 집중함 개인 기준 감마 정보값 $value$ number Y 3-19 집중하지 않음 개인
기준 알파 정보psn_std_dstrt_alpha array Y "psn_std_dstrt_alpha“:{ 91.5, 91.6, 92.7, ..., } 3-19-1 집중하지 않음 개인
기준 알파 정보값$value$ number Y 3-20 집중하지 않음 개인
기준 베타 정보psn_std_dstrt_beta array Y "psn_std_dstrt_beta“:{ 88.5, 88.6, 88.7, .., } 3-20-1 집중하지 않음 개인
기준 베타 정보값$value$ number Y 3-21 집중하지 않음 개인
기준 세타 정보psn_std_dstrt_theta array Y "psn_std_dstrt_theta“:{ 88.5, 88.6, 88.7, .., } 3-21-1 집중하지 않음 개인
기준 세타 정보값$value$ number Y 3-22 집중하지 않음 개인
기준 델타 정보psn_std_dstrt_delta array Y "psn_std_dstrt_delta“:{ 88.5, 88.6, 88.7, .., } 3-22-1 집중하지 않음 개인
기준 델타 정보값$value$ number Y 3'-23 집중하지 않음 개인
기준 감마 정보psn_std_dstrt_gamma array Y "psn_std_dstrt_gamma“:{ 88.5, 88.6, 88.7, .., } 3-23-1 집중하지 않음 개인
기준 감마 정보값$value$ number Y 3-24 졸음 개인 기준 알파 정보 psn_std_spns_alpha array Y "psn_std_spns_alpha“:{ 91.5, 91.6, 92.7, ..., } 3-24-1 졸음 개인 기준 알파 정보값 $value$ number Y 3-25 졸음 개인 기준 베타 정보 psn_std_spns_beta array Y "psn_std_spns_beta“:{ 88.5, 88.6, 88.7, .., } 3-25-1 졸음 개인 기준 베타 정보값 $value$ number Y 3-26 졸음 개인 기준 세타 정보 psn_std_spns_theta array Y "psn_std_spns_theta“:{ 88.5, 88.6, 88.7, .., } 3-26-1 졸음 개인 기준 세타 정보값 $value$ number Y 3-27 졸음 개인 기준 델타 정보 psn_std_spns_delta array Y "psn_std_spns_delta“:{ 88.5, 88.6, 88.7, .., } 3-27-1 졸음 개인 기준 델타 정보값 $value$ number Y 3-28 졸음 개인 기준 감마 정보 psn_std_spns_gamma array Y "psn_std_spns_gamma“:{ 88.5, 88.6, 88.7, .., } 3-28-1 졸음 개인 기준 감마 정보값 $value$ number Y -
데이터셋 구축 담당자
수행기관(주관) : ㈜벨텍소프트
수행기관(주관) 책임자명 전화번호 대표이메일 담당업무 곽상범 이사 02-2266-7618 dory1478@gmail.com 저작도구 (정제, 가공, 검수) 제작, 데이터 구축, 사업 전반 관리 수행기관(참여)
수행기관(참여) 기관명 담당업무 ㈜네오모듈 10대 데이터 수집, 10대 데이터 정제, 10대 데이터 가공 ㈜비씨앤컴퍼니 데이터 품질 점검 및 관리 ㈜에듀에이아이 AI 모델 개발 및 검증 한국기술교육대학교 산학협력단 성인 데이터 수집, 성인 데이터 정제, 성인 데이터 가공 데이터 관련 문의처
데이터 관련 문의처 담당자명 전화번호 이메일 우주엽 대표 02-518-9688 jy.woo@doctorkeeper.com 하유림 매니저 02-518-9688 yl.ha@doctorkeeper.com AI모델 관련 문의처
AI모델 관련 문의처 담당자명 전화번호 이메일 김상수 이사 02-6207-7744 sskim@edu-ai.co.kr 연성주 선임 02-6207-7744 seoungju@edu-ai.co.kr 저작도구 관련 문의처
저작도구 관련 문의처 담당자명 전화번호 이메일 곽상범 이사 02-2266-7618 dory1478@gmail.com 박영식 수석 02-2266-7618 yspark2879@gmail.com
-
인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
* 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
* 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석 -
- AI 허브 접속
신청자 - 안심존
사용신청신청자신청서류 제출* - 심사구축기관
- 승인구축기관
- 데이터 분석 활용신청자
- 분석모델반출신청자
- AI 허브 접속
-
1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
2. 기관생명윤리위원회(IRB) 승인된 연구계획서
3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
4. 안심존 이용 신청서 [다운로드]
5. 보안서약서 [다운로드]
※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다. -
신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의
데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.
API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.
리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.
※ 파일 병합 리눅스 명령어
find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"
- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.
- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.
※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.