콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#개인 특정 # 필적감정 # 서명 시스템 # 간편인증 # 디지털 펜

개인 특정을 위한 자필과 모사 필기체 데이터

개인 특정을 위한 자필과 모사 필기체 데이터 아이콘 이미지
  • 분야영상이미지
  • 유형 이미지
구축년도 : 2022 갱신년월 : 2024-01 조회수 : 6,465 다운로드 : 336 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2024-01-24 데이터 최종 개방
    1.0 2023-06-14 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2024-03-06 산출물 전체 공개

    소개

    본 데이터는 수능과 모의평가에서 사용된 최근 5년 내의 문구 30개를 선정하여 디지털펜에서 수집된 필압, 필기속도 등의 필기속성 24종으로 필적감정을 통한 개인의 필체와 그 필체를 모사하여 개인 특정의 지표가 될 수 있는 데이터

    구축목적

    디지털펜에서 수집된 필압, 필기속도 등의 필기속성 24종으로 필적감정을 통한 개인의 필체와 그 필체를 모사하여 개인 특정의 지표가 될 수 있는 데이터
  • - 데이터 구축 규모

    데이터 구축 규모
    구분 자필 이미지 데이터 모사 이미지 데이터
    라벨링데이터 문장 이미지 수량 43,305세트 43,305세트
    합 계 86,610세트
    이미지 수량 6,495,750장 6,495,750장
    합 계 12,991,500장
    비율 50% 50%

     

    - 데이터분포


     1. 날씨 분포

    1. 날씨 분포
    날씨 구분 데이터 비율
    맑음 55,600 64.19%
    8,070 9.33%
    흐림 22,940 26.48%
    합계 86,610 100%

     

    2. 문장 종류 분포

    2. 문장 종류 분포
    문장 종류 데이터 비율
    그것들이 내 삶의 거름이 되어 445,500 3.43%
    그대 맑은 눈을 들어 나를 보느니 450,000 3.46%
    내 삶의 나날들을 기쁨으로 아름답게 423,000 3.26%
    내게 환한 불 밝혀 주는 사랑의 말들 436,500 3.36%
    너 앉은 자리가 바로 희망 꽃자리 418,500 3.22%
    너무 맑고 초롱한 그 중 하나 별이여 450,000 3.46%
    너의 값진 말들로 희망을 노래하라 427,500 3.29%
    넓은 하늘로의 비상을 꿈꾸며 436,500 3.36%
    넓은 하늘의 수만 별을 그대로 총총 400,500 3.08%
    또 한 발짝 가지런히 발을 옮긴다 445,500 3.43%
    많고 많은 사람 중에 그대 한 사람 432,000 3.33%
    많이 사랑할수록 더 맑게 흐르는 450,000 3.46%
    맑고 아름다운 하늘을 받들어 405,000 3.12%
    머지않아 열매 맺는 가을을 향하여 432,000 3.33%
    모두가 이름 붙어 있지 않은 보석들 450,000 3.46%
    바위는 제자리에 옴찍 않노니 450,000 3.46%
    빨갛게 익어 가는 감을 닮아서 450,000 3.46%
    사람이 하늘처럼 맑아 보일 때가 있다 454,500 3.50%
    삶의 힘이 끝없이 자라는 우리들 450,000 3.46%
    세상을 지켜 낸 태양보다 값진 오늘 450,000 3.46%
    아름다운 네 모습 잃지 않았으면 436,500 3.36%
    어둠이 없으면 별의 반짝임도 없으리 441,000 3.39%
    우리의 삶 자체가 하나의 꽃밭이다 360,000 2.77%
    젊은이여 그 길은 너의 것이다 423,000 3.26%
    하늘 빛을 닮은 그 들판 곁에 서서 355,500 2.74%
    행복하다 말하면 맑아지는 마음 450,000 3.46%
    환한 빛으로 반짝이는 삶의 굽이에서 450,000 3.46%
    흙 내음 빗소리 아름다운 여름날 436,500 3.36%
    흙덩이의 무게를 이기고 올라오는 싹 436,500 3.36%
    희망 속 삶은 보석처럼 반짝이리 445,500 3.43%
    합계 12,991,500 100%

     

    3. 수집도구 분포

    3. 수집도구 분포
    수집도구 종류 데이터 비율
    M1P 44,465 51.34%
    N2 42,145 48.66%
    합계 86,610 100%

     

    4. 성별 분포

    4. 성별 분포
    성별 종류 데이터 비율
    42,540 49.12%
    44,070 50.88%
    합계 86,610 100%

     

    5. 필기 자세별 분포

    5. 필기 자세별 분포
    필기 자세별 종류 데이터 비율
    DOWN 28,870 33.33%
    STAND 28,870 33.33%
    LAEN 28,870 33.33%
    합계 86,610 100%

     

    6. 연령대별 분포

    6. 연령대별 분포
    연령대별 종류 데이터 비율
    20 21,837 25.21%
    30 21,360 24.66%
    40 21,930 25.32%
    50 17,135 19.79%
    60 4,350 5.02%
    합계 86,610 100%
  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
    모델
    모델명 CNN+LSTM Integrated DeepSignet
    모델 설명 - Image Integrated DeepSigNet와 동일하게 Pair Image Data와 Time-Series Data를 모두 사용하나, 시계열 데이터를 분석 시 CNN+LSTM 기반 모델을 사용함
    - Image Integrated DeepSigNet보다 모델 복잡도는 더 높고 최적화 튜닝이 어려우나, CNN을 이용해 Time-Step별 시계열 데이터의 주요 Feature를 뽑는 과정이 추가되어 조금 더 높은 분류 성능을 보일 수 있음
    모델 아키텍쳐 AI 모델 CNN+LSTM Integrated DeepSignet 아키텍쳐
    Input imag, Output image (B, H, W, 3), (B, H, W, 3)
    Task Instance segmentation
    Training dataset - Training Set: 79.22%(68,610 SET)
    - Validation Set: 10.39%(9,000 SET)
    - Test Set: 10.39%(9,000 SET)
    학습 조건 epoch=75, batch=128, optimizer=RMSprop, 
    loss=contrastive loss with euclidean distance
    평가 메트릭

    EER

    평가 메트릭 그래프

    (오인식률(FAR, False Acceptance Rate)과 오거부율(FRR, False Rejection Rate)이 같아지는 비율로 두 그래프가 만나는 지점 값)
    저작권 표기 SPDX-FileCopyrightText: © 2022 VISIONIN CO., LTD.
    SPDX-License-Identifier:Apache-2.0
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 자필 및 모사 분류 성능 Image Classification Siamese networks with CNN-LSTM as base network EER 25 % 18 %

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    - 데이터 설명

    데이터 설명
    구분  획득(수집) 단계  정제 단계 가공(라벨링) 단계
    데이터 구분 원시데이터 원천데이터 최종데이터
    데이터 형태 디지털펜 -> 이미지 이미지 이미지 파일 형태로 산출
    데이터 포맷 이미지 해상도 765*88PNG 형식 이미지 해상도 765*88PNG 형식 이미지: PNG
    가공데이터: JSON

     

    - 데이터 포맷

    데이터 포맷
    항목
    자필 예시 정제된 원천데이터 자필 예시 문장 사람이 하늘처럼 맑아 보일 때가 있다
    모사 예시 정제된 원천데이터 자필 예시 문장 사람이 하늘처럼 맑아 보일 때가 있다
    Json 형식
    라벨데이터 예시 JSON 형식
    (예시)

     

    속성
    구분 No 속성명 속성 및 내용
    필수 1 images 이미지 정보
    필수 2 images[].image_info[] 이미지 정보(가변)
    필수 3 images[].image_info[].file_name 이미지 파일 명
    필수 4 images[].image_info[].data_captured 이미지 파일 생성일
    필수 5 images[].image_info[].image_id 이미지 아이디
    필수 6 images[].image_data[] 이미지 정보(fix)
    필수 7 images[].image_data[].data_type 데이터 클래스 이름
    필수 8 images[].image_data[].similar 서명 데이터의 참/거짓 여부
    필수 9 images[].image_data[].size[] 이미지 사이즈
    필수 10 images[].image_data[].size[].depth 이미지 채널 수
    필수 11 images[].image_data[].size[].width 이미지 너비
    필수 12 images[].image_data[].size[].height 이미지 높이
    필수 13 images[].annotations[] annotation 정보
    필수 14 images[].annotations[].id 객체 id (이미지 아이디와 동일)
    필수 15 images[].annotations[].area 객체 면적
    필수 16 images[].annotations[].bndbox[] 객체 바운딩 박스 정보
    필수 17 images[].annotations[].bndbox[].xmin 객체 바운딩 박스 X축 최소값
    필수 18 images[].annotations[].bndbox[].ymin 객체 바운딩 박스 Y축 최소값
    필수 19 images[].annotations[].bndbox[].xmax 객체 바운딩 박스 X축 최대값
    필수 20 images[].annotations[].bndbox[].ymax 객체 바운딩 박스 Y축 최대값
    필수 21 images[].annotations[].entity_box 객체 꼭지점 위치 정규값
    필수 22 images[].annotations[].property[] 객체 문장 세부 정보
    필수 23 images[].annotations[].property[].supercategory 문장
    필수 24 images[].annotations[].property[].category_id 문장 번호
    필수 25 track[] Track 정보
    필수 26 track[].timestamp 시계열 데이터의 시간 정보
    필수 27 track[].sensing_feature[] 시계열 데이터의 센서
    필수 28 track[].sensing_feature[].time_interval 샘플링 시간
    필수 29 track[].sensing_feature[].action 필기 상태 DOWN/UP/MOVE
    필수 30 track[].sensing_feature[].x 필기 위치 x 좌표
    필수 31 track[].sensing_feature[].y 필기 위치 y 좌표
    필수 32 track[].sensing_feature[].pressure 필압
    필수 33 track[].sensing_feature[].velocity_magnitude 필기 속도
    필수 34 track[].sensing_feature[].acceleration_magnitude 필기 가속도
    필수 35 track[].sensing_feature[].ratio_minimum_maximum_speed_5-samples 연속된 5개의 샘플에 대한 최저 속도와 최대 속도의 비
    필수 36 track[].sensing_feature[].angle_consecutive_samples 연속된 3개 샘플이 이루는 각의 라디안 값
    필수 37 track[].sensing_feature[].sine_consecutive_samples 연속된 3개 샘플이 이루는 각의 라디안 값의 사인
    필수 38 track[].sensing_feature[].cosine_consecutive_samples 연속된 3개 샘플이 이루는 각의 라디안 값의 코사인
    필수 39 track[].sensing_feature[].log_curvature_radius 연속된 4개 샘플이 이루는 곡률 반경의 log 값
    필수 40 track[].sensing_feature[].difference[] 센서 데이터의 차분 값
    필수 41 track[].sensing_feature[].difference[].x 필기 위치의 x 좌표의 차분 값
    필수 42 track[].sensing_feature[].difference[].y 필기 위치의 y 좌표의 차분 값
    필수 43 track[].sensing_feature[].difference[].pressure 필압의 차분 값
    필수 44 track[].sensing_feature[].difference[].velocity_magnitude 필기 속도의 차분 값
    필수 45 track[].sensing_feature[].difference[].acceleration_magnitude 필기 가속도의 차분 값
    필수 46 track[].sensing_feature[].difference[].angle_consecutive_samples 연속된 3개 샘플이 이루는 각의 차분 값
    필수 47 track[].sensing_feature[].second_order_difference[] 센서 데이터의 2차 차분 값
    필수 48 track[].sensing_feature[].second_order_difference[].x 필기 위치의 x 좌표의 차분 값
    필수 49 track[].sensing_feature[].second_order_difference[].y 필기 위치의 y 좌표의 차분 값
    필수 50 track[].sensing_feature[].stroke_length_ratio[] 필기 샘플 연결선의 총 길이와 샘플링 시간의 비
    필수 51 track[].sensing_feature[].stroke_length_ratio[].3-samples 3개의 샘플 연결선의 총 길이와 3개 샘플링 시간의 비
    필수 52 track[].sensing_feature[].stroke_length_ratio[].5-samples 5개의 샘플 연결선의 총 길이와 5개 샘플링 시간의 비
    필수 53 track[].sensing_feature[].stroke_length_ratio[].7-samples 7개의 샘플 연결선의 총 길이와 7개 샘플링 시간의 비
    필수 54 track[].sensing_feature[].stroke_length_ratio[].12-samples 12개의 샘플 연결선의 총 길이와 12개 샘플링 시간의 비
    필수 55 enviroments[] 환경 정보
    필수 56 enviroments[].location 영상 촬영 장소
    필수 57 enviroments[].resolution 영상 촬영 시 카메라 해상도
    필수 58 enviroments[].weather 영상 촬영 시 날씨
    필수 59 enviroments[].pen 사용한 펜 종류
    필수 60 person[] 작성자 정보
    필수 61 person[].id 작성자 시리얼 넘버
    필수 62 person[].sex 작성자 성별
    필수 63 person[].age_group 작성자 나이대
    필수 64 person[].posture 작성자 자세

     

    - 데이터 폴더명 구성

    데이터 폴더명 구성
    원천데이터/라벨링데이터 문장번호 수집형태_날짜_작성자번호 자세_번호
    원천데이터 문장01 모사_0919_001 벽에기대서_01

     

    - 데이터 파일명 구성

    데이터 파일명 구성
    원천데이터/라벨링데이터 파일명(파일명_년월일_시분초_
    원천데이터 Frameimage(sent1)_221008_001917_A_0001_x_0642_y_0267_f_732_t_20221008_001552_000.png
    라벨링데이터 labels(sent1).json

     

    - 어노테이션 포맷

    어노테이션 포맷
    구분 속성명 타입 필수여부 설명 범위 비고
    1 images Object Y 이미지 정보 1  
      1-1 images[].image_info[] Object Y 이미지 정보(가변)    
    1-1-1 images[].image_info[].file_name String Y 이미지 파일 명    
    1-1-2 images[].image_info[].data_captured String Y 이미지 파일 생성일   구문검사규칙 참고
    1-1-3 images[].image_info[].image_id Int Y 이미지 아이디 1~150  
    1-2 images[].image_data[] Object Y 이미지 정보(fix)    
    1-2-1 images[].image_data[].data_type String Y 데이터 클래스 이름   images
    1-2-2 images[].image_data[].similar Bool Y 서명 데이터의 참/거짓 여부 true, FALSE  
    1-2-3 images[].image_data[].size[] Object Y 이미지 사이즈    
    1-2-4 images[].image_data[].size[].depth Int Y 이미지 채널 수 3 size 고정
    1-2-5 images[].image_data[].size[].width Int Y 이미지 너비 756 size 고정
    1-2-6 images[].image_data[].size[].height Int Y 이미지 높이 88 size 고정
    1-3 images[].annotations[] Object Y annotation 정보    
    1-3-1 images[].annotations[].id Int Y 객체 id (이미지 아이디와 동일) 1~150  
    1-3-2 images[].annotations[].area Int Y 객체 면적 0~66528  
    1-3-3 images[].annotations[].bndbox[] Object Y 객체 바운딩 박스 정보    
    1-3-3-1 images[].annotations[].bndbox[].xmin Int Y 객체 바운딩 박스 X축 최소값 0~88  
    1-3-3-2 images[].annotations[].bndbox[].ymin Int Y 객체 바운딩 박스 Y축 최소값 0~756  
    1-3-3-3 images[].annotations[].bndbox[].xmax Int Y 객체 바운딩 박스 X축 최대값 0~88  
    1-3-3-4 images[].annotations[].bndbox[].ymax Int Y 객체 바운딩 박스 Y축 최대값 0~756  
    1-3-4 images[].annotations[].entity_box List Y 객체 꼭지점 위치 정규값 0 ~  
    1-3-5 images[].annotations[].property[] Object Y 객체 문장 세부 정보    
    1-3-5-1 images[].annotations[].property[].supercategory String Y 문장 별표 참고  
    1-3-5-2 images[].annotations[].property[].category_id String Y 문장 번호 별표 참고 1~30
    2 track[] Object Y Track 정보 1 ~  
      2-1 track[].timestamp String Y 시계열 데이터의 시간 정보   구문검사규칙 참고
    2-2 track[].sensing_feature[] Object Y 시계열 데이터의 센서    
    2-2-1 track[].sensing_feature[].time_interval String Y 샘플링 시간 0 ~  
    2-2-2 track[].sensing_feature[].action String Y 필기 상태 DOWN/UP/MOVE “UP”, “DOWN”, “MOVE”  
    2-2-3 track[].sensing_feature[].x Int Y 필기 위치 x 좌표 0~756  
    2-2-4 track[].sensing_feature[].y Int Y 필기 위치 y 좌표 0~88  
    2-2-5 track[].sensing_feature[].pressure Int Y 필압    
    2-2-6 track[].sensing_feature[].velocity_magnitude Float Y 필기 속도    
    2-2-7 track[].sensing_feature[].acceleration_magnitude Float Y 필기 가속도    
    2-2-8 track[].sensing_feature[].ratio_minimum_maximum_speed_5-samples Float Y 연속된 5개의 샘플에 대한 최저 속도와 최대 속도의 비    
    2-2-9 track[].sensing_feature[].angle_consecutive_samples Float Y 연속된 3개 샘플이 이루는 각의 라디안 값    
    2-2-10 track[].sensing_feature[].sine_consecutive_samples Float Y 연속된 3개 샘플이 이루는 각의 라디안 값의 사인    
    2-2-11 track[].sensing_feature[].cosine_consecutive_samples Float Y 연속된 3개 샘플이 이루는 각의 라디안 값의 코사인    
    2-2-12 track[].sensing_feature[].log_curvature_radius Float Y 연속된 4개 샘플이 이루는 곡률 반경의 log 값    
    2-2-13 track[].sensing_feature[].difference[] Object Y 센서 데이터의 차분 값    
    2-2-13-1 track[].sensing_feature[].difference[].x Int Y 필기 위치의 x 좌표의 차분 값    
    2-2-13-2 track[].sensing_feature[].difference[].y Int Y 필기 위치의 y 좌표의 차분 값    
    2-2-13-3 track[].sensing_feature[].difference[].pressure Int Y 필압의 차분 값    
    2-2-13-4 track[].sensing_feature[].difference[].velocity_magnitude Int Y 필기 속도의 차분 값    
    2-2-13-5 track[].sensing_feature[].difference[].acceleration_magnitude Int Y 필기 가속도의 차분 값    
    2-2-13-6 track[].sensing_feature[].difference[].angle_consecutive_samples Int Y 연속된 3개 샘플이 이루는 각의 차분 값    
    2-2-14 track[].sensing_feature[].second_order_difference[] Object Y 센서 데이터의 2차 차분 값    
    2-2-14-1 track[].sensing_feature[].second_order_difference[].x Int Y 필기 위치의 x 좌표의 차분 값    
    2-2-14-2 track[].sensing_feature[].second_order_difference[].y Int Y 필기 위치의 y 좌표의 차분 값    
    2-2-15 track[].sensing_feature[].stroke_length_ratio[] Object Y 필기 샘플 연결선의 총 길이와 샘플링 시간의 비    
    2-2-15-1 track[].sensing_feature[].stroke_length_ratio[].3-samples Float Y 3개의 샘플 연결선의 총 길이와 3개 샘플링 시간의 비    
    2-2-15-2 track[].sensing_feature[].stroke_length_ratio[].5-samples Float Y 5개의 샘플 연결선의 총 길이와 5개 샘플링 시간의 비    
    2-2-15-3 track[].sensing_feature[].stroke_length_ratio[].7-samples Float Y 7개의 샘플 연결선의 총 길이와 7개 샘플링 시간의 비    
    2-2-15-4 track[].sensing_feature[].stroke_length_ratio[].12-samples Float Y 12개의 샘플 연결선의 총 길이와 12개 샘플링 시간의 비    
    3 enviroments[] Object Y 환경 정보    
      3-1 enviroments[].location String Y 영상 촬영 장소    
    3-2 enviroments[].resolution String Y 영상 촬영 시 카메라 해상도 “800x600”  
    3-3 enviroments[].weather String Y 영상 촬영 시 날씨    
    3-4 enviroments[].pen String Y 사용한 펜 종류 “M1P”, “N2”  
    4 person[] Object Y 작성자 정보    
      4-1 person[].id String Y 작성자 시리얼 넘버    
    4-2 person[].sex String Y 작성자 성별 “남”, “여”  
    4-3 person[].age_group String Y 작성자 나이대 “10”, “20”, “30”, “40”, “50”, “60  
    4-4 person[].posture String Y 작성자 자세 “DOWN”, “STAND”, “LEAN”  

     

    - 실제 예시

     

    {
        "image": [
            {
                "image_info": {
                    "file_name": "Frameimage(sent1)_221008_001917_A_0001_x_0642_y_0267_f_732_t_20221008_001552_000.png",
                    "date_captured": "20221008_001552_000",
                    "image_id": 1
                },
                "image_data": {
                    "data_type": "images",
                    "similarity": true,
                    "size": {
                        "depth": 3,
                        "width": 765,
                        "height": 88
                    }
                },
                "annotations": {
                    "id": 1,
                    "area": 37324,
                    "bndbox": {
                        "xmin": 46,
                        "ymin": 10,
                        "xmax": 648,
                        "ymax": 72
                    },
                    "entity_box": [
                        0.45359477124183006,
                        0.4659090909090909,
                        0.7869281045751634,
                        0.7045454545454546
                    ],
                    "property": {
                        "supercategory": "사람이 하늘처럼 맑아 보일 때가 있다",
                        "category_id": "1"
                    }
                }
            },
        "track": [
            {
                "timestamp": "20221008_001551_769",
                "sensing_feature": {
                    "time_interval": 0,
                    "action": "DOWN",
                    "x": 663,
                    "y": 235,
                    "pressure": 297,
                    "velocity_magnitude": 1414213562.3731072,
                    "acceleration_magnitude": 60073327528.710815,
                    "ratio_minimum_maximum_speed_5-samples": 0.0,
                    "angle_consecutive_samples": 0.0,
                    "sine_consecutive_samples": 0.0,
                    "cosine_consecutive_samples": 1.0,
                    "log_curvature_radius": 36.922231986179725,
                    "difference": {
                        "x": 0,
                        "y": 0,
                        "pressure": 0,
                        "velocity_magnitude": 0,
                        "acceleration_magnitude": 0,
                        "angle_consecutive_samples": 0
                    },
                    "second_order_difference": {
                        "x": 0,
                        "y": 0
                    },
                    "stroke_length_ratio": {
                        "3-samples": 0.0,
                        "5-samples": 0.0,
                        "7-samples": 0.0,
                        "12-samples": 0.0
                    }
                }
            },
        ],
        "environments": {
            "location": "37.47988359625346_126.88206221499277",
            "resolution": "800x600",
            "weather": "맑음",
            "pen": "M1P"
        },
        "person": {
            "id": "W1-0919-001-M",
            "sex": "남",
            "age_group": "60",
            "posture": "LEAN"
        }
    }

  • 데이터셋 구축 담당자

    수행기관(주관) : (주)에스엠시스템즈
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    한수연 02-6254-4776 makee71@gmail.com 데이터 설계, 정제, 저작도구 개발
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    뉴코리아전자통신(주) 데이터 획득(수집)
    (주)비젼인 데이터 가공, 검사, AI모델 개발
    호서대학교 산학협력단 크라우드 소싱 인력 관리
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    한수연 02-6254-4776 makee71@gmail.com
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기] [공용IRB 심의신청 가이드라인]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.