콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#자연어 # 시간 표현 탐지 # 챗봇 # 질의응답 #자연어

NEW 시간 표현 탐지 데이터

시간 표현 탐지 데이터 아이콘 이미지
  • 분야한국어
  • 유형 텍스트
구축년도 : 2022 갱신년월 : 2023-11 조회수 : 4,522 다운로드 : 164 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-11-03 데이터 최종 개방
    1.0 2023-07-31 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-08 산출물 전체 공개

    소개

    본 과제는 텍스트 자료에서 시간표현, 사건, 시간 관계를 탐지하는 인공지능 모델의 학습용 데이터 셋 구축을 목적으로 함.
     - 뉴스, 대화, 역사, 스포츠 등 시간 정보가 존재하는 문서에서 사건의 발생 시각을 탐지, AI가 자동으로 이에 관한 지식을 추출하여 지능형 질의응답 서비스 등을 가능하게 하는 학습데이터

    구축목적

    시간 표현 탐지 데이터를 구축하기 위한 세부 목적으로는 ① 다양한 성격의 텍스트, 즉 사회, 경제, 스포츠 등의 분야에 대한 뉴스 텍스트, 대화 세션 및 역사 문서 등을 수집하고, ② 이에 대한 정제·라벨링 체계를 설계함. ③ 품질관리를 통해 양질의 데이터 셋을 확보하는데 있음.
  • 데이터 구축 규모 

    총데이터 구축 수량은 41,111문서이며, 태깅된 EVENT, TIMEX3, TLINK의 총수량은 2,123,386개임

     

    데이터 종류  데이터 형태  총파일 수  EVENT 수량 TIMEX3 수량 TLINK 수량
    대화 대화 텍스트 22,032문서  1,297,078 328,309 497,999
    뉴스/역사  뉴스 및 역사 텍스트 19,079문서

     

    분야별 사건 태깅의 수량 분포 

     
    데이터 종류  수량 비율 
    뉴스/경제 279,578 22%
    뉴스/사회 441,626 34%
    대화 428,541 33%

     

    분야별 사회, 경제, 대화 및 역사 문서 수량 

     
    데이터 종류  수량 비율 
    대화 22,040 53.60%
    뉴스/경제 6,098 14.83%
    뉴스/사회 7,906 19.23%
    역사 5,078 12.35%

     

    대화 주제 분포 

    데이터 종류  수량 비율 
    기타 4,120 18.69%
    여행 4,135 18.76%
    연애 4,604 20.89%
    진로 4,337 19.68%

     

    시간 표현 분포 

     
    데이터 종류  Type 수량 비율 비고
    대화 DATE 85,769 26.12% 대화 - DATE
    DURATION 36,558 11.14% 대화 - DURATION
    SET 6,886 2.10% 대화 - SET
    TIME 19,987 6.09% 대화 - TIME
    뉴스/경제 DATE 44,977 13.70% 뉴스/경제 - DATE
    DURATION 9,554 2.91% 뉴스/경제 - DURATION
    SET 1,086 0.33% 뉴스/경제 - SET
    TIME 1,867 0.57% 뉴스/경제 - TIME
    뉴스/사회 DATE 59,472 18.11% 뉴스/사회 - DATE
    DURATION 14,802 4.51% 뉴스/사회 - DURATION
    SET 1,190 0.36% 뉴스/사회 - SET
    TIME 10,636 3.24% 뉴스/사회 - TIME
    역사 DATE 32,472 9.89% 역사 - DATE
    DURATION 2,706 0.82% 역사 - DURATION
    SET 167 0.05% 역사 - SET
    TIME 180 0.05% 역사 - TIME

     

    분야별 이벤트 표현분포

    데이터 종류  Type 수량 비율 비고
    대화 I_ACTION 31,777 2.45% 대화 - I_ACTION
    I_STATE 5,599 0.43% 대화 - I_STATE
    OCCURRENCE 386,519 29.80% 대화 - OCCURRENCE
    PERCEPTION 3,864 0.30% 대화 - PERCEPTION
    REPORTING 782 0.06% 대화 - REPORTING
    뉴스/경제 I_ACTION 17,439 1.34% 뉴스/경제 - I_ACTION
    I_STATE 2,686 0.21% 뉴스/경제 - I_STATE
    OCCURRENCE 254,181 19.60% 뉴스/경제 - OCCURRENCE
    PERCEPTION 510 0.04% 뉴스/경제 - PERCEPTION
    REPORTING 4,762 0.37% 뉴스/경제 - REPORTING
    뉴스/사회 I_ACTION 22,685 1.75% 뉴스/사회 - I_ACTION
    I_STATE 4,579 0.35% 뉴스/사회 - I_STATE
    OCCURRENCE 407,889 31.45% 뉴스/사회 - OCCURRENCE
    PERCEPTION 1,238 0.10% 뉴스/사회 - PERCEPTION
    REPORTING 5,235 0.40% 뉴스/사회 - REPORTING
    역사 I_ACTION 7,281 0.56% 역사 - I_ACTION
    I_STATE 1,327 0.10% 역사 - I_STATE
    OCCURRENCE 138,146 10.65% 역사 - OCCURRENCE
    PERCEPTION 177 0.01% 역사 - PERCEPTION
    REPORTING 402 0.03% 역사 - REPORTING

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드
     
    모델 학습 및 검증 조건
    개발 언어 Python 3.9.12
    프레임워크 CUDA 11.6, CuDNN 8.4.1, PyTorch 1.13.0
    학습 알고리즘 * KoBERT
    - 주어진 문장에 대하여 Masking, Next sentence prediction 등의 pre-training task를 적용하여 학습하는 BERT 모델이 제시되었는데, 이를 한국어 데이터로 pre-training한 모델
     
    * KoELECTRA
    - 동일한 컴퓨팅 파워로도 BERT에 비하여 높은 효율로 학습이 가능한 기법으로 제시된 ELECTRA를 한국어 데이터로 pre-training한 모델
    학습 조건 batch size: 64
    (initial) learning rate: 5e-5
    epochs: 40
    Adam epsilon: 1e-8
    early stop patience: 2
    파일 형식 • 학습 데이터셋: json
    • 평가 데이터셋: json
    전체 구축 데이터 대비 AI모델 사용 데이터 비율(수량)
    모델에 적용되는 비율 - timex3: 99.51% ( 346,834 / 348,547 )
      - event: 99.94% ( 1,375,180 / 1,375,986 )
      - tlink: 99.97% ( 526,727 / 526,879 )
    모델 학습 과정별 * Training Set 비율(수량)
    데이터 분류 및 비율 정보 - timex3: 80.02% ( 277,547 ) 
      - event: 80.27% ( 1,103,805 ) 
      - tlink: 79.88% ( 420,744 ) 
      * Validation Set
      - timex3: 10.04% ( 34831 ) 
      - event: 9.95% ( 136784 ) 
      - tlink: 10.15% ( 53450 ) 
      * Test Set
      - timex3: 9.94% ( 34456 ) 
      - event: 9.78% ( 134591 )
      - tlink: 9.97% ( 52533 ) 
    제한사항 • 해당 없음
  • 데이터 성능 점수

    측정값 (%)
    기준값 (%)

    데이터 성능 지표

    데이터 성능 지표
    번호 측정항목 AI TASK 학습모델 지표명 기준값 점수 측정값 점수
    1 시간 표현 탐지 정확성 (TIMEX3) Text Classification KoBERT, KoELECTRA F1-Score 0.8 0.8078
    2 시간 표현 탐지 정확성 (EVENT) Text Classification KoBERT, KoELECTRA F1-Score 0.8 0.828499999999999
    3 시간 표현 탐지 정확성 (TLINK) Text Classification KoBERT, KoELECTRA F1-Score 0.4 0.9711

    ※ 데이터 성능 지표가 여러 개일 경우 각 항목을 클릭하면 해당 지표의 값이 그래프에 표기됩니다.

    ※ AI모델 평가 지표에 따라 측정값의 범위, 판단 기준이 달라질 수 있습니다. (ex. 오류율의 경우, 낮을수록 좋은 성능을 내는 것으로 평가됩니다)

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    원문데이터 포맷 예시 

    제목 
    소아백혈병 CAR-T 치료제, 국내 최초로 병원 생산 나선다
    매체유형  경제지 
    매체명 매일경제신문
    카테고리 뉴스-경제
    기사크기  1,084자
    발행일  발행일 2021-12-09

     

    원문 
    서울대병원은 8일 '소아청소년 급성림프모구백혈병 대상 CAR-T 치료 임상연구'를 승인받았다. CAR-T 치료는 환자 혈액에서 얻은 면역세포(T세포)가 암을 잘 인식할 수 있도록 유전자 조작을 거친 뒤, 배양해 다시 환자의 몸속에 집어넣는 치료법이다. 면역세포가 암세포만을 정확하게 표적하면서도 체내 정상세포 손상을 최소화해 획기적인 최신 치료법으로 주목받고 있다.
    이번 승인은 임상연구계획을 제출한 지 약 8개월 만에 달성한 성과이다. 첨단재생바이오법이 시행되면서 서울대병원은 올해 4월 백혈병 환아를 위한 '병원 생산 CAR-T 치료' 임상연구계획을 제출했다. 보건복지부와 식품의약품안전처 심의 후에 12월 8일 국내 최초로 고위험 첨단재생의료 임상연구 승인을 받았다. 이에 따라 재발성·불응성 소아청소년 급성림프모구백혈병 환자를 대상으로 본격적인 임상 연구에 나설 예정이며 환자에게 한줄기 희망이 될 것으로 기대된다. 기존 해외 CAR-T 치료제는 비용이 회당 5억 원에 달해 환자 접근이 어려웠다. 서울대병원 임상연구가 공식적으로 승인됨에 따라 환자들은 병원에서 생산한 CAR-T 치료제를 무상으로 공급받을 수 있다. 비용 뿐만 아니라 속도 면에서도 우수하다. 기존 CAR-T 치료제는 환자의 T세포를 해외로 보내고, 증식해 다시 주입하기까지 평균 3주가 소요됐다. 이번 CAR-T는 병원에서 생산되기에 평균 12일로 획기적으로 단축된다. 시간을 다투는 급성림프모구백혈병 환아가 신속한 치료를 받을 수 있을 것으로 기대된다. 국내 병원이 자체적으로 CAR-T 치료제를 생산해 임상연구를 진행하는 것은 이번이 최초다. 기존에 없던 '1호' 연구로서 복지부와 식약처의 까다로운 평가를 거쳤으며, 연구의 연구실시역량, 안전성, 유효성 등을 인정받았다.
    해당 연구 책임자인 서울대병원 소아청소년과 강형진 교수는 "오랜 심의 끝에 연구계획을 승인받아 기쁘다. 국내 최초의 연구인 만큼 오랜 심의를 거쳤고, 그사이 치료를 받지 못한 환아들에 대한 아쉬움이 남는다"고 밝혔다. 또한 "이번 연구가 비용 부담으로 CAR-T 치료를 받지 못한 국내 소아청소년 백혈병 환아들에게 희망이 되기를 기대한다"고 말했다. 한편 해당 연구는 서울대병원 김효수 교수가 책임을 맡고 있는 서울대병원 연구중심병원 프로그램의 '바이오치료'육성 유니트에서 강형진 교수가 지난 4년간 준비한 연구이다. 서울대병원은 국내 연구자들이 개발한 CAR-T들이 환자들에게 쉽게 적용될 수 있도록 병원 자산을 활용해 GMP생산-전임상시험-임상시험까지 한꺼번에 진행할 수 있는 'CAR-T 개발 원스톱 시스템'을 준비 중이며 이번 소아백혈병 CAR-T 치료제를 넘어 여러 질환에서 CAR-T 치료제 개발을 위해 노력할 예정이다. [이병문 의료선임기자][ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

     

    전처리후
    □□□대병원은 8일 '소아청소년 급성림프모구백혈병 대상 CAR-T 치료 임상연구'를 승인받았다. CAR-T 치료는 환자 혈액에서 얻은 면역세포(T세포)가 암을 잘 인식할 수 있도록 유전자 조작을 거친 뒤, 배양해 다시 환자의 몸속에 집어넣는 치료법이다. 면역세포가 암세포만을 정확하게 표적하면서도 체내 정상세포 손상을 최소화해 획기적인 최신 치료법으로 주목받고 있다.

    이번 승인은 임상연구계획을 제출한 지 약 8개월 만에 달성한 성과이다. 첨단재생바이오법이 시행되면서 □□□병원은 올해 4월 백혈병 환아를 위한 '병원 생산 CAR-T 치료' 임상연구계획을 제출했다. □□□지부와 □□□□□□ 심의 후에 12월 8일 국내 최초로 고위험 첨단재생의료 임상연구 승인을 받았다. 이에 따라 재발성·불응성 소아청소년 급성림프모구백혈병 환자를 대상으로 본격적인 임상 연구에 나설 예정이며 환자에게 한줄기 희망이 될 것으로 기대된다. 기존 해외 CAR-T 치료제는 비용이 회당 5억 원에 달해 환자 접근이 어려웠다. □□□병원 임상연구가 공식적으로 승인됨에 따라 환자들은 병원에서 생산한 CAR-T 치료제를 무상으로 공급받을 수 있다. 비용 뿐만 아니라 속도 면에서도 우수하다. 기존 CAR-T 치료제는 환자의 T세포를 해외로 보내고, 증식해 다시 주입하기까지 평균 3주가 소요됐다. 이번 CAR-T는 병원에서 생산되기에 평균 12일로 획기적으로 단축된다. 시간을 다투는 급성림프모구백혈병 환아가 신속한 치료를 받을 수 있을 것으로 기대된다. 국내 병원이 자체적으로 CAR-T 치료제를 생산해 임상연구를 진행하는 것은 이번이 최초다. 기존에 없던 '1호' 연구로서 복지부와 식약처의 까다로운 평가를 거쳤으며, 연구의 연구실시역량, 안전성, 유효성 등을 인정받았다.
    해당 연구 책임자인 □□□병원 소아청소년과 □□□ 교수는 "오랜 심의 끝에 연구계획을 승인받아 기쁘다. 국내 최초의 연구인 만큼 오랜 심의를 거쳤고, 그사이 치료를 받지 못한 환아들에 대한 아쉬움이 남는다"고 밝혔다. 또한 "이번 연구가 비용 부담으로 CAR-T 치료를 받지 못한 국내 소아청소년 백혈병 환아들에게 희망이 되기를 기대한다"고 말했다. 한편 해당 연구는 □□□병원 □□□ 교수가 책임을 맡고 있는 서울대병원 연구중심병원 프로그램의 '바이오치료'육성 유니트에서 □□□ 교수가 지난 4년간 준비한 연구이다. □□□병원은 국내 연구자들이 개발한 CAR-T들이 환자들에게 쉽게 적용될 수 있도록 병원 자산을 활용해 GMP생산-전임상시험-임상시험까지 한꺼번에 진행할 수 있는 'CAR-T 개발 원스톱 시스템'을 준비 중이며 이번 소아백혈병 CAR-T 치료제를 넘어 여러 질환에서 CAR-T 치료제 개발을 위해 노력할 예정이다. [□□□ 의료선임기자][ⓒ □□경제 & mk.co.kr, 무단전재 및 재배포 금지]

     

     

    JSON 예시  
    {  "_id": {
        "$oid": "6351f1e5f38577e3d4863e03"
      },
      "sentences": [
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                46,
                50
              ],
              "id": "EVENT_S0_0",
              "subobj": "{\"S\":[0],\"O\":[7]}",
              "temp_s_id": 0,
              "text": "승인받았"
            }
          ],
          "sentence_id": "S0",
          "text": "서울대병원은 8일 '소아청소년 급성림프모구백혈병 대상 CAR-T 치료 임상연구'를 승인받았다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                7,
                9
              ],
              "hour": "",
              "id": "TIME_S0_0",
              "minute": "",
              "mod": [],
              "month": "",
              "second": "",
              "temp_s_id": 0,
              "text": "8일",
              "type": "DATE",
              "value": "2021-12-08",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                18,
                19
              ],
              "id": "EVENT_S1_0",
              "subobj": "{\"S\":[0,1],\"O\":[]}",
              "temp_s_id": 1,
              "text": "얻"
            },
            {
              "class": "PERCEPTION",
              "comment": "",
              "extent": [
                37,
                40
              ],
              "id": "EVENT_S1_1",
              "subobj": "{\"S\":[0,1],\"O\":[6]}",
              "temp_s_id": 1,
              "text": "인식할"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                55,
                57
              ],
              "id": "EVENT_S1_2",
              "subobj": "{\"S\":[0,1],\"O\":[12]}",
              "temp_s_id": 1,
              "text": "거친"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                61,
                64
              ],
              "id": "EVENT_S1_3",
              "subobj": "{\"S\":[0,1],\"O\":[]}",
              "temp_s_id": 1,
              "text": "배양해"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                76,
                79
              ],
              "id": "EVENT_S1_4",
              "subobj": "{\"S\":[0,1],\"O\":[]}",
              "temp_s_id": 1,
              "text": "집어넣"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                84,
                85
              ],
              "id": "EVENT_S1_5",
              "subobj": "{\"S\":[0,1],\"O\":[20]}",
              "temp_s_id": 1,
              "text": "이"
            }
          ],
          "sentence_id": "S1",
          "text": "CAR-T 치료는 환자 혈액에서 얻은 면역세포(T세포)가 암을 잘 인식할 수 있도록 유전자 조작을 거친 뒤, 배양해 다시 환자의 몸속에 집어넣는 치료법이다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                17,
                20
              ],
              "id": "EVENT_S2_0",
              "subobj": "{\"S\":[0],\"O\":[1]}",
              "temp_s_id": 2,
              "text": "표적하"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                36,
                40
              ],
              "id": "EVENT_S2_1",
              "subobj": "{\"S\":[],\"O\":[6]}",
              "temp_s_id": 2,
              "text": "최소화해"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                44,
                45
              ],
              "id": "EVENT_S2_2",
              "subobj": "{\"S\":[],\"O\":[8]}",
              "temp_s_id": 2,
              "text": "인"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                55,
                58
              ],
              "id": "EVENT_S2_3",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 2,
              "text": "주목받"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                60,
                61
              ],
              "id": "EVENT_S2_4",
              "subobj": "{\"S\":[],\"O\":[12]}",
              "temp_s_id": 2,
              "text": "있"
            }
          ],
          "sentence_id": "S2",
          "text": "면역세포가 암세포만을 정확하게 표적하면서도 체내 정상세포 손상을 최소화해 획기적인 최신 치료법으로 주목받고 있다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                15,
                18
              ],
              "id": "EVENT_S3_0",
              "subobj": "{\"S\":[1],\"O\":[2]}",
              "temp_s_id": 3,
              "text": "제출한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                30,
                33
              ],
              "id": "EVENT_S3_1",
              "subobj": "{\"S\":[1],\"O\":[]}",
              "temp_s_id": 3,
              "text": "달성한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                36,
                37
              ],
              "id": "EVENT_S3_2",
              "subobj": "{\"S\":[1],\"O\":[9]}",
              "temp_s_id": 3,
              "text": "이"
            }
          ],
          "sentence_id": "S3",
          "text": "이번 승인은 임상연구계획을 제출한 지 약 8개월 만에 달성한 성과이다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                23,
                26
              ],
              "hour": "",
              "id": "TIME_S3_0",
              "minute": "",
              "mod": [
                "APPROX"
              ],
              "month": "",
              "second": "",
              "temp_s_id": 3,
              "text": "8개월",
              "type": "DURATION",
              "value": "P8M",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                10,
                13
              ],
              "id": "EVENT_S4_0",
              "subobj": "{\"S\":[0],\"O\":[]}",
              "temp_s_id": 4,
              "text": "시행되"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                37,
                39
              ],
              "id": "EVENT_S4_1",
              "subobj": "{\"S\":[2],\"O\":[6]}",
              "temp_s_id": 4,
              "text": "위한"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                65,
                68
              ],
              "id": "EVENT_S4_2",
              "subobj": "{\"S\":[2],\"O\":[12]}",
              "temp_s_id": 4,
              "text": "제출했"
            }
          ],
          "sentence_id": "S4",
          "text": "첨단재생바이오법이 시행되면서 서울대병원은 올해 4월 백혈병 환아를 위한 '병원 생산 CAR-T 치료' 임상연구계획을 제출했다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                24,
                28
              ],
              "hour": "",
              "id": "TIME_S4_0",
              "minute": "",
              "mod": [],
              "month": "",
              "second": "",
              "temp_s_id": 4,
              "text": "해 4월",
              "type": "DATE",
              "value": "2021-04 f",
              "week": "",
              "weekday": "",
              "year": "0"
            }
          ]
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                56,
                57
              ],
              "id": "EVENT_S5_0",
              "subobj": "{\"S\":[],\"O\":[11]}",
              "temp_s_id": 5,
              "text": "받"
            }
          ],
          "sentence_id": "S5",
          "text": "보건복지부와 식품의약품안전처 심의 후에 12월 8일 국내 최초로 고위험 첨단재생의료 임상연구 승인을 받았다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                22,
                28
              ],
              "hour": "",
              "id": "TIME_S5_0",
              "minute": "",
              "mod": [],
              "month": "",
              "second": "",
              "temp_s_id": 5,
              "text": "12월 8일",
              "type": "DATE",
              "value": "2021-12-08",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                3,
                5
              ],
              "id": "EVENT_S6_0",
              "temp_s_id": 6,
              "text": "따라",
              "subobj": ""
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                42,
                43
              ],
              "id": "EVENT_S6_1",
              "subobj": "{\"S\":[],\"O\":[7]}",
              "temp_s_id": 6,
              "text": "인"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                51,
                53
              ],
              "id": "EVENT_S6_2",
              "temp_s_id": 6,
              "text": "나설",
              "subobj": ""
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                56,
                57
              ],
              "id": "EVENT_S6_3",
              "subobj": "{\"S\":[],\"O\":[11]}",
              "temp_s_id": 6,
              "text": "이"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                72,
                73
              ],
              "id": "EVENT_S6_4",
              "subobj": "{\"S\":[14],\"O\":[]}",
              "temp_s_id": 6,
              "text": "될"
            },
            {
              "class": "I_STATE",
              "comment": "",
              "extent": [
                78,
                81
              ],
              "id": "EVENT_S6_5",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 6,
              "text": "기대된"
            }
          ],
          "sentence_id": "S6",
          "text": "이에 따라 재발성·불응성 소아청소년 급성림프모구백혈병 환자를 대상으로 본격적인 임상 연구에 나설 예정이며 환자에게 한줄기 희망이 될 것으로 기대된다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                30,
                32
              ],
              "id": "EVENT_S7_0",
              "subobj": "{\"S\":[4],\"O\":[]}",
              "temp_s_id": 7,
              "text": "달해"
            },
            {
              "class": "I_STATE",
              "comment": "",
              "extent": [
                40,
                43
              ],
              "id": "EVENT_S7_1",
              "subobj": "{\"S\":[],\"O\":[10]}",
              "temp_s_id": 7,
              "text": "어려웠"
            }
          ],
          "sentence_id": "S7",
          "text": "기존 해외 CAR-T 치료제는 비용이 회당 5억 원에 달해 환자 접근이 어려웠다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                18,
                21
              ],
              "id": "EVENT_S8_0",
              "subobj": "{\"S\":[1],\"O\":[]}",
              "temp_s_id": 8,
              "text": "승인됨"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                23,
                25
              ],
              "id": "EVENT_S8_1",
              "subobj": "{\"S\":[1],\"O\":[]}",
              "temp_s_id": 8,
              "text": "따라"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                36,
                39
              ],
              "id": "EVENT_S8_2",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 8,
              "text": "생산한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                56,
                59
              ],
              "id": "EVENT_S8_3",
              "subobj": "{\"S\":[],\"O\":[9]}",
              "temp_s_id": 8,
              "text": "공급받"
            }
          ],
          "sentence_id": "S8",
          "text": "서울대병원 임상연구가 공식적으로 승인됨에 따라 환자들은 병원에서 생산한 CAR-T 치료제를 무상으로 공급받을 수 있다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                6,
                8
              ],
              "id": "EVENT_S9_0",
              "subobj": "{\"S\":[0,1],\"O\":[]}",
              "temp_s_id": 9,
              "text": "아니"
            }
          ],
          "sentence_id": "S9",
          "text": "비용 뿐만 아니라 속도 면에서도 우수하다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                27,
                29
              ],
              "id": "EVENT_S10_0",
              "subobj": "{\"S\":[2],\"O\":[4]}",
              "temp_s_id": 10,
              "text": "보내"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                32,
                35
              ],
              "id": "EVENT_S10_1",
              "subobj": "{\"S\":[2],\"O\":[4]}",
              "temp_s_id": 10,
              "text": "증식해"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                39,
                42
              ],
              "id": "EVENT_S10_2",
              "subobj": "{\"S\":[2],\"O\":[4]}",
              "temp_s_id": 10,
              "text": "주입하"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                53,
                56
              ],
              "id": "EVENT_S10_3",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 10,
              "text": "소요됐"
            }
          ],
          "sentence_id": "S10",
          "text": "기존 CAR-T 치료제는 환자의 T세포를 해외로 보내고, 증식해 다시 주입하기까지 평균 3주가 소요됐다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                49,
                51
              ],
              "hour": "",
              "id": "TIME_S10_0",
              "minute": "",
              "mod": [
                "APPROX"
              ],
              "month": "",
              "second": "",
              "temp_s_id": 10,
              "text": "3주",
              "type": "DURATION",
              "value": "P3W",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                15,
                18
              ],
              "id": "EVENT_S11_0",
              "subobj": "{\"S\":[1],\"O\":[]}",
              "temp_s_id": 11,
              "text": "생산되"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                35,
                38
              ],
              "id": "EVENT_S11_1",
              "subobj": "{\"S\":[1],\"O\":[]}",
              "temp_s_id": 11,
              "text": "단축된"
            }
          ],
          "sentence_id": "S11",
          "text": "이번 CAR-T는 병원에서 생산되기에 평균 12일로 획기적으로 단축된다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                24,
                27
              ],
              "hour": "",
              "id": "TIME_S11_0",
              "minute": "",
              "mod": [],
              "month": "",
              "second": "",
              "temp_s_id": 11,
              "text": "12일",
              "type": "DURATION",
              "value": "P12D",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                4,
                6
              ],
              "id": "EVENT_S12_0",
              "subobj": "{\"S\":[],\"O\":[0]}",
              "temp_s_id": 12,
              "text": "다투"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                30,
                31
              ],
              "id": "EVENT_S12_1",
              "subobj": "{\"S\":[],\"O\":[5]}",
              "temp_s_id": 12,
              "text": "받"
            },
            {
              "class": "I_STATE",
              "comment": "",
              "extent": [
                42,
                45
              ],
              "id": "EVENT_S12_2",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 12,
              "text": "기대된"
            }
          ],
          "sentence_id": "S12",
          "text": "시간을 다투는 급성림프모구백혈병 환아가 신속한 치료를 받을 수 있을 것으로 기대된다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                24,
                27
              ],
              "id": "EVENT_S13_0",
              "subobj": "{\"S\":[1],\"O\":[4]}",
              "temp_s_id": 13,
              "text": "생산해"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                34,
                37
              ],
              "id": "EVENT_S13_1",
              "subobj": "{\"S\":[1],\"O\":[6]}",
              "temp_s_id": 13,
              "text": "진행하"
            }
          ],
          "sentence_id": "S13",
          "text": "국내 병원이 자체적으로 CAR-T 치료제를 생산해 임상연구를 진행하는 것은 이번이 최초다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                36,
                38
              ],
              "id": "EVENT_S14_0",
              "subobj": "{\"S\":[],\"O\":[7]}",
              "temp_s_id": 14,
              "text": "거쳤"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                66,
                69
              ],
              "id": "EVENT_S14_1",
              "subobj": "{\"S\":[],\"O\":[12,13]}",
              "temp_s_id": 14,
              "text": "인정받"
            }
          ],
          "sentence_id": "S14",
          "text": "기존에 없던 '1호' 연구로서 복지부와 식약처의 까다로운 평가를 거쳤으며, 연구의 연구실시역량, 안전성, 유효성 등을 인정받았다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                9,
                10
              ],
              "id": "EVENT_S15_0",
              "temp_s_id": 15,
              "text": "인"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                48,
                51
              ],
              "id": "EVENT_S15_1",
              "subobj": "{\"S\":[6],\"O\":[10]}",
              "temp_s_id": 15,
              "text": "승인받"
            }
          ],
          "sentence_id": "S15",
          "text": "해당 연구 책임자인 서울대병원 소아청소년과 강형진 교수는 \"오랜 심의 끝에 연구계획을 승인받아 기쁘다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                9,
                10
              ],
              "id": "EVENT_S16_0",
              "subobj": "{\"S\":[],\"O\":[2]}",
              "temp_s_id": 16,
              "text": "인"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                21,
                23
              ],
              "id": "EVENT_S16_1",
              "subobj": "{\"S\":[],\"O\":[5]}",
              "temp_s_id": 16,
              "text": "거쳤"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                34,
                35
              ],
              "id": "EVENT_S16_2",
              "subobj": "{\"S\":[],\"O\":[8]}",
              "temp_s_id": 16,
              "text": "받"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                45,
                47
              ],
              "id": "EVENT_S16_3",
              "subobj": "{\"S\":[],\"O\":[]}",
              "temp_s_id": 16,
              "text": "대한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                53,
                54
              ],
              "id": "EVENT_S16_4",
              "subobj": "{\"S\":[13],\"O\":[]}",
              "temp_s_id": 16,
              "text": "남"
            }
          ],
          "sentence_id": "S16",
          "text": "국내 최초의 연구인 만큼 오랜 심의를 거쳤고, 그사이 치료를 받지 못한 환아들에 대한 아쉬움이 남는다",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                3,
                5
              ],
              "id": "EVENT_S17_0",
              "subobj": "{\"S\":[],\"O\":[0]}",
              "temp_s_id": 17,
              "text": "밝혔"
            }
          ],
          "sentence_id": "S17",
          "text": "\"고 밝혔다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                29,
                30
              ],
              "id": "EVENT_S18_0",
              "subobj": "{\"S\":[],\"O\":[6]}",
              "temp_s_id": 18,
              "text": "받"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                58,
                59
              ],
              "id": "EVENT_S18_1",
              "subobj": "{\"S\":[13],\"O\":[]}",
              "temp_s_id": 18,
              "text": "되"
            },
            {
              "class": "I_STATE",
              "comment": "",
              "extent": [
                62,
                65
              ],
              "id": "EVENT_S18_2",
              "subobj": "{\"S\":[13],\"O\":[14]}",
              "temp_s_id": 18,
              "text": "기대한"
            },
            {
              "class": "REPORTING",
              "comment": "",
              "extent": [
                69,
                71
              ],
              "id": "EVENT_S18_3",
              "subobj": "{\"S\":[],\"O\":[15]}",
              "temp_s_id": 18,
              "text": "말했"
            }
          ],
          "sentence_id": "S18",
          "text": "또한 \"이번 연구가 비용 부담으로 CAR-T 치료를 받지 못한 국내 소아청소년 백혈병 환아들에게 희망이 되기를 기대한다\"고 말했다.",
          "timex3": []
        },
        {
          "event": [
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                29,
                30
              ],
              "id": "EVENT_S19_0",
              "subobj": "{\"S\":[4,5],\"O\":[6]}",
              "temp_s_id": 19,
              "text": "맡"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                85,
                88
              ],
              "id": "EVENT_S19_1",
              "subobj": "{\"S\":[14,15],\"O\":[]}",
              "temp_s_id": 19,
              "text": "준비한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                91,
                92
              ],
              "id": "EVENT_S19_2",
              "subobj": "{\"S\":[],\"O\":[19]}",
              "temp_s_id": 19,
              "text": "이"
            }
          ],
          "sentence_id": "S19",
          "text": "한편, 해당 연구는 서울대병원 김효수 교수가 책임을 맡고 있는 서울대병원 연구중심병원 프로그램의 '바이오치료'육성 유니트에서 강형진 교수가 지난 4년간 준비한 연구이다.",
          "timex3": [
            {
              "calendar": "GREGORIAN",
              "comment": "",
              "day": "",
              "extent": [
                81,
                83
              ],
              "hour": "",
              "id": "TIME_S19_0",
              "minute": "",
              "mod": [],
              "month": "",
              "second": "",
              "temp_s_id": 19,
              "text": "4년",
              "type": "DURATION",
              "value": "P4Y",
              "week": "",
              "weekday": "",
              "year": ""
            }
          ]
        },
        {
          "event": [
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                16,
                19
              ],
              "id": "EVENT_S20_0",
              "subobj": "{\"S\":[2],\"O\":[]}",
              "temp_s_id": 20,
              "text": "개발한"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                37,
                40
              ],
              "id": "EVENT_S20_1",
              "subobj": "{\"S\":[4],\"O\":[]}",
              "temp_s_id": 20,
              "text": "적용될"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                54,
                57
              ],
              "id": "EVENT_S20_2",
              "subobj": "{\"S\":[2],\"O\":[11]}",
              "temp_s_id": 20,
              "text": "활용해"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                82,
                85
              ],
              "id": "EVENT_S20_3",
              "subobj": "{\"S\":[2],\"O\":[13]}",
              "temp_s_id": 20,
              "text": "진행할"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                115,
                116
              ],
              "id": "EVENT_S20_4",
              "subobj": "{\"S\":[],\"O\":[23]}",
              "temp_s_id": 20,
              "text": "이"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                138,
                139
              ],
              "id": "EVENT_S20_5",
              "subobj": "{\"S\":[],\"O\":[27]}",
              "temp_s_id": 20,
              "text": "넘"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                163,
                165
              ],
              "id": "EVENT_S20_6",
              "subobj": "{\"S\":[],\"O\":[33]}",
              "temp_s_id": 20,
              "text": "위해"
            },
            {
              "class": "I_ACTION",
              "comment": "",
              "extent": [
                166,
                169
              ],
              "id": "EVENT_S20_7",
              "subobj": "{\"S\":[],\"O\":[33]}",
              "temp_s_id": 20,
              "text": "노력할"
            },
            {
              "class": "OCCURRENCE",
              "comment": "",
              "extent": [
                172,
                173
              ],
              "id": "EVENT_S20_8",
              "subobj": "{\"S\":[],\"O\":[36]}",
              "temp_s_id": 20,
              "text": "이"
            }
          ],
          "sentence_id": "S20",
          "text": "서울대병원은 국내 연구자들이 개발한 CAR-T들이 환자들에게 쉽게 적용될 수 있도록 병원 자산을 활용해 GMP생산-전임상시험-임상시험까지 한꺼번에 진행할 수 있는 'CAR-T 개발 원스톱 시스템'을 준비 중이며 이번 소아백혈병 CAR-T 치료제를 넘어 여러 질환에서 CAR-T 치료제 개발을 위해 노력할 예정이다.",
          "timex3": []
        },
        {
          "event": [],
          "sentence_id": "S21",
          "text": "[이병문 의료선임기자][ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지",
          "timex3": []
        }
      ],
      "tlink": [
        {
          "arg1": "TIME_S0_0",
          "arg2": "EVENT_S0_0",
          "comment": "",
          "id": "TLINK_0",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S3_0",
          "arg2": "EVENT_S3_1",
          "comment": "",
          "id": "TLINK_1",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S3_0",
          "arg2": "EVENT_S3_2",
          "comment": "",
          "id": "TLINK_2",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S4_0",
          "arg2": "EVENT_S4_1",
          "comment": "",
          "id": "TLINK_3",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S4_0",
          "arg2": "EVENT_S4_2",
          "comment": "",
          "id": "TLINK_4",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S5_0",
          "arg2": "EVENT_S5_0",
          "comment": "",
          "id": "TLINK_5",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S5_0",
          "arg2": "EVENT_S8_3",
          "comment": "",
          "id": "TLINK_6",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S10_0",
          "arg2": "EVENT_S10_3",
          "comment": "",
          "id": "TLINK_7",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S11_0",
          "arg2": "EVENT_S11_1",
          "comment": "",
          "id": "TLINK_8",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S19_0",
          "arg2": "EVENT_S19_1",
          "comment": "",
          "id": "TLINK_11",
          "relType": "INCLUDES"
        },
        {
          "arg1": "TIME_S19_0",
          "arg2": "EVENT_S19_2",
          "comment": "",
          "id": "TLINK_12",
          "relType": "INCLUDES"
        }
      ],
      "meta_info": {
        "Assignment": {
          "AnnotationDate": [
            {
              "$date": "2022-09-16T10:23:17.536Z"
            }
          ],
          "AnnotatorName": [
            "USER_0039"
          ],
          "SupervisionDate": [
            {
              "$date": "2022-12-23T17:13:42.131Z"
            },
            {
              "$date": "2022-09-01T05:12:05.977Z"
            }
          ],
          "SupervisorName": [
            "SUP_061",
            "FS_SUP_002"
          ],
          "filename": "2021-12-09 00:00:00_소아백혈병 CAR-",
          "src_path": "/뉴스/경제"
        },
        "Dataset.category": 4,
        "Dataset.identifier": "TEXT_InformationExtraction_NLP_36",
        "Dataset.label_path": "/뉴스/경제",
        "Dataset.name": "시간 표현 탐지 데이터",
        "Dataset.src_path": "/뉴스/경제",
        "Dataset.type": 0,
        "info.authors": [
          "이병문"
     ],

    "info.category": "뉴스_경제",
        "info.date_collected": "2022-08-24",
        "info.date_created": "2021-12-09 00:00:00",
        "info.filename": "2021-12-09 00:00:00_소아백혈병 CAR-",
        "info.medianame": "MBN",
        "info.mediatype": "뉴스",
        "info.subcategory": [],
        "info.title": "소아백혈병 CAR-T 치료제, 국내 최초로 병원 생산 나선다",
        "isPassFail_lastTime": "2022-12-25T21:22:53.972Z",
        "isSubmitByAnnotator": true,
        "isSubmitByAnnotator_firstTime": "2022-09-30T00:00:00.000Z",
        "isSubmitByAnnotator_lastTime": "2022-09-30T00:00:00.000Z",
        "isPassFail": "Pass",
        "isPassFail_firstTime": "2022-12-25T21:22:53.972Z"
      },
      "firstModified": {
        "$date": "2022-12-25T12:03:35.784Z"
      },
      "lastModified": {
        "$date": "2022-12-25T12:22:54.014Z"
      }
    }
       

    데이터 구성 
     

    key Description Type  필수여부 유효값 
    id DB에서 데이터의 고유 아이디 object Y  
    $oid   string Y  
    uterrance 대화 데이터의 경우에는 "uterrances" 속성이고, 뉴스/역사 데이터의 경우에는 "sentences" 속성으로 존재함 array Y  
    {}   object N  
    event   array Y  
    {}   object N  
    class extent에 event의 범위가 지정되어 있을 경우 필수 값임 string N "OCCURRENCE", 'REPORTING", "PERCEPTION", "I_ACTION", "I_STATE"
    comment   string N  
    extent 최소값은 0부터 시작이나 최대값은 별도로 설정하지 않음 array N  
    $value$   number N  
    id   string N  
    subobj 어절의 위치가 주어인 경우 S, 목적어인 경우 O에 표기됨 string N  
    temp_s_id 태그가 포함된 문장번호에 대한 역참조 number N  
    text extent에 event의 범위가 지정되어 있을 경우 필수 값임 string N  
    extent_word   array N  
    $value$   number N  
    sentence_id   string N  
    text 문장 단위 데이터 string N  
    timex3   array Y  
    {}   object N  
    calendar "GREGORIAN", "LUNAR" string N "GREGORIAN", "LUNAR"
    comment   string N  
    day   string N  
    extent 최소값은 0부터 시작이나 최대값은 별도로 설정하지 않음, extent에 timex3의 범위가 지정되어 있을 경우 text, type, value는 필수 값으로 지정됨 array N  
    $value$   number N  
    hour   string N  
    id   string N  
    minute   string N  
    mod   array N  
    $value$   string N "START", "MID", "END", "APPROX", "RECENT", "PRESENT", "FUTURE", "PAST", "MORE", "LESS", "EQUAL", "LEAP", "REST", "NORMAL" 
    month   string N  
    second   string N  
    temp_s_id   number N  
    text extent에 timex3의 범위가 지정되어 있을 경우 필수 값임 string N  
    type extent에 timex3의 범위가 지정되어 있을 경우 필수 값임 string N "DATE", "TIME", "DURATION", "SET"
    value extent에 timex3의 범위가 지정되어 있을 경우 필수 값임 string N  
    week   string N  
    weekday   string N  
    year   string N  
    extent_word   array N  
    $value$   number N  
    tlink   array Y  
    {}   object N  
    arg1 event 그리고 timex3의 extent가 지정되어 있을 경우 arg1은 필수 값임 string N  
    arg2 event 그리고 timex3의 extent가 지정되어 있을 경우 arg1은 필수 값임 string N  
    comment   string N  
    id   string N  
    relType arg1과 arg2의 항목이 지정되어 있을경우 relType은 필수 값임 string N "INCLUDE", "BEFORE", "AFTER", "BEGINS"
    meta_info   object Y  
    Assignment   object N  
    AnnotationDate   array N  
    {}   object N  
    $date   string N  
    AnnotationDate_2nd   array N  
    {}   object N  
    $date   string N  
    AnnotatorName   array N  
    $value$   string N  
    AnnotatorName_2nd   array N  
    $value$   string N  
    SupervisionDate   array N  
    SupervisorName   array N  
    filename   string N  
    src_path   string N  
    Dataset.category   number Y  
    Dataset.identifier   string Y  
    Dataset.label_path   string Y  
    Dataset.name   string Y  
    Dataset.src_path   string Y  
    Dataset.type   number Y  
    info.authors   array N  
    $value$   string N  
    info.category   string N  
    info.date_collected   string N  
    info.date_created   string N  
    info.filename   string N  
    info.medianame   string N  
    info.mediatype   string N  
    info.subcategory   array N  
    info.title   string N  
    isSubmitByAnnotator   boolean N  
    isSubmitByAnnotator_firstTime   string N  
    isSubmitByAnnotator_lastTime   string N  
    isSubmitByAnnotator_2nd   boolean N  
    isSubmitByAnnotator_firstTime_2nd   string N  
    isSubmitByAnnotator_lastTime_2nd   string N  
    firstModified   object N  
    $date   string N  
    lastModified   object N  
    $date   string N
     

     

    어노테이션 포맷

     

    구분 속성명 타입 필수여부 설명 비고
    1 사건 object   문장에서 표현되는 사건(EVENT) 정보 - 동사의 경우 어간과 선어말 어미까지 태깅함
    (EVENT) - 긍정 지정사와 부정 지정사 태깅함
      - 동사 파생 접미사가 쓰인 경우 태깅 대상임
      글자 단위 태깅과 어절 단위 태깅을 모두 제공
      주어, 목적어 태깅 
    1-1 reporting string N 특정 내용을 전달하거나 알리는 행위 - class 선택 유/무
    사건(EVENT)의 extent가 지정되어 있을 경우 선택 지정 
    1-2 perception string N 특정 내용을 알게 되거나 인식함 - class 선택 유/무
    사건(EVENT)의 extent가 지정되어 있을 경우 선택 지정 
    1-3 occurrence string N 임의 사건 발생  - class 선택 유/무
    사건(EVENT)의 extent가 지정되어 있을 경우 선택 지정 
    1-4 I_action string N - 특정 사건(대부분 occurrence에 해당)을 의도하여, 임의의 보여지는 행동을 취함 - class 선택 유/무
    - 특정 EVENT 앞에 Intention을 가진 또 다른 EVENT가 등장할 경우에만 선택함  사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    1-5 I_state string N - 특정 사건(대부분 occurrence에 해당)을 의도하여, 직접적으로 보여지지 않는 행동을 취함 - class 선택 유/무
    - 기본적인 특성은 I_ACTION과 유사하나, 직접적으로 눈에 보여지지 않는 행동에 대한 것만 해당함 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    1-6 주어(S) 및 목적어(O) string N 주어, 목적어에 해당하는 어절 선택 - class 선택 유/무
    Json 파일에서 어절의 순서로 선택됨(subobj": "{\"S\":[],\"O\":[7]})
    1-7 comment string N 기타 정보 기입  
    1-8 시간표현 object   문장에서 표현되는 시간(TIMEX3) 정보  
    (TIMEX3)
    1-9 date string N 시간표현(TIMEX3)이 날짜인 경우 선택  - type 선택 유/무
    시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    1-10 time string N 시간표현(TIMEX3)이 시간(time)인 경우 선택  - type 선택 유/무
    시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    1-11 duration string N 시간표현(TIMEX3)이 “~동안”인 경우 선택  - type 선택 유/무
    시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    1-12 set string N 시간표현(TIMEX3)이 “~마다”인 경우 선택  - type 선택 유/무
    시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    1-13 text string N 텍스트 상에서 시간 표현에 대한 태그 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정
    extent  pair of numbers N 텍스트 상에서 시간 표현에 대한 태깅 범위 - (시작offset, 끝offset)
    1-14 value string N ISO-8601 규칙에 따르되, 다양한 시간 표현 정규값을 포함 할 수 있도록 추가 규칙 설계  
    calendar string N GREGORIAN 또는 LUNAR   
    1-15 year  string N 상대적 시간 표현중 ‘연도’(year)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    month string N 상대적 시간 표현 중 ‘달’(month)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    1-16 day string N 상대적 시간 표현 중 ‘일’(day)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    week string N 상대적 시간 표현 중 ‘주’(week)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    1-17 hour string N 상대적 시간 표현 중 ‘시’(hour)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    minute string N 상대적 시간 표현 중 ‘분’(minute)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    1-18 second string N 상대적 시간 표현 중 ‘초’(second)에 대한 정보  +N, -N, 0, ~N 등으로 표기
    week_day number N 요일 정보 일요일 ~ 토요일
    m 2-17 START string N 초반, 시작하는 시기  
    o 2-18 MID string N 중반, 한창인 시기  
    d 2-19 END string N 후반, 끝나는 시기  
      2-20 APPROX string N 대략적인 시산  
      2-21 RECENT string N 최근   
      2-22 PRESENT string N 현재  
      2-23 FUTURE string N 미래  
      2-24 PAST string N 과거  
      2-25 MORE string N 3시간 초과  
      2-26 LESS string N 3시간 미만  
      2-27 EQUAL string N 동일한 시간  
      2-28 LEAP string N 윤년, 윤달 등  
      2-29 REST string N 휴일, 공휴일 등  
      2-30 NORMAL string N 평년, 평일, 주중 등  
    2-29 comment string N 기타 정보 기입(예: 한국 고유의 시간 표현 여부 등)  
    3 사건-시간 관계 object   문장에서 표현되는 시간(TIMEX3) 과 사건(EVENT) 정보에 대한 link  
    (TLINK)
    r 3-1 include string N arg1(TIMEX3)에 arg2(EVENT)이 발생한 경우 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    e
    T 3-2 before string N arg1(EVENT)가 arg2(TIMEX3) 이전에 발생한 경우 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    y after string N arg1(EVENT)가 arg2(TIMEX3) 이후에 발생한 경우 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    p 3-3 begins string N arg1(EVENT)가 arg2(TIMEX3) 시점부터 시작된 경우 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    e ends string N arg1(EVENT)가 arg2(TIMEX3) 시점에 종료된 경우 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    3-6 arg1 string N 시간관계의 첫 번째 대상의 ID 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
    3-7 arg2 string N 시간관계의 두 번째 대상의 ID 사건(EVENT) 및 시간(TIMEX3)의 extent가 지정되어 있을 경우 선택 지정 
  • 데이터셋 구축 담당자

    수행기관(주관) : 주식회사 에프에스
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김우진 042-471-5215 woojin.kim@fscom.kr 인공지능 연구개발
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    충북대학교 산학협력단 인공지능 모델 구축
    한국통계정보원 데이터 품질검증 및 전문가 자문위 운영
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김우진 주식회사 에프에스 woojin.kim@fscom.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.