콘텐츠로 건너뛰기 메뉴로 건너뛰기 푸터로 건너뛰기
데이터를 불러오고 있습니다
데이터를 저장하고 있습니다
#음성

NEW 극한 소음 환경 소리 데이터

극한 소음 환경 소리 데이터 아이콘 이미지
  • 분야한국어
  • 유형 오디오
구축년도 : 2022 갱신년월 : 2023-07 조회수 : 4,610 다운로드 : 169 용량 :
샘플 데이터 ?

샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며,
데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되어 있을 수 있습니다.

※ 내국인만 데이터 신청이 가능합니다.

  • 데이터 변경이력

    데이터 변경이력
    버전 일자 변경내용 비고
    1.1 2023-12-01 데이터 최종 개방
    1.1 2023-07-27 원천데이터 및 라벨링데이터 수정
    1.0 2023-05-04 데이터 개방(Beta Version)

    데이터 히스토리

    데이터 히스토리
    일자 변경내용 비고
    2023-12-27 산출물 전체 공개
    2023-09-05 데이터통계 수정

    소개

    극한 소음환경의 특정 소리 구분을 위해 극한 소음환경에서 녹음 된 소리데이터를 수집/정제/가공하여 인공지능(AI) 학습용 데이터셋 구축

    구축목적

    일상생활에서 소리를 잘 듣지 못하는 분들의 비상대처 알림 등을 위해, 소음을 제거하고 특정 소리를 전달하기 위한 인공지능 개발을 목적으로 함
  • ㅇ 데이터 구축 규모 
     - 극한 소음 환경 클래스 분류

    소음분류 소분류 세부내용 (예시)
    1.교통수단 지상운송수단 자동차 경기장, 고속도로(졸음쉼터), 터널, 대형트럭
    철로운송수단 열차가 통과하는 선로, 육교근처소음, 플랫폼 기차 통과 소리, 철길 건널목
    항공운송수단 항공기, 경비행기, 헬리콥터 이착륙 소음, 내부소음
    수상운송수단 수상택시, 모터 보트소음
    2.공사장 경장비소음 공사장의 기계음 소리들(그라인더, 기계톱, 절단기, 전동해머드릴)
    중장비소음 공사장의 중장비 소리들(굴삭기, 착암기, 천공기, 항타기(충격음발생기계))
    3.공장 공장기계음 공장 기계에서 발생하는 소리(제철소, 자동차공장, 방직공장, 목재소, (전기톱, 프레스 등))
    4.시설류 실내시설 게임장(오락실), 공연장(오케스트라, 국악, 콘서트), 실내 서핑장, 실내 사격장, 실내 경기장
    실외시설 실외 경기장(야구, 축구, 경마, 경륜 등), 폐차장, 놀이시설, 행사장 등
    5.기타 실내기타소음 기계실(서버실 등), 펌프실, 공조시설, 자동차 검사소 등
    실외기타소음 여름철 매미소리, 산업용 진공 기계 소리, 싸이렌 소리, 농기계 (예초기, 트랙터, 경운기), 무선 모형 엔진 소리, 드론, 천연폭포, 빗소리 등
    6.복합소음 2가지이상소음 공장소리+빗소리, 자동차 소리+싸이렌 소리 등


     - 구축 규모

    소음 환경 구축 시간
    1. 교통수단 265.5
    2. 공사장 222.2
    3. 공장 266.2
    4. 시설류 158
    5. 기타 74.5
    6. 복합소음 67
    합 계 1,053.20


    ㅇ 데이터 분포
     - 극한 소음 환경 분포

    소음 환경 시간 구성비
    1. 교통수단 265.5 25.20%
    2. 공사장 222.2 21.10%
    3. 공장 266.2 25.30%
    4. 시설류 158 15.00%
    5. 기타 74.5 7.10%
    6. 복합소음 67 6.40%


     - 소리 분포

    소리 분류 시간 구성비
    1. 사람의 비언어적 소리 406.7 38.60%
    2. 동물 및 자연물 소리 83.6 7.90%
    3. 전자제품 및 생활환경 소리 524.2 49.80%
    4. 기타 38.7 3.70%


     - 소음원 거리 분포

    거리 건(수) 구성비
    근거리 96,551.00 93.70%
    원거리 6,443.00 6.30%


     - 녹음 환경 분포

    녹음 환경 건(수) 구성비
    스튜디오 12,941.00 12.60%
    현장 90,053.00 87.40%

     

     

  • 저작도구 설명서 및 저작도구 다운로드

    저작도구 설명서 다운로드 저작도구 다운로드
  • AI 모델 상세 설명서 다운로드

    AI 모델 상세 설명서 다운로드 AI 모델 다운로드

    ㅇ 학습모델
     - ESResNet : 환경 소리 분류 모델로 STFT(Short-Time Fourier Transform) 스펙트로그램을 이용하여 Resnet, Siamese-like networks, Attention과 결합구조의 모델이며, 공개 데이터 셋에서 97.0%(ESC10), 91.5%(ESC-50), 84.2%/85.4%(US8K 모노/스테레오)의 정확도를 달성한 모델
     - STFT(Short-Time Fourier Transform)는 소리 데이터에서 시간에 대해 구간을 짧게 나누어 나누어진 여러 구간의 데이터를 각각 푸리에 변환하는 방법으로 노이즈 감소, 피치 감지, 피치 이동 등의 효과의 음성 응용 분야에서 많이 사용되는 기본이자 필수인 신호처리 기법임

     

    ㅇ 데이터 셋 분할

    구분 학습(Training) 검증(Validation) 테스트(Test)
    소음+소리데이터 80% 10% 10% 100%
    소리 데이터

     

    ㅇ 활용서비스
     - 소음 환경에서 발생하는 다양한 소리 정보를 획득하여, 그 정보를 추출/정제/DB화 함으로서 시각적 정보제공, 기계의 자동 작동 중지 등 긴급 조치, 재난 알림 등의 다양한 분양에 적용 가능함
     - 예시 
      · 소음 환경인 공장, 공사장 등에서 발생하는 화재 경고음, 기계 경고음, 재난 경보음 발생 시, 소음 환경 내 작업자는 이를 신속하게 인지하여 어려움으로 소리를 인식하여 시각적 경보 전환 및 기계, 장비의 자동 작동 차단 등의 서비스 적용
      · 추가적인 학습을 위해서는 소음과 라벨링 쌍으로 이루어진 데이터 셋을 구축하여 응용 서비스에 특화된 소리를 따로 훈련할 수 있음

  • 설명서 및 활용가이드 다운로드

    데이터 설명서 다운로드 구축활용가이드 다운로드

    ㅇ 데이터 소개
     - 일상생활에서 소리를 잘 듣지 못하는 분들의 비상대처 알림 등을 위하여 극한 소음환경의 특정소리 구분을 위한 소리 데이터 구축
     - 인식 성능개선을 위해 다양한 극한 소음환경(예 : 비행기 소리, 공장, 자동차 경주장, 공연장 등)에서 소리데이터(사람의 기침소리(콜록), 고양이가 내는 소리(야옹), 개가 내는 소리(멍멍), 비오는 소리, 전화벨 소리 등) 구축

     

    현장 소음 사진을 네트워크에 전송하여 정제/가공 작업을 거친다는 내용의 도식


    ㅇ 데이터셋 구성

    파일 종류 파일 설명 비고
    *_SN.wav 소리가 크고 소음이 작은 파일 원천데이터
    *_NS.wav 소음이 크고 소리가 작은 파일
    *.json 속성(메타)정보 파일 라벨링데이터

     

    ㅇ 어노테이션 포맷
     - 소리위주의 녹음파일, 소리+극한 소음의 녹음파일 모두 아래와 같은 어노테이션 포맷을 생성하며 메타항목은 전부 필수임

    No 항목 설명 필수여부 타입
    0 dataSet 데이터셋 Y String
    1 version 데이터셋 버전 Y String
    2 mediaUrl 녹취된 음원의 URL Y String
    3 date 녹취된 날짜 Y String
    4 noiseInfo 소음원데이터 상세 정보 Y Array
      4-1 category 소음원 카테고리 정보(교통수단,공사장,공장,시설류 등) Y String
      4-2 subCategory 소음원 서브카테고리(지상운송,철로운송,항공운송 등) Y String
      4-3 noisePlace 소음원 획득 장소(녹취 세부 내용) Y String
      4-4 bgnoisespl 구간내 소음원 최대 dB Y String
      4-5 distance 소음발생원과의 평균거리(근거리/원거리) Y String
    4-6 noiseDevice 녹취장비(4ch Tascam DR-40x/스마트폰) Y String
    4-7 noiseLen 소음 시간(sec) Y Number
    5 soundInfo 소리데이터 상세정보 Y Array
      5-1 sdCategory 소리 카테고리정보(대분류) Y String
      5-2 sdsubCategory 소리 서브카테고리(세부분류) Y String
      5-3 sdComment 소리 상세내용 Y String
    5-4 sdPlace 소리 녹취장소(현장/스튜디오) Y String
    5-5 sdStartTime 소리 시작 시간(sec) Y Number
      5-6 sdEndTime 소리 종료 시간(sec) Y Number
    5-7 sdLen 소리 시간(sec) Y Number
    5-8 sdDevice 소리 녹취장비(녹음장치/스마트폰) Y String
    6 AudioResolution 오디오 레졸류션 Y Array
      6-1 BitDepth 비트뎁스(16bit) Y Number
      6-2 SampleRate  샘플레이트(44.1kHz) Y Number
    7 RecStime 녹취시작시간(01~24) Y String

     

    ㅇ 라벨링데이터 실제 예시

    {
      "dataSet":"극한환경소리",
      "version":"1.0",
      "mediaUrl":"02.공사장/03.전자제품및생활환경소리/02_03_701_220826_0001_SN.wav",
      "date":"20220826",
      "noiseInfo":{
        "category":"공사장",
        "subCategory":"중장비소음",
        "noisePlace":"역삼동 공사",
        "bgnoisespl":"95.4",
        "distance":"근거리",
        "noiseDevice":"4ch Tascam DR-40X",
        "noiseLen":66
      },
      "soundInfo":{
        "sdCategory":"전자제품및생활환경소리",
        "sdsubCategory":"전자제품",
        "sdComment":"그라인더자르는소리",
        "sdPlace":"현장",
        "sdStartTime":3,
        "sdEndTime":63,
        "sdLen":60,
        "sdDevice":"녹음장치"
      },
      "audioResolution":{
        "bitDepth":16,
        "sampleRate":44.1
      },
      "recStime":"17"
    }

     

     

  • 데이터셋 구축 담당자

    수행기관(주관) : ㈜코테크시스템
    수행기관(주관)
    책임자명 전화번호 대표이메일 담당업무
    김연봉 02-2253-7355 batnaic@kotech.co.kr 품질책임자
    수행기관(참여)
    수행기관(참여)
    기관명 담당업무
    ㈜단솔플러스 기술자문
    ㈜인사이트정보 데이터 수집, 검수
    ㈜코리아퍼스텍 데이터 정제, 가공, 검수
    데이터 관련 문의처
    데이터 관련 문의처
    담당자명 전화번호 이메일
    김연봉 02-2253-7355 batnaic@kotech.co.kr
보건의료 데이터 개방 안내

보건의료 데이터는 온라인 및 오프라인 안심존을 통해 개방됩니다.

안심존이란 안심존 이용메뉴얼 안심존 이용신청
  • 인터넷과 물리적으로 분리된 온라인·오프라인 공간으로 의료 데이터를 포함하여 보안 조치가 요구되는 데이터를 다운로드 없이 접근하고 분석 가능
    * 온라인 안심존 : 보안이 보장된 온라인 네트워크를 통해 집, 연구실, 사무실 등 어디서나 접속하여 데이터에 접근하고 분석
    * 오프라인 안심존 : 추가적인 보안이 필요한 데이터를 대상으로 지정된 물리적 공간에서만 접속하여 데이터에 접근하고 분석

    1. AI 허브 접속
      신청자
    2. 안심존
      사용신청
      신청자신청서류 제출*
    3. 심사구축기관
    4. 승인구축기관
    5. 데이터 분석 활용신청자
    6. 분석모델반출신청자
  • 1. 기관생명윤리위원회(IRB) 심의 결과 통지서 [IRB 알아보기]
    2. 기관생명윤리위원회(IRB) 승인된 연구계획서
    3. 신청자 소속 증빙 서류 (재직증명서, 재학증명서, 근로계약서 등 택1)
    4. 안심존 이용 신청서 [다운로드]
    5. 보안서약서 [다운로드]
    ※ 상기 신청서 및 첨부 서류를 완비한 후 신청을 진행하셔야 정상적으로 절차가 이루어집니다.

  • 신청 및 이용관련 문의는 safezone1@aihub.kr 또는 02-525-7708, 7709로 문의

데이터셋 다운로드 승인이 완료 된 후 API 다운로드 서비스를 이용하실 수 있습니다.

API 다운로드 파일은 분할 압축되어 다운로드 됩니다. 분할 압축 해제를 위해서는 분할 압축 파일들의 병합이 필요하며 리눅스 명령어 사용이 필요합니다.

리눅스 OS 계열에서 다운로드 받으시길 권장하며 윈도우에서 파일 다운로드 시 wsl(리눅스용 윈도우 하위 시스템) 설치가 필요합니다.

※ 파일 병합 리눅스 명령어

find "폴더경로" -name "파일명.zip.part*" -print0 | sort -zt'.' -k2V | xargs -0 cat > "파일명.zip"

- 해당 명령어 실행 시, 실행 경로 위치에 병합 압축 파일이 생성됩니다.

- 병합된 파일 용량이 0일 경우, 제대로 병합이 되지 않은 상태이니 "폴더경로"가 제대로 입력되었는지 확인 부탁드립니다.

※ 데이터셋 소개 페이지에서 다운로드 버튼 클릭하여 승인이 필요합니다.