본문 바로가기

데이터셋 상세보기

비대면 진료를 위한 의료진 및 환자 음성 가공 데이터
헬스케어 개방 공공·연구

오디오

(주)마고

비대면 진료를 위한 의료진 및 환자 음성 가공 데이터
  • 기본정보

    등록일자 2024-12-18 23:39:41.709394

    조회수 96

  • 관련 키워드

    비대면 | 원격의료 | 음성인식

  • 소개

    AI Hub에 공개되어 있는 <비대면 진료를 위한 의료진 및 환자 음성> 데이터를 음성인식 데이터로 바로 활용할 수 있도록 가공된 데이터

    구축 목적

    데이터 특징

    데이터셋 명

    • 비대면 진료를 위한 의료진 및 환자 음성 가공 데이터

    데이터셋 구축 목적

    • 의료진과 환자의 음성 발화 데이터로부터 음성 인식 모델 훈련에 필요한 데이터 형태로 가공 일반인들이 손쉽게 사용할 수 있도록 전처리 및 정제 작업을 수행하여 데이터를 공급
       

    데이터셋 상세 설명

    • 비대면 의사, 간호사, 환자의 병원에서의 음성 발화 데이터,
       
    • 데이터셋 파일 사이즈
      • 음성인식 훈련용 스크립트 파일: 131M,
      • Fbank80d 특징벡터: 135G
    • 데이터셋 건 수
      • 훈련음성 오디오 파일수: 1,130,810
      • Validation 오디오 파일수:  141,820
    • 데이터셋 수집 기간
      • AIHub home으로 다운받아서 음성인식용 표준 포맷으로 데이터 가공 및 스크립트 가공 
      • 2023년 2월1일 ~ 2월 28일
    • 가공데이터 포맷
      • 원본 wav
      • 가공 오디오 포맷: 16 kHz, 16bits, Mono 
      • 텍스트 스크립트: tx.

    데이터셋 활용 분야

    • 비대면 의료 서비스에 사용할 수 있는 음성인식용 음성 데이터 
    • 한국어 인식에 최적화된 tokenizer 모델 (sentencepiece)
       

    데이터셋 활용 성과

    • MAGO-S2T-V1.0 에 적용
    • 비대면 상담분야 음성인식 성능: 97%
    • 치매/우울 선별용 데이터셋에 모델 적용 후 치매/우울 태킹 데이터 생성 등
       

    데이터셋 구조

    • 메타 정보
      • {
            "dataset_name": "AIHubAudio",
            "label_type": "1",
            "number_of_utterances": 1130809,
            "total_duration": 4031949,
            "total_duration_hms": "1119h 59m 9s",
            "mean_duration": 3.566,
            "std_of_durations": 1.644,
            "max_duration": 57.66,
            "min_duration": 0.48
        }

         
    • 라벨 구성 요소
    번호 속성명 타입 필수여부 설명 범위 비고
    1 utterance ID PA_0093-1191-01-03-F-04-B 필수 오디의 파일의 고유 ID    
    2 오디오 경로 KmedicalSpeech_fbanks80.zip:<시작위치>:<끝위치> 필수 특징베터 위치 정보    
    3 프레임 개수 int 필수 특징벡터 개수 (프레임 단위는 10ms) 10 ~ 3000  
    4 음정전사 텍스트 string 필수 한글    
    5 화자 ID string (HA_0010) 필수 화자 고유 ID    

     

    • 데이터 예시
      • id      audio   n_frames        tgt_text        speaker
        HA_0010-1-01-02-M-04-A  /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:14927361377:105088    328     집안에 고혈압인 분 있나요?      HA_0010
        HA_0010-10-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:50682695427:97408     304     술을 얼마나 자주 드시나요?      HA_0010
        HA_0010-100-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:113509012760:85888    268     머리가 핑도는 느낌이 있으신가요?        HA_0010
        HA_0010-101-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:95072303148:76288     238     심장이 두근거리시나요?  HA_0010
        HA_0010-102-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:76183265537:57088     178     간염 있을까요?  HA_0010
        HA_0010-103-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:49021471028:68608     214     과거 병력을 알고 싶어요.        HA_0010
        HA_0010-104-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:64777022295:78208     244     소변에 피가 같이 나온 적이 있을까요?    HA_0010
        HA_0010-105-01-02-M-04-A        /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:117842559836:76288    238     당뇨는 언제 진단받으셨나요?     HA_0010

     

    제공 기관명 (주)마고
    문의 이메일 galois@holamago.com
  • 항목
    내용
    데이터셋 제목
    비대면 진료를 위한 의료진 및 환자 음성 가공 데이터
    데이터셋 분류
    헬스케어 > 건강측정 > 건강검진
    파일 포맷
    기타
    수집 장소
    수집 기간
    2024-12-19 - 2024-12-19
    용량

  • 상품구성정보


    API

    -

    요청변수

    API 요청변수 구조표
    항목명(국문) 항목명(영문) 크기 항목구분 샘플데이터 설명
    요청변수 데이터가 없습니다.

    응답변수

    API 응답변수 구조표
    항목명(국문) 항목명(영문) 크기 항목구분 샘플데이터 설명
    응답변수 데이터가 없습니다.

    샘플코드


    -

유관사이트