데이터셋 상세보기
헬스케어
개방
공공·연구
오디오
(주)마고
비대면 진료를 위한 의료진 및 환자 음성 가공 데이터-
기본정보
등록일자 2024-12-18 23:39:41.709394
조회수 96
-
관련 키워드
비대면 | 원격의료 | 음성인식
-
소개
AI Hub에 공개되어 있는 <비대면 진료를 위한 의료진 및 환자 음성> 데이터를 음성인식 데이터로 바로 활용할 수 있도록 가공된 데이터
구축 목적
데이터 특징
데이터셋 명
- 비대면 진료를 위한 의료진 및 환자 음성 가공 데이터
데이터셋 구축 목적
- 의료진과 환자의 음성 발화 데이터로부터 음성 인식 모델 훈련에 필요한 데이터 형태로 가공 일반인들이 손쉽게 사용할 수 있도록 전처리 및 정제 작업을 수행하여 데이터를 공급
데이터셋 상세 설명
- 비대면 의사, 간호사, 환자의 병원에서의 음성 발화 데이터,
- 데이터셋 파일 사이즈
- 음성인식 훈련용 스크립트 파일: 131M,
- Fbank80d 특징벡터: 135G
- 데이터셋 건 수
- 훈련음성 오디오 파일수: 1,130,810
- Validation 오디오 파일수: 141,820
- 데이터셋 수집 기간
- AIHub home으로 다운받아서 음성인식용 표준 포맷으로 데이터 가공 및 스크립트 가공
- 2023년 2월1일 ~ 2월 28일
- 가공데이터 포맷
- 원본 wav
- 가공 오디오 포맷: 16 kHz, 16bits, Mono
- 텍스트 스크립트: tx.
데이터셋 활용 분야
- 비대면 의료 서비스에 사용할 수 있는 음성인식용 음성 데이터
- 한국어 인식에 최적화된 tokenizer 모델 (sentencepiece)
데이터셋 활용 성과
- MAGO-S2T-V1.0 에 적용
- 비대면 상담분야 음성인식 성능: 97%
- 치매/우울 선별용 데이터셋에 모델 적용 후 치매/우울 태킹 데이터 생성 등
데이터셋 구조
- 메타 정보
- {
"dataset_name": "AIHubAudio",
"label_type": "1",
"number_of_utterances": 1130809,
"total_duration": 4031949,
"total_duration_hms": "1119h 59m 9s",
"mean_duration": 3.566,
"std_of_durations": 1.644,
"max_duration": 57.66,
"min_duration": 0.48
}
- {
- 라벨 구성 요소
번호 속성명 타입 필수여부 설명 범위 비고 1 utterance ID PA_0093-1191-01-03-F-04-B 필수 오디의 파일의 고유 ID 2 오디오 경로 KmedicalSpeech_fbanks80.zip:<시작위치>:<끝위치> 필수 특징베터 위치 정보 3 프레임 개수 int 필수 특징벡터 개수 (프레임 단위는 10ms) 10 ~ 3000 4 음정전사 텍스트 string 필수 한글 5 화자 ID string (HA_0010) 필수 화자 고유 ID - 데이터 예시
- id audio n_frames tgt_text speaker
HA_0010-1-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:14927361377:105088 328 집안에 고혈압인 분 있나요? HA_0010
HA_0010-10-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:50682695427:97408 304 술을 얼마나 자주 드시나요? HA_0010
HA_0010-100-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:113509012760:85888 268 머리가 핑도는 느낌이 있으신가요? HA_0010
HA_0010-101-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:95072303148:76288 238 심장이 두근거리시나요? HA_0010
HA_0010-102-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:76183265537:57088 178 간염 있을까요? HA_0010
HA_0010-103-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:49021471028:68608 214 과거 병력을 알고 싶어요. HA_0010
HA_0010-104-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:64777022295:78208 244 소변에 피가 같이 나온 적이 있을까요? HA_0010
HA_0010-105-01-02-M-04-A /home/galois/.mago/datawarehouse/audio/KmedicalSpeech/KmedicalSpeech_fbanks80.zip:117842559836:76288 238 당뇨는 언제 진단받으셨나요? HA_0010
- id audio n_frames tgt_text speaker
제공 기관명 (주)마고문의 이메일 galois@holamago.com -
항목내용데이터셋 제목비대면 진료를 위한 의료진 및 환자 음성 가공 데이터데이터셋 분류헬스케어 > 건강측정 > 건강검진파일 포맷기타수집 장소수집 기간2024-12-19 - 2024-12-19용량
-
상품구성정보
API-
요청변수
API 요청변수 구조표 항목명(국문) 항목명(영문) 크기 항목구분 샘플데이터 설명 요청변수 데이터가 없습니다. 응답변수
API 응답변수 구조표 항목명(국문) 항목명(영문) 크기 항목구분 샘플데이터 설명 응답변수 데이터가 없습니다. 샘플코드
-