본문 바로가기

논문 리딩(NLP>LLM)

(2)

[논문리딩] Robust Speech Recognition via Large-Scale Weak Supervision 1. Background 지금까지 음성 인식에 대해 충분히 연구되지 않았지만, 컴퓨터 비전의 최근 연구들은 ImageNet과 같은 크라우드소싱 데이터셋을 넘어 훨씬 더 크지만 weakly-supervised 데이터셋으로 이동하면 모델의 견고성과 일반화가 크게 향상됨을 보여주었음 본 논문에서는 Weakly-supervised 음성 인식을 680,000 시간의 레이블이 지정된 오디오 데이터로 확장하여 그 격차를 줄임 본 논문의 접근 방식을 Whisper 라고 부름 680,000시간의 오디오 중 117,000 시간은 96개의 다른 언어를 포함함 이 데이터셋에는 125,000 시간의 X -> en 번역 데이터도 포함되어 있음 저자들은 충분히 큰 모델의 경우, 다국어 및 멀티태스킹 학습에 단점이 없으며 심지어 이..

[논문리딩] Revisiting the Gold Standard:Grounding Summarization Evaluation with Robust Human Evaluation 논문 리뷰 ㅇㅇㅇ

이전 1 다음

티스토리툴바