【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベースのボコーダー
https://ai-scholar.tech/articles/speech-synthesis/hifi-gan
3つの要点✔️ 高品質かつ効率的な音声合成を実現するニューラルボコーダー「HiFi-GAN」を提案✔️ 22.05kHzの音声を、単一V100 GPUで生成可能✔️ 様々なend-to-end音声合成タスクへの応用可能性を示したHiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesiswritten by Jungil Kong, Jaehyeon Kim, Jaekyoung Bae(Submitted on 23 Oct 2020)Comments: NeurIPS 2020. Code available at this https URLSubjects: Sound (cs.SD); Machine Learning (cs.LG); Audio and Sp...