Audio Representation Learning

Audio-guided self-supervised learning for disentangled visual speech representations

Learning visual speech representations from talking face videos is an important problem for several speech-related tasks, such as lip reading, talking face generation, audio-visual speech separation, ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Feedback

Audio-guided self-supervised learning for disentangled visual speech representations

Trending now