Artwork

Contenu fourni par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.
Player FM - Application Podcast
Mettez-vous hors ligne avec l'application Player FM !

Philipp Koehn (Part 2) - How Neural Networks have Transformed Machine Translation

29:41
 
Partager
 

Manage episode 297999657 series 2954151
Contenu fourni par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.

This is Part 2 of our conversation with Professor Philipp Koehn of Johns Hopkins University. Professor Koehn is one of the world’s leading experts in the field of Machine Translation & NLP.

In this episode we delve into commercial applications of machine translation, open source tools available and also take a look into what to expect in the field in the future.

Episode Summary:

  • Typical datasets used for training models

  • The role of infrastructure and technology in Machine Translation

  • How the academic research in Machine Translation has manifested into industry applications

  • Overview of what’s available in Open source tools for Machine Translation

  • The Future of Machine Translation and can it pass a Turing test

Resources:

Philipp Koehn latest book - Neural Machine Translation - Amazon link:

https://www.amazon.com/Neural-Machine-Translation-Philipp-Koehn/dp/1108497322

Omniscien Technologies - Leading Enterprise Provider of machine translation services:

https://omniscien.com/

Open Source tools:

- Fairseq https://fairseq.readthedocs.io/en/latest/

- Marian https://marian-nmt.github.io/

- OpenNMT https://opennmt.net/

- Sockeye https://awslabs.github.io/sockeye/

Translated texts (parallel data) for training:

- OPUS http://opus.nlpl.eu/

- Paracrawl https://paracrawl.eu/

Two papers mentioned about excessive use of computing power to train NLP models:

- GPT-3 https://arxiv.org/abs/2005.14165

- Roberta https://arxiv.org/abs/1907.11692

  continue reading

25 episodes

Artwork
iconPartager
 
Manage episode 297999657 series 2954151
Contenu fourni par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Damien Deighan and Philipp Diesinger, Damien Deighan, and Philipp Diesinger ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.

This is Part 2 of our conversation with Professor Philipp Koehn of Johns Hopkins University. Professor Koehn is one of the world’s leading experts in the field of Machine Translation & NLP.

In this episode we delve into commercial applications of machine translation, open source tools available and also take a look into what to expect in the field in the future.

Episode Summary:

  • Typical datasets used for training models

  • The role of infrastructure and technology in Machine Translation

  • How the academic research in Machine Translation has manifested into industry applications

  • Overview of what’s available in Open source tools for Machine Translation

  • The Future of Machine Translation and can it pass a Turing test

Resources:

Philipp Koehn latest book - Neural Machine Translation - Amazon link:

https://www.amazon.com/Neural-Machine-Translation-Philipp-Koehn/dp/1108497322

Omniscien Technologies - Leading Enterprise Provider of machine translation services:

https://omniscien.com/

Open Source tools:

- Fairseq https://fairseq.readthedocs.io/en/latest/

- Marian https://marian-nmt.github.io/

- OpenNMT https://opennmt.net/

- Sockeye https://awslabs.github.io/sockeye/

Translated texts (parallel data) for training:

- OPUS http://opus.nlpl.eu/

- Paracrawl https://paracrawl.eu/

Two papers mentioned about excessive use of computing power to train NLP models:

- GPT-3 https://arxiv.org/abs/2005.14165

- Roberta https://arxiv.org/abs/1907.11692

  continue reading

25 episodes

Alle episoder

×
 
Loading …

Bienvenue sur Lecteur FM!

Lecteur FM recherche sur Internet des podcasts de haute qualité que vous pourrez apprécier dès maintenant. C'est la meilleure application de podcast et fonctionne sur Android, iPhone et le Web. Inscrivez-vous pour synchroniser les abonnements sur tous les appareils.

 

Guide de référence rapide