11/05/2022 @ 19:49:15: Google - Google Translate apprend 24 nouvelles langues grâce à une nouvelle technique de Machine Learning
Au fil du temps et de la mise en œuvre de nouvelles fonctionnalités, Google Translate se rapproche de plus en plus du traducteur universel de Star Trek . A ce propos, l'arrivée de 24 nouvelles langues a été annoncée sur la scène de la Google I / O. En soi, vous pourriez penser qu'il n'y a rien d'extraordinaire. En réalité, ce qui est particulièrement curieux, c'est la manière dont ces langues ont été insérées dans Google Translate. Ce sont les premières formes de langage ajoutées grâce à l'utilisation de la soi-disant Zero-Shot Machine Translation , c'est-à-dire un modèle d'apprentissage automatique qui apprend à traduire dans une autre langue sans disposer d'exemples écrits concrets .
Pour arriver à affiner cette technique particulière de machine learning, nous avons d'abord travaillé sur des langues connues, comme l' espagnol et l'allemand . Évidemment les résultats obtenus ne seront pas parfaits à 100%, mais c'est une avancée significative qui rendra Google Translate de plus en plus puissant. Il existe également une liste de ces 24 nouvelles langues, parlées par quelque chose comme plus de 300 millions de personnes dans le monde . Vous n'avez probablement jamais entendu parler de certains d'entre elles !
Assamais , utilisé par environ 25 millions de personnes dans le nord-est de l'Inde
Aymara , utilisé par environ 2 millions de personnes en Bolivie, au Chili et au Pérou
Bambara, utilisé par environ 14 millions de personnes au Mali
Bhojpuri , utilisé par environ 50 millions de personnes dans le nord de l'Inde, au Népal et aux Fidji
Dhivehi , utilisé par environ 300 000 personnes aux Maldives
Dogri , utilisé par environ 3 millions de personnes dans le nord de l'Inde
Ewe , utilisé par environ 7 millions de personnes au Ghana et au Togo
Guarani , utilisé par environ 7 millions de personnes au Paraguay, en Bolivie, en Argentine et au Brésil
Ilocano , utilisé par environ 10 millions de personnes dans le nord des Philippines
Konkani, utilisé par environ 2 millions de personnes dans le centre de l'Inde
Krio , utilisé par environ 3 millions de personnes en Sierra Leone
Kurde (Sorani), utilisé par environ 8 millions de personnes, principalement en Irak
Lingala , utilisé par environ 45 millions de personnes en République démocratique du Congo, en Angola, au Soudan du Sud
Luganda , utilisé par environ 20 millions de personnes en Ouganda et au Rwanda
Maithili , utilisé par environ 34 millions de personnes dans le nord de l'Inde
Meiteilon (Manipuri), utilisé par environ 2 millions de personnes dans le nord-est de l'Inde
Mizo , utilisé par environ 830 000 personnes dans le nord-est de l'Inde
Oromo , utilisé par environ 37 millions de personnes en Éthiopie et au Kenya
Quechua , utilisé par environ 10 millions de personnes au Pérou, en Bolivie, en Équateur et dans d'autres pays voisins
Sanskrit , utilisé par environ 20 000 personnes en Inde
Sepedi , utilisé par environ 14 millions de personnes en Afrique du Sud
Tigrinya , utilisé par environ 8 millions de personnes en Érythrée et en Éthiopie
Tsonga , utilisé par environ 7 millions de personnes à Eswatini, au Mozambique, en Afrique du Sud et au Zimbabwe
Twi , utilisé par environ 11 millions de personnes au Ghana