Je teste aujourd'hui un nouveau format, un peu par manque de temps, mais aussi pour explorer des sujets pour lesquels je n'ai pas de données accessibles.

Je vous propose de vous faire un petit résumé d'un article scientifique que j'ai trouvé passionnant, avec explication d'une des figures présente dans l'article.

L'article en question est :

  • Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche

L'article a été publié par Coupé, C., Oh, Y. M., Dediu, D., & Pellegrino, F. en 2019 dans le Journal Science advances. Vous pouvez retrouver l'article complet ici (en anglais).

Le titre peut se traduire par :

  • Langues différentes, efficacité d'encodage similaire : Des taux d'information comparables dans la niche communicative humaine

Les langues et leur efficacité

On a tous en tête cet espagnol qui parle extrêmement vite, de là à penser qu'il transmet plus d'information que nous à la seconde, il n'y a qu'un pas. Pas d'inquiétude si vous ne parlez pas couramment l'espagnol, cela ne signifie pas forcément que vous êtes désavantagé.

Les auteurs de l'article nous expliquent en fait que toutes les langues humaines, malgré la diversité des vitesses de parole, permettent de transmettre des informations à un taux remarquablement similaire.

Les chercheurs se basent sur deux grandeurs principales pour arriver à ces conclusions :

1. Le taux d'élocution :
Le taux d'élocution représente le nombre de syllabes prononcées par seconde. C'est une mesure qui permet de quantifier la rapidité avec laquelle une personne parle. Un taux d'élocution élevé signifie que le locuteur parle rapidement, enchaînant les syllabes à grande vitesse, tandis qu'un taux d'élocution faible indique une élocution plus lente.

2. Le taux d'information :
Le taux d'information mesure la quantité d'information transmise par seconde, exprimée en bits. Le bit est l'unité de mesure de l'information dans le domaine de l'informatique et des communications.

Je vous passe les autres détails méthodologiques. Sachez juste que les auteurs utilisent des modèles statistiques pour analyser et comparer les taux d'élocution et les taux d'information à travers différentes langues, en tenant compte des variations dues aux spécificités des locuteurs et à d'autres facteurs linguistiques et sociaux.

Explorons les résultats de l'article, illustrés par une figure (bien sûr !).

SR (Speech Rate) : C'est le taux d'élocution en syllabes par secondes. IR (Information Rate) : C'est le taux d'information transmise, en bits par secondes.

Décryptons cette figure ensemble. Dans la colonne de gauche vous voyez les différents taux d'élocution (SR) pour les langues étudiées. Plus la courbe est décalée sur la gauche, plus le taux est bas. Plus la courbe est décalée sur la droite, plus le taux est haut. On peut remarquer par exemple que le japonais (JPN) et l'espagnol (SPA) sont des langues avec des taux d'élocution élevés, alors que le vietnamien (VIE) et le thaïlandais (THA) ont des taux d'élocution faibles.

Dans la colonne de droite, c'est le taux d'information (IR) qui est représenté. Ici c'est la même logique, plus la courbe est décalée sur la gauche, plus le taux d'information est faible, plus la courbe est décalée sur la droite, plus le taux d'information est élevé.

Avec un peu de chauvinisme, on a envie de remarquer que la langue française est plutôt efficace dans la transmission d'information puisque sa courbe de taux d'information est décalé sur la droite. Cocorico... mais ce n'est pas le propos.

Au contraire, cette figure démontre visuellement l'un des principaux messages de l'article :

💡
Malgré des taux d'élocution très différents les langues ont des taux de transmission d'information similaires

En effet, le taux d'élocution va du simple au double entre les différentes langues étudiées, alors que les taux de transmission d'information restent étonnamment proches, avoisinant les 39 bits par seconde.

Ce phénomène montre une adaptation linguistique remarquable à travers le spectre humain :

💡
Les langues avec un taux d'élocution élevé tendent à avoir une densité d'information par syllabe plus faible, et vice versa.

Par conséquent le débit d'information global est similaire.

Cette étude suggère que, au-delà des différences phonétiques, grammaticales ou syntaxiques, les langues sont optimisées pour une efficacité communicative maximale dans le cadre des capacités cognitives et physiologiques humaines.

❤️
Merci de m'avoir lu. Pour me soutenir, partagez mon contenu et abonnez-vous si ce n'est pas déjà fait. Pour toute question, remarque ou suggestion, vous pouvez me contacter ici : simon.bastide@outlook.com