Les mots sont les briques du langage.

Il est impossible d’apprendre une nouvelle langue sans apprendre les mots qui la composent.

Mais de combien de briques exactement ai-je besoin pour construire ma nouvelle langue ?

Cet article est le premier volet d’une série de 3 articles dédiés à la question. C’est parti !

 

#1 Un nombre de mots qui dépend du niveau de maîtrise que vous voulez atteindre

Les 4 niveaux de maîtrise d'une langue

Ca va sans le dire, mais ça ira encore mieux en le disant :

La taille du vocabulaire que vous aurez à intégrer dépend de l’objectif final de maîtrise que vous visez.

Le nombre de mots que vous avez besoin de connaître pour vous en sortir en tant que touriste dans un pays n’a rien à voir avec la quantité de vocabulaire que vous devez maîtriser pour être capable d’échanger dans toutes les situations de la vie quotidienne…

Ce nombre de mots est également très différent du nombre de mots que vous devrez maîtriser pour naviguer facilement dans un contexte professionnel, ou encore du nombre de mots à maîtriser pour être vraiment bilingue…

Ca paraît évident quand on le dit comme ça hein? ?

Sauf que le monde de l’apprentissage des langues est bourré d’effets d’annonces marketing et de fausses promesses scandaleuses qui ne choquent plus personne…

Alors qu’elles devraient éveiller les plus vifs soupçons !

Rendez-vous dans le 3ème article de cette série pour tirer toutes les conclusions de ce dossier et comprendre ce qui est vraiment faisable… ou pas en terme d’apprentissage!

 

#2 Estimation du nombre de mots à apprendre : exit la taille du dico!

Pas très utile

Toutes les langues du monde n’ont pas le même nombre de mots. C’est un fait.

Certaines langues ont plusieurs mots pour exprimer diverses nuances d’un même concept, là où une autre langue n’en a littéralement aucun !

En tirer des conclusions hâtives sur la richesse relative d’une langue par rapport à une autre serait une erreur fatale! ☠

Le langage est un outil qui s’est développé dans un contexte social et culturel donné.

L’arabe par exemple dispose d’une pléthore de termes pour décrire les chameaux, sur la base de leur sexe bien sûr, mais aussi de leur apparence, de leur caractère, de leur fonction et même… de leur profil de consommation d’eau! Pour les curieux, je vous laisse découvrir ce petit article très intéressant sur Medium (en anglais) qui en dénombre plus de 50 : Just how many words does Arabic have for ‘camel’?

Il est bien évident que les locuteurs français n’ont pas ressenti le besoin de développer autant de termes spécifiques autour des chameaux, et la langue française n’en est pas moins riche pour autant !

Group of Camels walking in desert

Pour estimer le nombre de mots nécessaires pour maîtriser une langue étrangère, beaucoup ont été tentés de se référer au nombre total de mots de cette langue pour juger de sa complexité, de sa richesse et essayer d’en tirer une règle générale sur la taille du vocabulaire à maîtriser.

Comment se faire une idée du nombre total de mots dans une langue ?

L’indicateur le plus souvent utilisé est la taille du plus gros dictionnaire de cette langue!

Je ne me suis pas lancée dans cette quête du plus gros dictionnaire de chaque langue parce que je ne la trouve pas très utile en pratique, vous allez rapidement comprendre pourquoi, mais d’autres personnes l’ont fait! Je reprends ci-dessous un tout petit extrait d’un article du site Lingholic qui est remarquable par la quantité de recherches qu’a dû faire son auteur pour l’asseoir sur des références fiables!

LANGUE

PLUS GROS DICTIONNAIRE

NOMBRE DE MOTS

Anglais

The Second Edition of the 20-volume Oxford English Dictionary

171,476 mots en usage et 47,156 mots obsolètes; 615,100 définitions.

Français

Le Grand Robert de la langue française

100,000 mots; 350,000 définitions.

L’estimation de la taille du vocabulaire anglais est basée sur la taille de la 2ème édition de l’Oxford English Dictionary en 20 volumes qui recense plus de 200 000 mots dans la langue anglaise dont 171 476 mots en usage et 47 156 mots obsolètes. Cette estimation semble être celle qui est retenue aujourd’hui autour du monde pour juger de la taille du vocabulaire anglais car on la retrouve dans toutes les publications sur le sujet.

La taille du vocabulaire français semble bien maigre à côté avec ses 100 000 mots, estimation basée sur la taille du grand Robert de la langue Française.

Le problème, c’est que le Robert n’est pas nécessairement le dictionnaire le plus exhaustif! Le littré, lui, compte 132 000 mots français, là où le Larousse n’en recense que 59 000. [3]

Dictionnaire

L’exercice qui consiste à estimer la taille du vocabulaire d’une langue sur la base de la taille du plus gros dictionnaire est donc particulièrement hasardeux…

D’autant que ces dictionnaires peuvent être encombrés d’une quantité importante de mots archaïques qui ne sont plus utilisés de nos jours…

Et qu’ils n’intègrent pas forcément encore tout un ensemble de mots nouveaux qui apparaissent en permanence dans une langue et qui sont utilisés tous les jours…

Car la langue est un outil vivant qui évolue avec nous.

Et puis, quel pourcentage de ce nombre de mots gigantesque faut-il vraiment apprendre?

Heureusement, un pourcentage très raisonnable!

La plupart des linguistes et des polyglottes ont abandonné cette quête du nombre de mots total existant dans une langue pour se tourner vers une question beaucoup plus utile en pratique :

Combien de mots les locuteurs natifs d’une langue utilisent-ils ?

Si atteindre le niveau du locuteur natif est l’objectif ultime, alors avoir une estimation du nombre de mots qu’ils utilisent doit pouvoir donner une idée du positionnement de la ligne d’arrivée!

 

#3 Nombre de mots utilisés par les locuteurs natifs d’une langue

Là encore, si vous faites quelques recherches sur internet, vous risquez assez rapidement de vous arracher les cheveux tant les chiffres que vous allez rassembler sont disparates.

Une recherche sur le nombre de mots connus par le locuteur anglophone moyen peut donner des résultats qui varient considérablement…

Une source affirmera que les locuteurs anglophones natifs ultra éduqués ont un vocabulaire d’environ 10 000 mots alors qu’une autre source affirmera qu’un locuteur ordinaire qui a terminé ses études secondaires en connaît facilement 35 000…

L’écart est de taille !

On pourrait croire que ces sources ne sont pas fiables, qu’elles ont fait leur estimation « au doigt mouillé » ou qu’elles ont carrément lancé des chiffres en l’air comme ça, pour l’effet d’annonce, mais ce n’est pas le cas !

Nombre de ces chiffres que l’on croise sur internet sont issus de recherches sérieuses en linguistique publiées par des laboratoires reconnus, ou encore issues de l’expérience pratique des plus grands polyglottes au monde.

Si les chiffres et les résultats que l’on ramasse sont aussi différents d’une étude à l’autre, c’est le plus souvent qu’elles ne mesurent tout simplement pas la même chose !

Et là, on commence à rentrer dans des considérations qui sont importantes à avoir en tête pour notre apprentissage des langues ! ✨

 

#4 Estimation du nombre de mots à apprendre : comment compter les mots?

Comment compter le nombre de mots à apprendre dans une langue?

Dans les études, on rencontre essentiellement deux façons de compter les mots :

La première façon de compter considère chaque déclinaison d’un mot comme un mot différent.

Dans cette approche, « to run », « run », « runs », « running » et « ran » seront considérés comme cinq mots anglais différents.

De même, « chat » et « chats » seront comptés comme deux mots français différents.

La deuxième façon de compter ne prend en compte que les formes de base, celles qu’on trouve dans le dictionnaire, et ne tient pas compte des différentes déclinaisons et transformations subies par le mot en fonction du genre, du nombre ou du temps.

Dans cette approche, « to run », « run », « runs », « running » et « ran » ne comptent que pour un seul mot.

Et il en est de même pour « chat » et « chats ».

On commence déjà à sentir d’où peuvent venir les écarts gigantesques d’évaluation entre les différentes études que l’on rencontre sur internet…

Si on ne précise pas les hypothèses retenues, on a vite fait de comparer des choux et des carottes…

Et de ne plus rien y comprendre.

Rien qu’en changeant de méthode de comptage il est tout à fait possible de passer allègrement d’une estimation de 10 000 à 35 000 mots, voire plus, sans aucun souci!

 

Attention aux écarts d'hypothèses entre les différentes études
Attention aux écarts d’hypothèses entre les différentes études! On a vite fait de comparer des choux et des carottes et de se retrouver complètement perdu!

 

Chacune de ces deux méthodes de comptage à ses défenseurs bien sûr, et chacune de ces deux approches se défend, même si j’ai clairement ma préférée moi aussi!

A certains égards, on peut effectivement considérer chaque variation d’un mot comme un mot individuel puisque chacune des formes du mot introduit une nuance et une signification légèrement différente liée au temps, au genre ou au nombre par rapport à sa forme de base.

Considérer chaque variation d’un mot comme un mot différent est aussi la méthode de comptage qui est la plus facile à exploiter numériquement. Il est en effet très facile d’écrire un script en Python (ou dans un autre langage informatique) qui va lister les différents mots et leur fréquence d’apparition dans un texte. Prendre en compte des informations comme le genre, le nombre ou le temps pour regrouper les mots en famille (les « mots racines » ou « lemmes ») est tout de suite beaucoup plus compliqué.

Malgré tout, je trouve l’approche par famille beaucoup plus utile en pratique, et c’est celle que je vais retenir dans cette série d’articles, car je trouve qu’elle reflète au plus près le processus organique d’apprentissage que nous suivons quand nous apprenons une langue.

Nous commençons en général par apprendre un mot sous l’une de ses formes et, à mesure que nous en apprenons davantage sur la langue et ses structures, nous apprenons à le décliner sous d’autres formes et dans d’autres cas d’usage.

C’est ce qui se passe par exemple dans le cas de la conjugaison : nous apprenons à utiliser un verbe au présent (« je mange »), nous apprenons sa forme racine (« manger »), puis au fur et à mesure de notre apprentissage, nous apprenons à conjuguer cette forme racine à tous les temps et à tous les modes pour pouvoir raconter toutes les histoires que nous souhaitons partager (« j’ai mangé », « je mangerai », etc.).

La capacité à conjuguer un verbe à toutes les personnes, à tous les temps et à tous les modes compte bien alors pour ce qu’elle est, une connaissance grammaticale, et pas une connaissance lexicale.

Comprendre la façon dont les verbes se conjuguent et savoir reproduire ces variations suivant les algorithmes de la langue sera toujours bien plus efficace que mémoriser une suite infinie de formes déconnectées entre elles et sans logique.

Comprendre la façon dont les choses fonctionnent sera toujours plus efficace que la mémorisation brute
Comprendre la façon dont les choses fonctionnent sera toujours plus efficace que la mémorisation brute! ?

 

Cette première considération sur le comptage des mots permet d’éclairer une partie du fossé et de la zone grise existant entre les différentes estimations du nombre de mots à apprendre pour maîtriser une langue.

Mais les choses ne s’arrêtent pas là !

 

#5 Estimation du nombre de mots à apprendre : vocabulaire actif vs. vocabulaire passif

La différence entre vocabulaire actif et vocabulaire passif

La deuxième difficulté d’estimation du nombre de mots à apprendre pour maîtriser une langue vient de la question suivante : Que signifie vraiment « connaître » un mot ?

Le vocabulaire que chacun d’entre nous possède se divise en deux catégories distinctes :

Le vocabulaire actif et le vocabulaire passif.

Le vocabulaire actif, c’est tout le vocabulaire dont on se souvient rapidement et qu’on utilise activement quand on écrit, parle et pense. Ces mots de vocabulaire, nous sommes non seulement capables de les reconnaître dans des énoncés, à l’écrit ou à l’oral, mais également capables de les produire quand nous nous exprimons (capacités complètes de reconnaissance et de production).

Le vocabulaire passif, c’est tout le vocabulaire que l’on peut comprendre passivement quand on le rencontre, quand on le voit ou qu’on l’entend, mais qu’on ne sait pas nécessairement mobiliser quand on en a besoin ou que l’on ne sait pas utiliser quand on écrit, parle ou pense (capacité de reconnaissance seule).

De manière générale, les nouveaux mots que l’on rencontre sont d’abord intégrés à notre vocabulaire passif. Puis à force de les rencontrer dans la nature, on commence progressivement à se faire une idée de leur sens et de leur utilisation, même si on n’est pas encore capable de les utiliser par nous-même.

Une fois que l’on a acquis assez d’indices contextuels, qu’on a lu et entendu suffisamment de différentes significations et utilisations du mot pour avoir une idée précise de ce qu’il signifie et de la façon dont il est utilisé, alors on devient petit à petit capables de l’utiliser par nous-même et ce mot entre alors de plein pied dans votre vocabulaire actif.

Chacun d’entre nous a un vocabulaire passif plusieurs fois supérieur à son vocabulaire actif, que ce soit dans sa langue maternelle ou dans une autre langue.

L’activation de ce vocabulaire passif en vocabulaire actif est un axe fondamental de travail et de progrès pour améliorer sa maîtrise et sa fluidité! ✨

 

#6 Nombre de mots à apprendre par niveau de maîtrise: hypothèses retenues

Nous sommes maintenant parfaitement armés pour répondre à la question posée : combien de mots faut-il apprendre pour maîtriser une langue étrangère ?

Dans le prochain article, nous allons voir ensemble quelques ordres de grandeur utiles à avoir en tête concernant le nombre de mots à apprendre dans une langue étrangère en fonction du niveau de maîtrise que l’on souhaite atteindre.

Mais avant de se lancer à l’aveugle dans les chiffres, il était fondamental de poser ces quelques bases et de fixer les hypothèses.

Dans mes recherches, j’ai cherché à identifier le nombre de mots dont une personne doit disposer dans son vocabulaire actif pour maîtriser une langue à un certain niveau, et j’ai privilégié les études qui donnent des indications en terme de nombre de mots racine (ou familles de mots ou lemmes) plutôt que les études qui listent chaque variation d’un mot comme un mot différent.

Pour chaque niveau, nous allons voir des fourchettes et des ordres de grandeur du nombre de mots à apprendre. Ces ordres de grandeur, aussi imparfaits soient-ils, constituent des jalons intéressants pour baliser notre progression.

Les avoir en tête permet également de jeter un regard critique sur les discours qui nous sont tenus et les différentes promesses marketing qui nous sont faites un peu partout.

Quand vous les connaîtrez, il y a peu de chance que vous vous fassiez avoir de nouveau ! 😉

A tout de suite dans le deuxième volet de cette série ! ✨

Références:

[1] How many words do I need to know ? Part 2 https://www.lingholic.com/how-many-words-do-i-need-to-know-the-955-rule-in-language-learning-part-2/
[2] Just How Many Words does Arabic have for Camel ? https://medium.com/@chrisneil/just-how-many-words-does-arabic-have-for-camel-da5b58022564
[3] Quelle langue contient le plus de mots ? https://fr.babbel.com/fr/magazine/quelle-langue-contient-le-plus-de-mots

Pin It on Pinterest