Le numérique au service de l’apprentissage précoce des mathématiques

Apprentissage des mathématiques, Articles scientifiques, Recherche

Centre de Recherche en Neuroscience de Lyon et Agir Pour l’Ecole,
Rapport narratif, Résultats préliminaires, Décembre 2024

Introduction

Les mathématiques jouent un rôle majeur dans le monde, tant sur le plan économique que sur le plan sociétal. Comprendre les mathématiques est non seulement au fondement de la réussite scolaire, mais également un enjeu pour le développement de l’esprit critique et la capacité de chacun à participer au débat citoyen, de manière informée. Or le niveau des élèves français en mathématiques a considérablement régressé depuis la fin des années 1980

Les résultats de l’étude internationale TIMSS (Trends in International Mathematics and Science Study) 2023, publiés en décembre 2024, placent la France au bas du classement européen. 15% des élèves de CM1 français ne maîtrisent pas les connaissances fondamentales en mathématiques, contre 7% dans l’Union européenne. Le score des 10% des élèves les plus en difficulté en France est parmi les plus faibles d’Europe. C’est aussi le cas pour les 10% des élèves les plus performants qui se classent en-deçà de la moyenne européenne. 

La France est également l’un des pays de l’OCDE où les inégalités entre les élèves les plus favorisés et les élèves les plus défavorisés sont les plus fortes (81 points). Les inégalités de performance en mathématiques entre les filles et les garçons s’accroissent, passant de 6 points en 2015 à 23 points en 2023. C’est l’écart le plus important parmi les pays de l’UE ou de l’OCDE évalués.

Face à ce constat alarmant l’association Agir pour l’école, en collaboration avec le Centre de Recherche en Neuroscience de Lyon (CRNL) et les académies de Lille et de Lyon, a initié un projet de recherche : Agir pour les maths, centré sur l’usage du numérique pour l’apprentissage des mathématiques chez les jeunes enfants issus de milieux défavorisés. Il s’agissait d’évaluer l’efficacité d’un programme pour l’apprentissage des petits nombres dès la grande section de maternelle. Basé sur l’utilisation d’une application numérique intitulée AxéMaths, le dispositif a été déployé dans le cadre d’évaluations d’impact à large échelle durant les années scolaires 2022-2023 et 2023-2024. Ce rapport présente la synthèse des résultats préliminaires de ces deux études.

Présentation du programme

Le programme Agir pour les maths s’appuie sur une application pour tablette numérique : AxéMaths. Développée par l’association Agir pour l’école, en partenariat avec le CRNL, elle a pour objectif de consolider l’apprentissage du nombre. 

AxéMaths propose 101 exercices (de 36 types différents) conçus selon les recommandations de la recherche en psychologie cognitive et en didactique des mathématiques. Les exercices non réussis sont de nouveau proposés afin de favoriser la maîtrise des concepts étudiés et une progression adaptée au niveau de chaque élève.
AxéMaths est accompagnée d’une application “enseignant” qui fournit un tableau de bord détaillé de la progression des élèves.

Résultats de la 1ère étude – Année scolaire 2022-2023

Une première étude à large échelle a été menée entre mars et juin 2023 auprès de 893 élèves de Grande section de maternelle en éducation prioritaire, dans les académies de Lille et de Lyon. Un groupe Expérimental composé de 37 classes a bénéficié du déploiement du dispositif  “Agir pour les maths”, soit des séances de travail sur l’application AxéMaths de 30 minutes par jour, 3 fois par semaine et 1 séance de régulation hebdomadaire lors de laquelle étaient travaillées sans tablette les notions mal maîtrisées. Un groupe Contrôle composé de 31 classes a également été suivi.

Les résultats montrent un impact positif du programme sur les performances des élèves mesurées en amont et en aval de l’intervention. Les élèves du groupe Expérimental progressent en moyenne de 60% de plus que les élèves du groupe Contrôle. L’analyse montre une taille d’effet de l’intervention de 0,29 écart-type1, ce qui place dans les 10% des interventions les plus efficaces au niveau Grande section de maternelle (Kraft 2020)

Description de la 2ème étude – Année scolaire 2023-2024

Cette deuxième expérimentation à large échelle, menée entre mars et juin 2024, a un double objectif : 1. confirmer les résultats de la 1ère étude, 2. identifier les facteurs contribuant à cet impact positif. 84 classes de Grande section REP/REP+2, soit 1059 élèves (académies de Lille et de Lyon), ont participé à l’étude, réparties en 4 groupes, aléatoirement3 à l’exception du Groupe 4 dont les enseignants ont déjà participé au programme : 

  • Groupe contrôle (Groupe 1) : il suit le programme scolaire habituel et sert de référence pour évaluer l’impact de l’intervention. 
  • Groupe Tablette seule (Groupe 2) : ces élèves utilisent uniquement l’application AxéMaths, à raison de séances de 30 minutes, 4 fois par semaine.
  • Groupe Tablette et Régulation (Groupe 3) : en plus de l’application AxéMaths (3 séances de 30 minutes 3 fois par semaine), ce groupe bénéficie de séances de régulation sans tablette (1 fois par semaine), focalisées sur les difficultés rencontrées (remédiation) ou sur les difficultés prévues (anticipation). 
  • Groupe Expertise (Groupe 4) :  composé de classes ayant déjà participé au dispositif lors de l’expérimentation précédente (et donc de classes avec 1 an d’expertise sur le projet), ce groupe suit le même protocole que le Groupe 3.

Les élèves des 4 groupes ont été évalués avant (pré-tests) et après (post-tests) l’intervention de 8 semaines, de manière à mesurer la progression des élèves. Le test utilisé (ENUDIT) a été conçu par l’équipe de recherche et validé en le comparant au test Woodcock-Johnson. Administré en présentiel et en face-à-face, il dure environ 30 minutes et mesure les compétences suivantes : Réciter ; Coder ; Décoder ; Comparer ; Associer ; Anticiper ; Calculer.

1 À noter que pour cette première étude nous avions présenté lors de la première restitution fin 2023 une taille d’effet de 0,2 écart-type. Cette valeur correspondait à une borne inférieure des résultats possibles. La nouvelle valeur de 0.29 est une valeur moyenne qui correspond mieux à ce qui est habituellement rapporté en termes de tailles d’effets.
2 3 classes participantes étaient hors éducation prioritaire, les autres classes étant en REP ou REP+
3 Dans l’académie de Lyon les classes du groupe 4 ont été présélectionnées en raison de leur participation l’année précédente au projet et les classes des groupes 1, 2, et 3 ont été réparties par tirage aléatoire avec la contrainte de ne pas avoir de classe isolée dans le groupe expérimental ou contrôle dans une école. Dans l’académie de Lille, les classes ont été sélectionnées et réparties par école dans les 4 groupes par l’académie de Lille, le tirage est donc pseudo-aléatoire au niveau des écoles.

Résultats de la 2ème étude – Année scolaire 2023-2024

Des retours positifs des enseignants et enseignantes 

Durant l’expérimentation, chaque classe a fait l’objet d’une visite pendant laquelle une séance de travail sur l’application AxéMaths a été observée. Cette visite a également été l’occasion de recueillir les retours des enseignants et enseignantes. Les retours ont été globalement positifs. Une note de 8,3/10 a été attribuée à l’intervention sur les 59 classes où ces données ont pu être collectées (1 : je ne recommande pas du tout l’intervention ; 10 : je recommande vivement l’intervention). 79% des classes ont attribué une note supérieure ou égale à 8/10. 

Un impact global positif de l’intervention

La comparaison des résultats au test ENUDIT avant et après l’intervention montre que le groupe Expérimental (Groupes 2+3+4) a davantage progressé que le groupe Contrôle (Groupe 1), de manière statistiquement significative. La taille d’effet mesurée est de 0,27 écart-type, ce qui place l’intervention dans les 25% des meilleures approches au niveau Grande section de maternelle, et à la limite des 10% des meilleures approches (Kraft 2020).

Figure 1 : Tailles d’effet obtenues pour un panel de 314 études à différents niveaux éducatifs (K : Grande section de maternelle). Chaque barre verticale fournit une référence pour l’effet moyen obtenu (ligne rouge foncé) et la répartition des études par taille d’effet. Se situer dans la partie rose clair supérieure place une étude dans les 25% des études ayant obtenu les meilleurs résultats. Se situer au-dessus de la partie rose clair place une intervention dans les 10% des meilleures approches.
Kraft, 2020. Notre étude est indiquée dans le graphique par un point vert (au niveau K à la limite supérieure de la partie rose clair).
Les élèves du groupe Expérimental ont progressé en moyenne 62% de plus que les élèves du groupe Contrôle. Cette progression correspond à un gain de 6 semaines d’apprentissage supplémentaire sur un programme de 10 semaines.

Les groupes 2, 3 et 4 montrent chacun une progression plus importante que celle du groupe Contrôle (Figure 2). On n’observe pas de différence significative entre les groupes 2, 3 et 4, pris dans leur ensemble. On peut donc conclure que le groupe Expérimental a de meilleurs résultats que le groupe Contrôle, mais analysés dans leur globalité, il n’est pas possible de conclure sur la modalité d’intervention la plus efficace entre les Groupes 2, 3 et 4.

Figure 2 : Progression marginale en fonction du Groupe.

Figure 3 : Progression marginale en fonction du niveau des élèves (Q1 : élèves fragiles ; Q2 : élèves intermédiaires ; Q3 : élèves avancés)

L’intervention bénéficie aux élèves quel que soit leur niveau

Lorsque les élèves des groupes Expérimental et Contrôle sont répartis en fonction de leur niveau, on constate que le programme fait progresser l’ensemble des élèves quel que soit le niveau (Figure 3). L’impact tend toutefois à être légèrement plus prononcé pour les élèves les plus fragiles. 

L’intervention divise presque par 2 le nombre d’élèves en difficulté en fin de grande section

La figure 4 montre la répartition des élèves en fonction des attendus de Moyenne section, Grande section et CP. On constate que dans le groupe Expérimental, le nombre d’élèves n’ayant pas le niveau de fin de Grande section aux post-tests (soit peu avant la fin de l’année scolaire) est presque 2 fois moins important que dans le groupe Contrôle. Lors des pré-tests, les groupes Expérimental et Contrôle présentent une répartition quasiment similaire. Aux post-tests, le groupe Expérimental montre des résultats significativement meilleurs, avec nettement plus d’élèves ayant le niveau attendu à mi-CP que dans le groupe Contrôle.

Figure 4 : Répartition des élèves en fonction de leur niveau, lors des pré-tests et des post-tests (en jaune : élèves de niveau début Moyenne section ; en gris : élèves de niveau début Grande section ; en orange : élèves de niveau fin Grande section ; en bleu : élèves de niveau mi-CP)

L’impact de l’intervention porte particulièrement sur les compétences les plus avancées

Une analyse plus fine des résultats montre que l’impact de l’intervention est concentré sur les 2 compétences les plus avancées travaillées en Grande section : Anticiper et Calculer. La compétence Anticiper correspond à la capacité à résoudre des problèmes en manipulant des quantités (cardinalité) ou en manipulant des positions (ordinalité). La compétence Calculer reflète la capacité des élèves à ajouter des nombres entre eux, à soustraire, ou encore à décomposer un nombre.

Pour les compétences Coder, Décoder et Associer, les 4 groupes ne montrent pas de différence significative (Figure 5a). Pour les compétences Comparer et Réciter, le Groupe 3 a une progression significativement supérieure à celle du Groupe Contrôle, ce qui n’est pas le cas des autres groupes. Toutefois les Groupes 2, 3 et 4 ne sont pas significativement différents (Figure 5b). Pour les compétences les plus avancées, à savoir Anticiper et Calculer, les Groupes expérimentaux (2, 3 et 4) affichent une progression significativement meilleure que celle du groupe Contrôle, sans présenter de différence significative entre eux (Figure 5c).

Figure 5a : Progression marginale pour chaque Groupe pour les compétences Coder, Décoder, Associer

Figure 5b : Progression marginale pour chaque Groupe pour les compétences Comparer, Réciter

Figure 5c : Progression marginale pour chaque Groupe pour les compétences Anticiper, Calculer

Pour les élèves les plus fragiles, les modalités du Groupe 4 sont les plus performantes

L’analyse de l’interaction entre les scores aux pré-tests et le groupe montre que plus le score d’un élève du Groupe 4 est faible aux pré-tests, plus sa progression au cours de l’intervention est importante. La taille d’effet du Groupe 4 pour les élèves les plus fragiles est de 0,45 écart-type. La modalité du Groupe 4 qui allie l’utilisation de l’application AxéMaths, aux séances de régulation, avec une expérience accrue des enseignants dans la mise en œuvre du protocole, bénéficie particulièrement aux élèves les plus en difficulté. 

Figure 6a : Elèves fragiles

Figure 6b : Elèves intermédiaires

Figure 6c : Elèves avancés

Les figures 6a, 6b et 6c sont obtenues en divisant les élèves en trois tiers : Le tiers des élèves fragiles ayant eu les moins bonnes notes aux pré-tests (6a), le tiers des élèves intermédiaires ayant eu des notes intermédiaires aux pré-tests (6b) et le tiers des élèves avancés ayant eu les notes les plus élevées aux pré-tests (6c). Ensuite pour chacun de ces 3 groupes de niveau, on compare les performances des 3 groupes expérimentaux (Condition 1, 2, 3) et du groupe contrôle (Condition 1).

Conclusion

L’expérimentation “Agir pour les maths” menée en Grande section de maternelle avait pour objectif d’évaluer l’efficacité d’une intervention qui s’appuie sur le numérique pour la construction  du nombre chez les jeunes enfants. Les deux études à large échelle menées en 2023 et en 2024 montrent un impact positif significatif sur les performances en mathématiques des élèves : les élèves qui participent au programme montrent une amélioration conséquente de leurs compétences en mathématiques par rapport à des élèves suivant un enseignement classique.

Les retours des enseignants sont globalement très positifs. La majorité d’entre eux recommandent fortement l’intervention. 

L’analyse des données en amont et en aval de l’intervention révèle une progression moyenne supérieure de 62% dans les groupes expérimentaux par rapport au groupe contrôle. La taille d’effet, est estimée à environ 27% d’écart type. Bien que les 3 groupes expérimentaux présentent une performance comparable lorsque les élèves sont considérés dans leur globalité indépendamment de leur niveau initial, le groupe 4 – qui allie une utilisation de l’application AxéMaths, des séances de régulation sans tablette et une expérience supérieure des enseignants dans la mise en place du protocole – est celui qui permet le mieux de réduire les inégalités. En effet, les élèves les plus fragiles en début d’intervention y montrent une progression supérieure à celle observée dans les autres groupes.

En conclusion, les résultats de cette étude plaident en faveur d’un usage du numérique au service de la pédagogie dans l’enseignement précoce des mathématiques, en particulier en éducation prioritaire. Dans cette expérimentation, la technologie permet une progression individualisée des élèves et une détection précoce par l’enseignant·e des difficultés rencontrées par ses élèves. 

L’équipe de recherche en charge de cette évaluation d’impact approfondi ses analyses en étudiant les données des évaluations nationales de début et de mi-CP, ce qui permettra d’affiner l’interprétation des résultats et de déterminer l’impact à plus long terme de l’intervention sur les performances des élèves. 

Pour plus d’informations concernant ce projet, merci de contacter Muy-Cheng Peich, déléguée générale d’Agir pour l’école : mcpeich@agirpourlecole.org.

Annexe : Test ENUDIT

Table 1 : Présentation des différents types de questions du test ENUDIT classées par domaine (Partie A : Cardinalité ; Partie B : Ordinalité ; Partie C : Symbolique) et par type de compétences (Coder, Décoder, Comparer, Associer, Anticiper, Calculer).

Nos dernières actualités