L’évaluation dans le système éducatif français : quelques étapes et de nombreux enjeux.

educationaucoeur
30 janv. 2024
13 min de lecture

Intervention d’Alain Boissinot lors du colloque du 7 avril 2023.

Professeur puis Inspecteur général de l’Education nationale, Alain Boissinot a notamment été directeur de l’enseignement scolaire, recteur d’académies et président du Conseil supérieur des programmes.

L’évaluation a fait l’objet d’innombrables débats et travaux. Récemment, une conférence de consensus a été organisée par le Cnesco (Centre national d’étude des systèmes scolaires) sous la houlette d’Agnès Florin et André Tricot. Ses conclusions ont été présentées lors d’une conférence de presse le 15 mars 2023 : l’évaluation, disent-ils, peut être la meilleure et la pire des choses…

L’évaluation en effet est polymorphe et polysémique. Rien que pour le monde éducatif, on évalue les élèves, ou plutôt leurs apprentissages, les personnels, les enseignements, le système dans sa globalité, les établissements, etc.

« Dans tous les domaines de la société, elle est devenue obsédante : on évalue sans cesse, tout acte, tout achat, tout service sont suivis d’une enquête de satisfaction, etc. »

Elle est une préoccupation (relativement) récente, qui se développe dans la seconde partie du XXème siècle, en lien avec la massification du système éducatif et la déstabilisation des formes traditionnelles de l’institution. C’est à la fin des années 70 que Claude Seibel, qui dirige le Service d’informatique de gestion et d’études statistiques (SIGES) du MEN, y crée un bureau de « l’évaluation pédagogique ». Et c’est la loi d’orientation de 1989 qui donne aux enseignants une mission d’évaluation (Art. 14) : « Les enseignants apportent une aide au travail personnel des élèves et en assurent le suivi. Ils procèdent à leur évaluation. » Le rapport annexé précise qu’ils doivent connaître les méthodes d’évaluation.

La naissance de l’obsession évaluative :

« Jusqu’à il y a peu, à l’échelle du temps de l’École, les certitudes étaient telles que le contrôle du respect des normes suffisait au besoin de rassurance des pouvoirs centraux. La prise de conscience de la complexité, la poussée démocratique et individualiste, la mise en cause des institutions et des normes, le besoin institutionnel de se justifier, le doute sur la valeur des décisions prises et leur répercussion sur le réel, ont été à l’origine du développement, d’abord lent, puis tentaculaire de l’évaluation. » (André Hussenet, colloque de l’IREA, 2008)

Tous ces traits doivent être rapprochés et interprétés. Il y a un lien entre évaluation et doute sur les valeurs, qu’on invoque d’autant plus qu’on en est moins certain. La question de l’évaluation est liée aux transformations de l’imaginaire contemporain.

Elle est liée aussi à l’individualisme croissant, au reflux des modèles inspirés par le passé ou par l’avenir, à une société qui vit dans un état de fluidité permanente.

Dans un univers de relative stabilité institutionnelle et idéologique, les actions sont au contraire orientées par la référence et la conformité à des cadres et types établis (un élève type, un professeur type, défini une fois pour toutes par sa réussite à un concours et son « agrégation » à un corps.)

Tout au plus on constate (et on sanctionne) des défaillances par rapport à ce modèle type : pour les élèves, c’est affaire de discipline, notion longtemps centrale, alors que celle d’évaluation est bien plus récente : il n’y a pas d’article Évaluation dans le célèbre Dictionnaire de Ferdinand Buisson, mais il consacre un long article à l’Émulation : on y reviendra.

La montée en puissance de la problématique de l’évaluation est contemporaine de 1968, de la massification du système éducatif (et de l’affaiblissement de ses modèles d’organisation traditionnels), du discrédit de la discipline.

L’ordre et la discipline

Les Frères de la vie commune, dont l’influence à partir des Pays Bas fut essentielle dès la fin du XVe, avaient :

- introduit l’organisation en classes par groupes de niveau (8 classes successives en principe), avec un examen en fin d’année ou de semestre pour passer au niveau suivant (la promotio); il s’agit d’un contrôle de conformité.

- réglé la discipline dans les classes (nombreuses) en la déléguant à des élèves choisis et renouvelés régulièrement, les décurions. Cette logique, visant l’émulation, sera largement reprise ensuite.

Ainsi les collèges jésuites, évoqués par Foucault (Surveiller et punir, 1975). Les classes (200 à 300 élèves) sont divisées en groupes de 10 dirigés par un décurion. Une décurie de « romains » est opposée à une décurie de « carthaginois » : rivalité et émulation sont pensées sur le modèle de la guerre antique. Fin XVIIIe, des classes moins nombreuses commencent à s’organiser en rangs et en places, en espaces réglés et contrôlés : rangs, colonnes, lignes, on retrouve une organisation militaire.

Depuis le XVIIIe, on tend vers une normalisation : « Le Normal s’établit comme principe de coercition dans l’enseignement avec l’instauration d’une éducation standardisée et l’établissement des écoles normales ; il s’établit dans l’effort pour organiser un corps médical et un encadrement hospitalier de la nation susceptibles de faire fonctionner des normes générales de santé ; il s’établit dans la régularisation des procédés et des produits industriels. » (Foucault, op. cit. p. 216). L’examen, avec ses rituels, est au cœur de ces procédures de normalisation.

Songeons aux régimes de sanctions dans les collèges et lycées du XIXème siècle, qui visent la conformité à cet ordre. Ils excluent en principe les châtiments corporels (longtemps pratiqués, ceux-ci tendent à choquer dès la Renaissance et sont interdits par l’arrêté du 10 juin 1803) mais prévoient des privations diverses (de récréation, de sortie, de réfectoire…) pour mettre le coupable à l’écart et vont jusqu’à l’incarcération dans des cellules[1]. Le Louis Lambert de Balzac évoque encore férule et cachot, au collège oratorien de Vendôme à la fin du Premier Empire… Michel Foucault analyse ces processus dans Surveiller et punir.

L’importance de la discipline est liée au fait que longtemps on ne sépare pas éducation et instruction : il s’agit de former globalement des hommes, non de mesurer l’acquisition plus ou moins achevée de compétences.

Ainsi Guizot, dans les débats qui accompagnent la loi de 1833 : « L’instruction morale et religieuse s’associe à l’instruction tout entière, à tous les actes du maître d’école et des enfants… Le développement intellectuel séparé du développement moral et religieux devient un principe d’orgueil, d’insubordination, d’égoïsme, et par conséquent de danger pour la société. »[2]

Le débat sur l’émulation

La notion d’ordre est polysémique : il s’agit de faire régner l’ordre, mais aussi de définir un ordre, une hiérarchie. Le moteur en est l’émulation, qui fait débat à la fin du XIXe siècle. Il faut se reporter à ce sujet au Dictionnaire de F. Buisson, qui entreprend de distinguer la bonne et la mauvaise émulation, dans un article qu’il a rédigé lui-même.

L’émulation pour lui est un sentiment naturel chez l’enfant, qui imite spontanément, et cherche à le faire le mieux possible. C’est là un stimulant dont l’éducation peut se saisir, en encourageant le plaisir qui vient de la difficulté vaincue et de l’approbation d’autrui. L’émulation est donc plus pure que la rivalité : c’est le but à atteindre qui compte plus que les concurrents. Le bonheur d’avoir bien fait est plus important que celui de faire mieux que les autres. Il ne faut pas le dénaturer en développement les classements ou les concours, au risque de développer jalousie et vanité.

La fin de l’article concède que, dans la société adulte, classements et distinctions jouent un grand rôle, qu’on recherche un « rang » dans la société. C’est pourquoi, pour les enfants de la bourgeoisie qui intégreront cette société, l’enseignement secondaire, pour les y préparer, ne peut éviter classements et comparaisons. Mais dans l’enseignement primaire, « dès qu’il s’agit des millions d’enfants de nos écoles primaires qui ne visent à être ni avocats, ni médecins, ni professeurs », il faut s’en tenir à la « bonne » émulation…

Ces distinctions amorcent une évolution et préparent le terrain pour une problématique de l’évaluation.

L’arrêté du 5 juillet 1890, accompagné d’instructions, traite encore la notation dans la perspective de la discipline : elle valorise les efforts et sanctionne la paresse. Mais conformément à l’analyse de F. Buisson, on met en garde contre les « places hebdomadaires ou mensuelles données aux élèves d’après des compositions ». La note permet de valoriser le résultat, quand le classement dévalorise par rapport aux autres. Il s’agit de faire le mieux possible, pas de faire mieux que les autres. Voici ce que les instructions de 1890 disent de la composition : « exercice à faire dans un temps donné et dans des conditions identiques pour tous, le but étant pour chacun non de faire moins mal qu’un rival, mais de faire le mieux possible, d’éprouver ses ressources, son acquis, sa présence d’esprit, d’apprendre à se connaître et à donner sa mesure à l’heure dite. »

On a là l’amorce d’une approche qui s’affirmera dans la circulaire du 6 janvier 1969 (disponible en ligne, et signée par Edgar Faure) qui réforme le système de contrôle des connaissances :

« Les travaux scolaires les plus formateurs sont ceux où la préoccupation de la note s’efface : maître et élèves avancent ensemble dans la découverte d’un texte, d’un raisonnement, d’une expérience scientifique, d’une activité sportive, d’une donnée de géographie humaine, etc., et ce n’est qu’à regret que le fil est interrompu pour permettre les contrôles cependant nécessaires. Une pédagogie véritablement active réussit d’ailleurs, sans difficultés, à inclure le contrôle dans le champ même de l’élaboration des connaissances. Le contrôle permet en effet au maître d’orienter de manière plus efficace les directions de son action. Sans doute l’élève a-t-il besoin de voir son travail apprécié, ses efforts motivés et sa progression jalonnée.

Sans doute les parents comme les autorités scolaires ont-ils le besoin d’informations précises. Il faut cependant éluder l’obsession de la note, presque aussi pernicieuse que l’obsession de la « place », comme l’ont observé depuis longtemps bien des maîtres expérimentés. »

La suite de la circulaire rappelle la relativité des notes, préconise d’abandonner la notation de 0 à 20 au profit d’appréciations plus globales, à 5 niveaux par exemple, et d’éviter de « dramatiser » les notes en renonçant à se focaliser sur les seules « compositions ».

Le Cnesco ne dit pas autre chose, dans son récent rapport, en soulignant que l’évaluation normative, favorisant le classement, « a des effets négatifs sur l’égalité des chances » : certains enfants y sont mieux préparés que d’autres, en arrivent à anticiper l’échec et à s’en rendre responsables ; les stéréotypes (filles/garçons notamment) y jouent un grand rôle et amènent des élèves à sous-performer.

Une forte détermination idéologique

Le débat sur les valeurs et l’évaluation renvoie à des systèmes de représentation très idéologiques.

D’origine religieuse, une conception pessimiste de l’évaluation est souvent liée à une vision négative de la nature humaine marquée par le péché originel. Songeons à Saint Augustin évoquant son enfance : « Cet âge que je ne me rappelle pas avoir vécu (…) j’hésite à le compter dans la vie que je mène en ce siècle. Il est pour moi plongé dans un aussi noir oubli que le temps que j’ai passé dans le ventre de ma mère. » (Confessions, livre 1)

Charles Rollin, au début du XVIIIe, constate: « Il y a dans le cœur de l’homme, depuis sa corruption, une malheureuse fécondité pour le mal (…). Cette pente naturelle au mal est fortifiée le plus souvent dans les jeunes gens par tout ce qui les environne. » (Discours préliminaire à son célèbre Traité des études)

Et Renan : « L’arbre naturel n’a pas de beaux fruits. L’arbre produit de beaux fruits dès qu’il est en espalier, c’est-à-dire dès qu’il n’est plus un arbre. » (Souvenirs d’enfance et de jeunesse)

Georges Vigarello (Le corps redressé. Histoire d’un pouvoir pédagogique,1978) a montré l’importance à l’école et au collège du contrôle du corps, du redressement de la posture (comme on emmaillotait et corsetait les petits enfants). L’éducation est alors un redressement, au sens des maisons de redressement.

S’oppose à ce pessimisme la vision de Rousseau, et l’idée de l’éducation comme épanouissement de potentialités heureuses. Dilemme clairement posé par Michelet, au début de Nos fils (1869) : la liberté de l’homme, revendiquée par la Révolution, s’oppose à sa culpabilité originelle affirmée par l’Église.

La culture professionnelle du primaire a plutôt été marquée par la vision optimiste ; le secondaire, lui, a largement conservé la vision pessimiste.

La prégnance en France de la culture du concours, même quand il s’agit en fait d’examens, participe de cette tradition d’origine religieuse[3]. Ce qui est « normal », c’est qu’il y ait peu de sauvés et une majorité de réprouvés : sinon, c’est qu’on a sacrifié les exigences et accepté une « baisse de niveau ». C’est vrai pour les élèves (« le baccalauréat ne vaut plus rien » si les taux de réussite sont très élevés), mais aussi pour le recrutement des enseignants…

Les finalités et modalités de l’évaluation des élèves

Même si l’on s’intéresse seulement à l’évaluation des apprentissages des élèves, plusieurs distinctions sont nécessaires, et ont été développées dans d’innombrables travaux depuis cinquante ans.

Quel objectif ?

Il faut d’abord distinguer entre une évaluation statistique, qui vise à mesurer l’efficacité d’un système (ou d’un établissement) d’enseignement, qui peut fonctionner par échantillons (cf. PISA), et qui est extérieure à la démarche d’enseignement,

Et une évaluation à finalité pédagogique, qui est liée de façon interne à la démarche d’enseignement, et qui porte sur un élève ou un groupe d’élèves.

En France, on a trop tendance à confondre les deux, et à vouloir faire les deux en même temps.

Quelle typologie ?

Une typologie très utile est celle que propose J.-M. de Ketele (Ne pas se tromper d’évaluation, Revue française de linguistique appliquée, 2010. L’article est disponible en ligne.)

Le tableau de J.-M. de Ketele (voir ci-dessous) reprend les principales distinctions le plus souvent établies, en croisant les fonctions de l’évaluation (pourquoi ?) et ses démarches (comment ?).

Fonction : on peut avoir une visée d’orientation (pour préparer une formation à venir, par ex. choisir une voie de formation, évaluation dite aussi pronostique), ou de régulation (pour améliorer et réguler une action en cours, cf. l’évaluation dite formative), ou de certification (pour certifier socialement une action terminée).

Démarche : elle peut être sommative/normative (on additionne ou soustrait des acquis, des points), descriptive (on identifie par ex. des compétences plus ou moins acquises), ou herméneutique (interprétative) : on construit une hypothèse d’interprétation.

Fondamentalement, le processus d’évaluation ne vise donc pas un jugement, mais sert « à fonder une prise de décision, soit pour préparer une nouvelle action (processus d’orientation), soit pour améliorer une action en cours (évaluation formative ou de régulation), soit pour certifier socialement le résultat d’une action (évaluation certificative) »

Connaissances / compétences

La problématique du curriculum et celle des compétences ont partie liée avec la question de l’évaluation : quelles acquisitions veut-on mettre en évidence ?

C’est un débat plus ancien qu’on ne le croit souvent : cf. le livre de Louis Legrand, Les politiques de l’éducation (1988) et l’ouvrage récent de Philippe Vitale, L’école et les savoirs scolaires (PUR, 2022).

L. Legrand reprend une définition donnée par Jean-Claude Forquin du curriculum : « Un programme d’activités (concernant les enseignants et les élèves) conçu de manière à ce que les élèves atteignent dans toute la mesure du possible certains objectifs éducatifs. » (1987)

Mais il faut se garder d’entrer dans un jeu d’oppositions manichéennes, en sommant de choisir entre connaissances et compétences : il s’agit plutôt de regards différents et sans doute complémentaires sur un même objet. D’ailleurs on imagine mal l’intérêt de connaissances qui ne déboucheraient sur aucune compétence, et inversement de compétences qui n’engageraient aucune connaissance… Le tableau suivant résume les distinctions (in Alain Boissinot, Regards sur l’école, Canopé éditions, 2021) :

*Réfléchir autour des compétences et du curriculum…*	*Réfléchir autour des connaissances et du programme…*
C’est aborder la question de l’enseignement du point de vue de l’élève, engagé dans une démarche active d’apprentissage. La logique est celle d’un système centré sur l’apprenant.	C’est aborder le sujet du point de vue du maître, concevant et mettant en œuvre un projet d’enseignement (le programme). La logique est celle d’un système centré sur l’enseignant.
C’est viser une démarche globale d’acquisition de savoirs, de savoir-faire et de savoir-être. Il s’agit donc d’un projet d’éducation.	C’est définir un projet de « programme » dans un champ qui est celui de savoirs scientifiquement, institutionnellement et historiquement organisés : il s’agit d’instruction plus que d’éducation.
C’est s’inscrire dans une perspective « curriculaire » qui privilégie le parcours de l’élève et dont la visée est globale : il ne s’agit pas seulement des contenus d’enseignement, mais aussi de leur organisation, de leurs modalités, de leur évaluation. Le curriculum, au singulier, vise l’unité et la cohérence du système.	C’est s’inscrire dans les perspectives nécessairement partielles des différentes disciplines (même si cela n’exclut bien sûr pas le souci de leur cohérence). Les programmes, eux, sont par définition pluriels, répartis par disciplines et par niveaux.
C’est poser le problème d’une obligation de résultat (un « savoir garanti » que la société doit permettre à chaque élève réel d’acquérir).	C’est viser plutôt un savoir idéal et un élève théorique, au nom de l’ambition de l’excellence.
C’est s’inscrire dans une logique d’évaluation formative, avec l’ambition de mesurer à différents paliers les progrès de l’élève dans son parcours. En théorie, puisqu’il s’agit de compétences définies comme indispensables, il n’y a pas de compensation possible entre elles : cela n’aurait pas de sens de chercher à faire une « moyenne ».	C’est s’inscrire plutôt dans une logique sommative, mesurant les écarts par rapport à la norme idéale. Dans la mesure où l’on admet qu’il y a plusieurs formes d’excellence, la logique des examens admet la compensation.

Les biais et les risques de l’évaluation

Procédure complexe, qui souvent expose au risque de la confusion des objectifs et de pratiques différentes, l’évaluation pose de nombreux problèmes.

Qu’évalue-t-on ?

Une difficulté est de définir rigoureusement les objets de l’évaluation – et de l’apprentissage. Du coup on a tendance à enseigner ce qu’il paraît aisé d’évaluer. Ainsi le succès de la dictée tient largement à ce que les critères d’appréciation paraissent simples. Mais quid du texte de composition, souvent annoté d’un « mal dit » ou d’un « confus » difficiles à interpréter ? Pour autant, la décomposition des tâches en nombreux items pose des problèmes et risque de brouiller le sens global de l’activité, surtout si l’on se met à bachoter les items. L’expérience des référentiels dans l’enseignement professionnel a mis ce danger en évidence.

Souvent ce qui est évalué reste implicite : on parle à ce sujet de curriculum caché : on évalue autre chose que ce qui est affiché, on poursuit de fait un autre but que celui qui est explicite. Les pratiques de l’école de la Troisième République illustrent bien cet aspect : on sait que les calculs de taux d’intérêt permettent de vanter une morale de l’épargne sous couvert d’entraînement au calcul, et que les textes de dictée ou de récitation, par-delà le contrôle de l’orthographe ou l’exercice de la mémoire, visent souvent à multiplier les anecdotes exemplaires. Voici par exemple un problème posé dans les années 1880[4] :

Un ouvrier mécanicien gagne 9 francs par jour ; chaque semaine, il perd une journée et demie qu’il passe à l’auberge où il dépense en moyenne 5,50 francs par jour. Combien, avec ce qu’il perd pendant cinq années, pourrait-il acheter d’ares de terrain à raison de 2700 francs l’hectare ?

Citons aussi cette dictée qu’un inspecteur général, dans les années 1870, utilisa pour évaluer le niveau de plusieurs centaines d’écoles[5]. Il avait choisi quelques lignes de Fénelon, dont nous avons déjà signalé l’influence durable sur le monde scolaire :

Les arbres s’enfoncent dans la terre par leurs racines comme leurs branches s’élèvent vers le ciel. Leurs racines les défendent contre les vents et vont chercher, comme par de petits tuyaux souterrains, tous les sucs destinés à la nourriture de leur tige. La tige elle-même se revêt d’une dure écorce qui met le bois tendre à l’abri des injures de l’air. Les branches distribuent en divers canaux la sève que les racines avaient réunie dans le tronc.

Faut-il insister sur la façon dont ces « harmonies de la nature », dans un monde encore rural, métaphorisent une vision du monde et de la société familière aux historiens des sciences politiques ?

Le bachotage

On connaît la tendance, attestée dans le monde anglo-saxon par exemple, à bachoter les items des tests, à faire de l’évaluation une fin pédagogique, pour pouvoir afficher de bons résultats. On sait combien les épreuves d’examen surdéterminent les pratiques par rapport aux programmes : on finit par n’enseigner que ce qui risque d’être évalué.

Les biais de l’évaluation

De nombreux travaux ont mis en évidence le rôle de la « constante macabre » (A. Antibi) et d’autres effets de structure. Comment se fait-il, par exemple, que dans un lycée les conseils de classe aboutissent in fine à remplir chaque année les structures préétablies, comme par hasard…

On sait aussi que l’étalement des notes diffère selon les disciplines (éventail plus ouvert en maths ou en dictée qu’en français ou en philosophie, où elles tendent à se regrouper autour de la moyenne). On a mis en évidence les effets séquentiels, selon le niveau des copies voisines, ou le rôle des a priori (sociaux, de genre…) des évaluateurs… De nombreux horizons d’attente biaisent le processus d’évaluation.

Conclusion

Dans son travail récent, le Cnesco souligne lui aussi les diverses fonctions de l’évaluation qui se confondent trop souvent : classer et sélectionner, certifier, aider les élèves.

Pour que l’évaluation soit une aide (« formative »), il faut qu’elle repose sur des critères précis et explicites, qu’il y ait un retour d’information à l’élève sur sa production, que le diagnostic soit expliqué.

L’évaluation doit donc être intégrée dès le début de la conception d’une séquence d’apprentissage. Les critères de réussite doivent être explicites et compréhensibles par tous les élèves. Il faut prévoir des retours d’information centrés sur la tâche (et non sur un jugement de l’élève). Il est utile de prévoir des procédures d’autoévaluation. Il faut rendre compte aux parents de façon claire des acquis et progrès des élèves.

En tout état de cause, il faut réfléchir à une « bonne » évaluation, consciente de ses objectifs et de ses démarches, qui ne prenne pas le pas sur la logique de formation mais en soit un outil, qui ne défasse pas le lien social par la mise en concurrence, au lieu de contribuer à le construire. L’obsession contemporaine de l’évaluation recouvre bien des ambiguïtés…

[1] F. Mayeur, Histoire de l’enseignement et de l’éducation 3, p. 544 sqq.

[2] Cité par F. Mayeur, Histoire de l’enseignement et de l’éducation 3, p.340.

[3] Luc, XIII, 23 : « Quelqu’un lui demanda : Seigneur, n’y aura-t-il que peu qui soient sauvés ? Il leur répondit : Efforcez-vous d’entrer par la porte étroite ; car beaucoup, je vous le dis, chercheront à entrer et ne le pourront pas. »

[4] Cité in V. Troger (dir.), Une histoire de l’Education et de la formation, 2006.

[5] Cette enquête a été étudiée, et reprise un siècle plus tard, par A. Chervel et D. Manesse (La dictée. Les Français et l’orthographe, 1989).

L’évaluation dans le système éducatif français : quelques étapes et de nombreux enjeux.

Posts récents

Comments