L’évaluation sommative
et ses rôles multiples

Gérard Scallon (1999)

Deuxième révision: mai 2000

Département des fondements et pratiques en éducation
Faculté des sciences de l’éducation, Université Laval 

Dans les écrits francophones européens, on utilise de plus en plus l'expression "évaluation certificative". Au Québec, l'adjectif "sommative" a été adopté d'abord comme traduction libre du terme anglais. Il a été ainsi utilisé et toléré comme un néologisme. Le qualificatif est ambigu et suggère, à première vue, l'idée de somme. Était-ce là une façon de désigner l'évaluation continue qui procède de plusieurs résultats chiffrés cumulés en cours de route pour donner une somme ou un total. Et si on donne à l'évaluation sommative le sens d'une évaluation terminale, d'autres problèmes surgissent. L'évaluation sommative, telle que menée dans le cours de la formation des individus, peut être à la fois au terme et au début d'un processus. Par exemple, des résultats de fin d'année (évaluation sommative) peuvent servir à l'entrée d'une autre année pour prescrire des activités de rattrapage (évaluation diagnostique). Pour l'instant et pour un certain temps encore, on va se permettre de qualifier indifféremment l'évaluation de "sommative" ou de "certificative", tout en étant conscient que l'évaluation certificative recevra tôt ou tard ses lettres de noblesse.

 

Introduction
Pendant de nombreuses années, le discours de l’évaluation des apprentissages a été confiné aux examens de fin d’année, comme cela se passait au Québec, avant 1964, au temps du Département de l’Instruction publique. Les préoccupations d’ordre théorique visaient particulièrement les instruments de mesure à utiliser lors de ces moments fatidiques. Il s’agissait alors d’accorder le diplôme de fin d’étude primaire ou de fin d'étude secondaire ou encore de décider du passage d’un élève d'un degré à l'autre à l'intérieur d'un même niveau. Sans aucun doute, l’évaluation occupait un espace beaucoup plus grand mais les procédés utilisés n’étaient pas traités comme ils le sont aujourd’hui.

La reconnaissance de deux fonctions bien identifiées de l’évaluation nous est venue de Scriven (1967) au regard de l’évaluation des moyens d’enseignement: l’évaluation formative, pour ce qui est d’ajuster les diverses étapes d’une démarche pendant le processus même d’élaboration d’un produit et l’évaluation sommative, pour ce qui est d’attester de la qualité du produit dans sa phase finale. C’est cette typologie qui a été transposée par Bloom, Hastings et Madaus (1971) à l’évaluation des apprentissages en y ajoutant une fonction reconnue de longue date: l’évaluation diagnostique.


Un parallèle entre deux applications de la même typologie
En premier lieu, il apparaît intéressant de dresser un parallèle entre la notion d’évaluation sommative telle qu’entendue par Scriven et celle qui a été transposée à l’évaluation des apprentissages. Dans l’esprit de Scriven, et cela est très vraisemblable, l’évaluation sommative survient au moment où l’élaboration d’un produit (programme d’étude ou programme d’intervention) est complètement terminée. En poursuivant l’idée de l’auteur, on peut penser à un rapport définitif décrivant un projet , acheminé en plusieurs exemplaires imprimés à des autorités compétentes. Aucune retouche n’est envisagée et la décision sera prise d’accepter le projet en tout ou en partie ou encore de le refuser globalement .

Ces caractères de "terminal" et de "définitif" de l’objet de l’évaluation sommative émergent avec assez d’évidence de la position de Scriven. Mais il y a plus! Les auteurs du projet tel que décrit dans notre exemple, c'est-à-dire les responsables de son élaboration, qui y ont participé, qui ont réalisé en cours de route les correctifs qui s’imposaient (évaluation formative) ne sont pas les mêmes (ou ne devraient pas être les mêmes) que ceux qui sont responsables de l’évaluation sommative.

Lorsque l’objet de l’évaluation sommative est l’apprentissage, la transposition de la typologie de Scriven n’est pas aussi simple qu’elle n’en paraît. On doit comprendre que Bloom, Hastings et Madaus (1971) devaient avoir pour souci que l’évaluation sommative des apprentissages puisse s’accorder à une pratique qu'ils connaissaient déjà et par laquelle des prises d’information sont réalisées bien avant que l’on ait un produit fini, définitif. Sinon, l’évaluation sommative surviendrait à la toute fin de la formation des individus, lorsque ceux-ci atteignent un âge très avancé.


Une transposition non réussie
Les deux caractères de la typologie de Scriven ne se prêtent pas facilement à l'évaluation des apprentissages ou à celle des élèves.

Dans le monde scolaire en général, on a confié aux enseignants la double responsabilité de l’évaluation formative et de l’évaluation sommative. C’est un premier sujet de réflexion que d’examiner de près s’il y a là un conflit d’intérêts!

 

PARALLÈLE: l’évaluation sommative selon...

 

 


SCRIVEN

BLOOM et al.a
objet:
moyens d’enseignement
apprentissages
moment:
lorsque le produit
est fini
pendant et à la fin de la période de formation
responsables:
autres que ceux de
l’év. formative
les mêmes:
év. form. et év. som.
a.- C’est aussi une position traditionnelle qui relève de l’évaluation continue.

En bref, l’évaluation sommative des apprentissages ne peut renvoyer à une pratique d’évaluation exclusivement terminale et les enseignants ne peuvent être dégagés des responsabilités qui s’y rattachent. L’évaluation sommative continue et la responsabilité des enseignants sont deux aspects qui demandent à être justifiés.



Précisions additionnelles au sujet de l'évaluation sommative terminale
Rappelons que cette pratique se reconnaît à l'utilisation d'examens de fin d'année (ou de fin de programme si c'est la période de temps considérée). Examens, travaux, exercices passés en cours d'année ou en cours de période ne comptent pratiquement pas. Le sort des individus, leur attestation d'étude ou leur diplôme dépendent presque exclusivement de leur performance à l'examen terminal. Cette pratique soulève de nombreuses difficultés que corrige l'évaluation sommative continue dont il sera question à la section suivante. Cette évaluation terminale n'a pas que des côtés négatifs. Elle intéresse ceux et celles qui veulent à tout prix obtenir un portrait récent de chaque individu tel qu'il se présente au terme d'une longue période de formation. C'est là un avantage très recherché que ne possède pas l'évaluation continue cumulative qui rassemble, en un total arithmétique, une multitude de portraits plus ou moins lointains. L'idée de portrait récent refait de plus en plus surface avec l'approche par compétences.

 

1.- À la défense de l’évaluation sommative continue
Si, par rapport à une longue période de formation ou d’enseignement et d’apprentissage, l’évaluation sommative était rigoureusement terminale, on s’approcherait alors substantiellement du concept d’évaluation sommative tel qu’entendu par Scriven au regard de l’évaluation des moyens d’enseignement. Tel n’est pas le cas et nombre de systèmes éducatifs ont adopté, depuis longtemps, une pratique d’évaluation continue dont la raison d’être semble se perdre dans la nuit des temps. La notion même d’évaluation continue a été traitée pour la première fois, de façon directe, dans un ouvrage de De Landsheere paru en 1974. Plusieurs auteurs américains y ont fait également allusion. Pour appuyer cette pratique on trouve essentiellement trois ordres de justifications.

• Éviter le bachotage (ou la procrastination).

Dans un contexte où l’évaluation (officielle) est terminale, certains élèves ont tendance à remettre à la toute fin, presque à la veille des examens, le travail et les efforts qu’ils auraient du répartir tout au long de la période d’enseignement et d’apprentissage.

• Assurer un meilleur échantillonnage des éléments d’observation.

Pour ce qui est de l’éventail des questions ou problèmes à poser ou des tâches complexes à faire accomplir comme procédés d’évaluation, on ne peut comparer ce que peut contenir un seul examen terminal et plusieurs examens partiels disséminés en cours de route. En évaluation continue, le temps d’examen et l’échantillonnage des questions sont substantiellement plus élevés que ceux que l’on pourrait associer à un examen terminal. C’est sans doute dans le cadre de ce raisonnement que l’on peut miser sur les deux à la fois dans une pratique d’évaluation continue: examens partiels coiffés d’un examen terminal.

• Réduire l’anxiété

Le fait de savoir que le passage d’un degré à l’autre ou l’obtention d’un diplôme sont tributaires d’un seul examen terminal est une source importante d’anxiété pour plusieurs élèves, et fort probablement une source de démotivation. Dans une succession d’examens partiels les résultats obtenus sont souvent les signes avant-coureurs d’un échec tout en étant des stimulants pour apporter des correctifs dont les résultats seront connus lors d’examens partiels subséquents. L’effet surprise est réduit d’autant.


En bref, l’évaluation sommative qui serait menée de façon rigoureusement terminale comporte plusieurs effets pervers tant chez les élèves que du point de vue métrologique (qualités des instruments utilisés), effets qui semblent être corrigés par une pratique d'évaluation continue.


2.- Impliquer les enseignants dans l’évaluation sommative
L’évaluation sommative des apprentissages serait-elle mieux servie si elle était réservée à des experts, à des personnes qui s’y consacreraient pleinement ou encore si elle était sous la responsabilités de personnes autres que les enseignants? On laisserait ainsi plus de temps aux enseignants pour s’occuper d’enseignement, d’apprentissage ou de formation tout en évitant quelque conflit d’intérêt. La question ne se pose pas avec l’évaluation formative et le problème soulevé touche principalement l’évaluation sommative.
Il n’y a pas de réponse "tout ou rien" à la question soulevée. Au Québec, le ministère de l’Éducation intervient dans plusieurs programmes d’étude du primaire et du secondaire avec des épreuves uniques (secondaire), des épreuves obligatoires de fins de cycle et des épreuves d’appoint. Ce sont là des pratiques d’évaluation "sommative" (utilisons encore le terme pour l’instant) dont la source est externe par rapport à une classe ou à une école. La responsabilité est partagée avec les établissements scolaires, ce qui amène une part de responsabilité assumée par les enseignants. Le portrait à dresser est loin d’être négatif et ce, pour les raisons suivantes.

1.- Les enseignants connaissent bien leurs élèves et sont plus en mesure que d’autres professionnels de porter des jugements éclairés, notamment pour ce qui est du passage d’un degré scolaire à un autre ou du passage du primaire au secondaire.
2.- Les enseignants de plusieurs établissements scolaires (notamment au Québec) sont encadrés (équipes disciplinaires) pour réaliser l’évaluation sommative. Ils ont accès à des guides d’évaluation, à des modèles d’instruments, voire à des recueils déjà prêts à être utilisés (p. ex., la Banque d’instruments de mesure (BIM) produite par la Société GRICS).
3.- Enfin, les programmes d’études doivent être transposés en activités quotidiennes à faire vivre aux élèves, ce qui amène des adaptations inévitables de l’évaluation pédagogique à toutes sortes de circonstances. Par rapport à une source externe, et de ce point de vue, l’enseignant demeure la personne la plus compétente pour assumer une bonne part de l’évaluation sommative.



Les buts multiples de l’évaluation sommative
Il ne faudrait pas penser que la fonction sommative de l’évaluation renvoie à une façon stéréotypée voire unique de faire les choses. Les examens à visée sommative, qu’ils soient pris isolément ou groupés ensemble dans une pratique d’évaluation continue, peuvent servir à diverses fins. Bloom, Hastings et Madaus (1971) et Bloom, Madaus et Hastings (1981) ont été les premiers à le reconnaître. Voici les buts spécifiques pour lesquels on utilise des examens dits sommatifs dans l’esprit de ces auteurs (1981, pages 88-93).

Jusqu’ici, c’est l’élève qui est objet d’évaluation. Dans certains cas, le but de l’évaluation sommative peut être de comparer des groupes d’élèves quant aux apprentissages réalisés. C’est le groupe qui devient alors objet d’évaluation.
Il est important de signaler que la préparation des instruments doit être adaptée à chacun de ces buts. Dans certains cas, on doit chercher à amplifier les différences individuelles à cause de l’approche normative. En d’autres cas il faudra découper les objectifs d’un cours de façon telle que l’on puisse déterminer un point d’entrée significatif. Enfin, l’attestation de compétences exige une définition claire des objectifs d’apprentissage visés par la démarche d’évaluation (voir Bloom, Madaus et Hastings, 1981, p. 93).

Dans un article traitant d’instrumentation à développer pour diverses fonctions de l’évaluation, Cardinet (1984) a décrit diverses formes de bilans dont la généralité est plus grande que ceux établis en évaluation formative. Il apparaît donc que ces bilans intéressent la méthodologie de l’évaluation sommative. En voici quelques uns qui ont été décrits par l’auteur:

D’un point de vue plus technique, Cardinet (1986) a identifié deux bases distinctes pour la certification. Si l’on veut rendre compte d’apprentissages relevant d’un programme officiel ("formation définie à l’avance"), on parlera d’évaluation par objectifs. Si on veut apprécier une formation obtenue en dehors des programmes officiels, on parlera de reconnaissance des acquis. Ce sont deux perspectives distinctes pour l’évaluation sommative et l’auteur a fait état de nombreuses difficultés qui leur sont spécifiques et qui doivent être surmontées. Signalons que c’est dans le contexte de la reconnaissance des acquis, lorsqu’un adulte reprend la route de l’école ou qu’un élève d’une classe régulière change d’établissement que survient la notion de "passeport de formation" ou de "portefeuille de compétences".



La justification de l’appellation "certificative"
Dans un article documenté sur le sujet, et à l’instar de plusieurs auteurs qui l’ont précédé, Tourneur (1985) préconise l’appellation "évaluation certificative". L’auteur affirme que, de tous les buts reconnus de l’évaluation sommative (notation, attestation, feed-back, etc.), la certification des compétences constitue son rôle le plus spécifique et le plus important. (p. 11). Il y aurait donc là l’explication d’origine de l’expression "évaluation certificative".
Tourneur reconnaît deux fonctions principales que remplit la certification: une fonction externe et une fonction interne. La
certification externe s’intéresse aux compétences telles qu’on veut les voir démontrer au terme de la formation et telles que reliées à la vie sociale et au monde professionnel. La certification interne vise à attester les apprentissages à divers moments, dans le but de s’assurer que la personne est en mesure de progresser dans sa formation.
 En considérant plusieurs points de vue, Tourneur a dressé un parallèle entre les deux fonctions, sous forme de tableau. On voit bien que les décisions ne sont pas les mêmes. En certification interne, il s’agit d’admettre l’étudiant dans une classe, un cycle ou dans une formation subséquente. En certification externe, il s’agit d’accorder un diplôme (électricien, ajusteur, médecin, pour prendre les exemples de l’auteur). Du point de vue des objets souhaitables de la mesure, il y a aussi des différences importantes entre les deux fonctions. En certification interne, ce sont les objectifs intermédiaires et terminaux d’intégration (un concept introduit par De Ketele en 1983) qui sont visés. En certification externe, ce sont des situations réelles ou simulées (représentatives de la profession). Nous nous approchons ici de
l’authentic assessment des auteurs américains.



En conclusion

Dans les ouvrages anglo-saxons, l’évaluation sommative est de moins en moins évoquée. Nombre d’auteurs font maintenant allusion à la notion d’assessment et plus particulièrement à celle d’authentic assessment à la suite des travaux de Wiggins (1989). Là encore, on sent un certain malaise à conserver le vocabulaire de l’évaluation sommative. L’assessment est une entreprise beaucoup plus englobante, beaucoup plus complexe et repose sur une multiplicité de procédés de collecte d’informations. Le terme n’est pas facile à traduire et le mot "appréciation" a été quelque fois utilisé dans les textes francophones. C’est trop peu pour dégager une tendance manifeste.

Ce qu’il faut retenir de cet exposé, c’est que l’évaluation sommative renvoie à une multitude de fonctions qui ne doivent pas être confondues à celle qui est caractéristique de l’évaluation formative. Lorsque menée en cours de formation, son caractère "sommatif", entendu dans le sens rigoureux du terme, disparaît quelque peu pour faire place à des usages qui la rapprochent de l’évaluation formative. Il ne s’agit pas de se substituer à cette dernière mais d’entretenir avec elle des liens de complémentarité. L’important est de maintenir le cap sur la qualité de la formation et sur la justesse des décisions à prendre pour faire progresser les individus.

RÉFÉRENCES

Bloom, B. S., Hastings, J. T. & Madaus, G. F. (1971). Handbook on Formative and Summative Evaluation of Student Learning. New York: McGraw-Hill Book. Co.

Bloom, B. S., Madaus, G. F. & Hastings, J. T. (1981). Evaluation to Improve Learning. New York: McGraw-Hill Book. Co.

Cardinet, J. (1984). Des instruments d’évaluation pour chaque fonction. Mesure et évaluation en éducation, 8 (1 et 2), 45-118.

Cardinet, J. (1986). De nouvelles bases pour la certification. Neuchâtel: Institut romand de recherches et de documentation pédagogiques (Recherches 86.112).

De Ketele, J. M. (1983). Objectif et évaluation: comparaison et confrontation de quelques terminologies utilisées. Louvain-la-Neuve: Laboratoire de Pédagogie expérimentale.

De Landsheere, G. (1974). Évaluation continue et examens. Précis de docimologie (3e édition). Bruxelles-Paris: Labor-Nathan.

Scriven, M. (1967). The Methodology of Evaluation, In Perspectives of Curriculum Evaluation. (A.E.R.A. Monograph Series on Curriculum Evaluation, no 1). Chicago: Rand McNally.

Société GRICS. (1999). Banque d’Instruments de Mesure (BIM). Adresse Internet: http://www.grics.qc.ca

Tourneur, Y. (1985). La certification des compétences. Mesure et évaluation en éducation, 7(4), 9-20.

Wiggins, G. (1989). Teaching to the (authentic) test. Educational Leadership. 46(7), 41-47.