Gérard Scallon (1999)
Deuxième révision: mai 2000
Département
des fondements et pratiques en éducation
Faculté des sciences de léducation,
Université Laval
Dans
les écrits francophones européens, on utilise
de plus en plus l'expression "évaluation
certificative". Au Québec, l'adjectif "sommative" a
été adopté d'abord comme traduction
libre du terme anglais. Il a été ainsi
utilisé et toléré comme un
néologisme. Le qualificatif est ambigu et
suggère, à première vue, l'idée
de somme. Était-ce là une façon de
désigner l'évaluation continue qui
procède de plusieurs résultats chiffrés
cumulés en cours de route pour donner une somme ou un
total. Et si on donne à l'évaluation sommative
le sens d'une évaluation terminale, d'autres
problèmes surgissent. L'évaluation sommative,
telle que menée dans le cours de la formation des
individus, peut être à la fois au terme et au
début d'un processus. Par exemple, des
résultats de fin d'année (évaluation
sommative) peuvent servir à l'entrée d'une
autre année pour prescrire des activités de
rattrapage (évaluation diagnostique). Pour l'instant
et pour un certain temps encore, on va se permettre de
qualifier indifféremment l'évaluation de
"sommative" ou de "certificative", tout en étant
conscient que l'évaluation certificative recevra
tôt ou tard ses lettres de noblesse.
Introduction
Pendant de
nombreuses années, le discours de lévaluation des
apprentissages a été confiné aux examens de fin
dannée, comme cela se passait au Québec, avant
1964, au temps du Département de lInstruction publique.
Les préoccupations dordre théorique visaient
particulièrement les instruments de mesure à utiliser
lors de ces moments fatidiques. Il sagissait alors
daccorder le diplôme de fin détude primaire
ou de fin d'étude secondaire ou encore de décider du
passage dun élève d'un degré à
l'autre à l'intérieur d'un même niveau. Sans
aucun doute, lévaluation occupait un espace beaucoup
plus grand mais les procédés utilisés
nétaient pas traités comme ils le sont
aujourdhui.
La reconnaissance
de deux fonctions bien identifiées de lévaluation
nous est venue de Scriven (1967) au regard de
lévaluation des moyens denseignement:
lévaluation formative, pour ce qui est
dajuster les diverses étapes dune démarche
pendant le processus même délaboration dun
produit et lévaluation sommative, pour ce qui est
dattester de la qualité du produit dans sa phase finale.
Cest cette typologie qui a été transposée
par Bloom, Hastings et Madaus (1971) à
lévaluation des apprentissages en y ajoutant une
fonction reconnue de longue date: lévaluation
diagnostique.
Un
parallèle entre deux applications de la même
typologie
En premier
lieu, il apparaît intéressant de dresser un
parallèle entre la notion dévaluation sommative
telle quentendue par Scriven et celle qui a été
transposée à lévaluation des
apprentissages. Dans lesprit de Scriven, et cela est
très vraisemblable, lévaluation sommative
survient au moment où lélaboration dun
produit (programme détude ou programme
dintervention) est complètement terminée. En
poursuivant lidée de lauteur, on peut penser
à un rapport définitif décrivant un projet ,
acheminé en plusieurs exemplaires imprimés à des
autorités compétentes. Aucune retouche nest
envisagée et la décision sera prise daccepter le
projet en tout ou en partie ou encore de le refuser globalement .
Ces caractères de "terminal" et de "définitif" de
lobjet de lévaluation sommative émergent
avec assez dévidence de la position de Scriven. Mais il
y a plus! Les auteurs du projet tel que décrit dans notre
exemple, c'est-à-dire les responsables de son
élaboration, qui y ont participé, qui ont
réalisé en cours de route les correctifs qui
simposaient (évaluation formative) ne sont pas les
mêmes (ou ne devraient pas être les mêmes) que ceux
qui sont responsables de lévaluation sommative.
Lorsque lobjet de lévaluation sommative est
lapprentissage, la transposition de la typologie de Scriven
nest pas aussi simple quelle nen paraît. On
doit comprendre que Bloom, Hastings et Madaus (1971) devaient avoir
pour souci que lévaluation sommative des apprentissages
puisse saccorder à une pratique qu'ils connaissaient
déjà et par laquelle des prises dinformation sont
réalisées bien avant que lon ait un produit fini,
définitif. Sinon, lévaluation sommative
surviendrait à la toute fin de la formation des individus,
lorsque ceux-ci atteignent un âge très
avancé.
Une
transposition non réussie
Les deux
caractères de la typologie de Scriven ne se prêtent pas
facilement à l'évaluation des apprentissages ou
à celle des élèves.
Dans le monde scolaire en général, on a confié aux enseignants la double responsabilité de lévaluation formative et de lévaluation sommative. Cest un premier sujet de réflexion que dexaminer de près sil y a là un conflit dintérêts!
a.- Cest aussi une position traditionnelle qui relève de
lévaluation continue.
SCRIVEN
BLOOM
et al.a
est fini
lév. formative
év. form. et év. som.
En
bref, lévaluation sommative des apprentissages ne peut
renvoyer à une pratique dévaluation exclusivement
terminale et les enseignants ne peuvent être
dégagés des responsabilités qui sy
rattachent. Lévaluation sommative continue et la
responsabilité des enseignants sont deux aspects qui demandent
à être justifiés.
Précisions
additionnelles au sujet de l'évaluation sommative
terminale
Rappelons
que cette pratique se reconnaît à l'utilisation
d'examens de fin d'année (ou de fin de programme si c'est la
période de temps considérée). Examens, travaux,
exercices passés en cours d'année ou en cours de
période ne comptent pratiquement pas. Le sort des individus,
leur attestation d'étude ou leur diplôme
dépendent presque exclusivement de leur performance à
l'examen terminal. Cette pratique soulève de nombreuses
difficultés que corrige l'évaluation sommative continue
dont il sera question à la section suivante. Cette
évaluation terminale n'a pas que des côtés
négatifs. Elle intéresse ceux et celles qui veulent
à tout prix obtenir
un portrait récent
de chaque individu tel qu'il se présente au terme d'une
longue période de formation. C'est là un avantage
très recherché que ne possède pas
l'évaluation continue cumulative qui rassemble, en un total
arithmétique, une multitude de portraits plus ou moins
lointains. L'idée de portrait récent refait de plus en
plus surface avec l'approche par compétences.
1.-
À la défense de lévaluation sommative
continue
Si, par
rapport à une longue période de formation ou
denseignement et dapprentissage, lévaluation
sommative était rigoureusement terminale, on
sapprocherait alors substantiellement du concept
dévaluation sommative tel quentendu par Scriven au
regard de lévaluation des moyens denseignement.
Tel nest pas le cas et nombre de systèmes
éducatifs ont adopté, depuis longtemps, une pratique
dévaluation continue dont la raison dêtre
semble se perdre dans la nuit des temps. La notion même
dévaluation continue a été traitée
pour la première fois, de façon directe, dans un
ouvrage de De Landsheere paru en 1974. Plusieurs auteurs
américains y ont fait également allusion. Pour appuyer
cette pratique on trouve essentiellement trois ordres de
justifications.
Éviter le bachotage (ou la procrastination).
Assurer un meilleur échantillonnage des éléments dobservation.
Réduire lanxiété
En bref, lévaluation sommative qui serait menée
de façon rigoureusement terminale comporte plusieurs effets
pervers tant chez les élèves que du point de vue
métrologique (qualités des instruments
utilisés), effets qui semblent être corrigés par
une pratique d'évaluation continue.
2.-
Impliquer les enseignants dans lévaluation sommative
Lévaluation
sommative des apprentissages serait-elle mieux servie si elle
était réservée à des experts, à
des personnes qui sy consacreraient pleinement ou encore si
elle était sous la responsabilités de personnes autres
que les enseignants?
On laisserait
ainsi plus de temps aux enseignants pour soccuper
denseignement, dapprentissage ou de formation tout en
évitant quelque conflit dintérêt. La
question ne se pose pas avec lévaluation formative et le
problème soulevé touche principalement
lévaluation sommative.
Il ny a pas de réponse "tout ou rien" à la
question soulevée. Au Québec, le ministère de
lÉducation intervient dans plusieurs programmes
détude du primaire et du secondaire avec des
épreuves uniques (secondaire), des épreuves
obligatoires de fins de cycle et des épreuves dappoint.
Ce sont là des pratiques dévaluation "sommative"
(utilisons encore le terme pour linstant) dont la source est
externe par rapport à une classe ou à une école.
La responsabilité est partagée avec les
établissements scolaires, ce qui amène une part de
responsabilité assumée par les enseignants. Le portrait
à dresser est loin dêtre négatif et ce,
pour les raisons suivantes.
1.- Les enseignants connaissent bien leurs
élèves et sont plus en mesure que dautres
professionnels de porter des jugements éclairés,
notamment pour ce qui est du passage dun degré scolaire
à un autre ou du passage du primaire au secondaire.
2.- Les enseignants de plusieurs établissements
scolaires (notamment au Québec) sont encadrés
(équipes disciplinaires) pour réaliser
lévaluation sommative. Ils ont accès à des
guides dévaluation, à des modèles
dinstruments, voire à des recueils déjà
prêts à être utilisés (p. ex., la Banque
dinstruments de mesure (BIM) produite par la
Société GRICS).
3.- Enfin, les programmes détudes doivent
être transposés en activités quotidiennes
à faire vivre aux élèves, ce qui amène
des adaptations inévitables de lévaluation
pédagogique à toutes sortes de circonstances. Par
rapport à une source externe, et de ce point de vue,
lenseignant demeure la personne la plus compétente pour
assumer une bonne part de lévaluation sommative.
Les
buts multiples de lévaluation sommative
Il ne
faudrait pas penser que la fonction sommative de
lévaluation renvoie à une façon
stéréotypée voire unique de faire les choses.
Les examens à visée sommative, quils soient pris
isolément ou groupés ensemble dans une pratique
dévaluation continue, peuvent servir à diverses
fins. Bloom, Hastings et Madaus (1971) et Bloom, Madaus et Hastings
(1981) ont été les premiers à le
reconnaître. Voici les buts spécifiques pour lesquels on
utilise des examens dits sommatifs dans lesprit de ces auteurs
(1981, pages 88-93).
Jusquici,
cest lélève qui est objet
dévaluation. Dans certains cas, le but de
lévaluation sommative peut être de comparer des
groupes délèves quant aux apprentissages
réalisés. Cest le groupe qui devient alors objet
dévaluation.
Il est important de signaler que la préparation des
instruments doit être adaptée à chacun de ces
buts. Dans certains cas, on doit chercher à amplifier les
différences individuelles à cause de lapproche
normative. En dautres cas il faudra découper les
objectifs dun cours de façon telle que lon puisse
déterminer un point dentrée significatif. Enfin,
lattestation de compétences exige une définition
claire des objectifs dapprentissage visés par la
démarche dévaluation (voir Bloom, Madaus et
Hastings, 1981, p. 93).
Dans un article traitant dinstrumentation à développer pour diverses fonctions de lévaluation, Cardinet (1984) a décrit diverses formes de bilans dont la généralité est plus grande que ceux établis en évaluation formative. Il apparaît donc que ces bilans intéressent la méthodologie de lévaluation sommative. En voici quelques uns qui ont été décrits par lauteur:
Dun point de
vue plus technique, Cardinet (1986) a identifié deux bases
distinctes pour la certification. Si lon veut rendre compte
dapprentissages relevant dun programme officiel
("formation définie à lavance"), on parlera
dévaluation par objectifs. Si on veut
apprécier une formation obtenue en dehors des programmes
officiels, on parlera de reconnaissance des acquis. Ce sont
deux perspectives distinctes pour lévaluation sommative
et lauteur a fait état de nombreuses difficultés
qui leur sont spécifiques et qui doivent être
surmontées. Signalons que cest dans le contexte de la
reconnaissance des acquis, lorsquun adulte reprend la route de
lécole ou quun élève dune
classe régulière change détablissement que
survient la notion de "passeport de formation" ou de "portefeuille de
compétences".
La
justification de lappellation "certificative"
Dans un
article documenté sur le sujet, et à linstar de
plusieurs auteurs qui lont précédé,
Tourneur (1985) préconise lappellation
"évaluation certificative". Lauteur affirme que, de tous
les buts reconnus de lévaluation sommative (notation,
attestation, feed-back, etc.), la certification des
compétences constitue son rôle le plus spécifique
et le plus important. (p. 11). Il y aurait donc là
lexplication dorigine de lexpression
"évaluation certificative".
Tourneur reconnaît deux fonctions principales que remplit la
certification: une fonction externe et une fonction interne. La
certification
externe
sintéresse aux compétences telles quon veut
les voir démontrer au terme de la formation et telles que
reliées à la vie sociale et au monde professionnel. La
certification
interne
vise à attester les apprentissages à divers moments,
dans le but de sassurer que la personne est en mesure de
progresser dans sa formation.
En considérant plusieurs points de vue, Tourneur a
dressé un parallèle entre les deux fonctions, sous
forme de tableau. On voit bien que les décisions ne sont pas
les mêmes. En certification interne, il sagit
dadmettre létudiant dans une classe, un cycle ou
dans une formation subséquente. En certification externe, il
sagit daccorder un diplôme (électricien,
ajusteur, médecin, pour prendre les exemples de
lauteur). Du point de vue des objets souhaitables de la mesure,
il y a aussi des différences importantes entre les deux
fonctions. En certification interne, ce sont les objectifs
intermédiaires et terminaux dintégration (un
concept introduit par De Ketele en 1983) qui sont visés. En
certification externe, ce sont des situations réelles ou
simulées (représentatives de la profession). Nous nous
approchons ici de
lauthentic
assessment
des auteurs
américains.
En
conclusion
Dans
les ouvrages anglo-saxons, lévaluation sommative est de
moins en moins évoquée. Nombre dauteurs font
maintenant allusion à la notion dassessment
et plus particulièrement à celle
dauthentic
assessment
à la suite des travaux de Wiggins (1989). Là encore, on
sent un certain malaise à conserver le vocabulaire de
lévaluation sommative. Lassessment est une
entreprise beaucoup plus englobante, beaucoup plus complexe et repose
sur une multiplicité de procédés de collecte
dinformations. Le terme nest pas facile à traduire
et le mot "appréciation"
a été quelque fois utilisé dans les textes
francophones. Cest trop peu pour dégager une tendance
manifeste.
Ce quil faut retenir de cet exposé, cest que
lévaluation sommative renvoie à une multitude de
fonctions qui ne doivent pas être confondues à celle qui
est caractéristique de lévaluation formative.
Lorsque menée en cours de formation, son caractère
"sommatif", entendu dans le sens rigoureux du terme, disparaît
quelque peu pour faire place à des usages qui la rapprochent
de lévaluation formative. Il ne sagit pas de se
substituer à cette dernière mais dentretenir avec
elle des liens de complémentarité. Limportant est
de maintenir le cap sur la qualité de la formation et sur la
justesse des décisions à prendre pour faire progresser
les individus.
Bloom, B. S., Hastings, J. T. & Madaus, G. F. (1971). Handbook on Formative and Summative Evaluation of Student Learning. New York: McGraw-Hill Book. Co.
Bloom, B. S., Madaus, G. F. & Hastings, J. T. (1981). Evaluation to Improve Learning. New York: McGraw-Hill Book. Co.
Cardinet, J. (1984). Des instruments dévaluation pour chaque fonction. Mesure et évaluation en éducation, 8 (1 et 2), 45-118.
Cardinet, J. (1986). De nouvelles bases pour la certification. Neuchâtel: Institut romand de recherches et de documentation pédagogiques (Recherches 86.112).
De Ketele, J. M. (1983). Objectif et évaluation: comparaison et confrontation de quelques terminologies utilisées. Louvain-la-Neuve: Laboratoire de Pédagogie expérimentale.
De Landsheere, G. (1974). Évaluation continue et examens. Précis de docimologie (3e édition). Bruxelles-Paris: Labor-Nathan.
Scriven, M. (1967). The Methodology of Evaluation, In Perspectives of Curriculum Evaluation. (A.E.R.A. Monograph Series on Curriculum Evaluation, no 1). Chicago: Rand McNally.
Société GRICS. (1999). Banque dInstruments de Mesure (BIM). Adresse Internet: http://www.grics.qc.ca
Tourneur, Y. (1985). La certification des compétences. Mesure et évaluation en éducation, 7(4), 9-20.
Wiggins, G. (1989). Teaching to the (authentic) test. Educational Leadership. 46(7), 41-47.