INTERPRÉTATION normative / critériée
(l'expression «critérielle» est utilisée
dans plusieurs écrits européens
)

Un résultat de mesure, comme tel, n'a aucune signification pour celui ou celle qui le reçoit comme information. Par exemple, un score de 53 bonnes réponses à un examen de fin d'année en chimie n'a aucune signification, pour l'instant. Pas plus que la taille d'un « martien » qui mesurerait 142 XBZ (l'unité de longueur sur Mars!). Il ne faut pas confondre ces situations pures avec celles où la personne qui reçoit l'information connaît déjà quelque chose du domaine visé. Ainsi, le fait de savoir qu'une personne est âgée de 112 ans (résultat de mesure) est suffisant pour dire qu'elle se situe parmi les personnes les plus âgées (interprétation spontanée réalisée par la personne qui reçoit le résultat de mesure).

En sciences humaines, et particulièrement en éducation, c'est différent. Un score brut à un examen de rendement scolaire ne correspond pas à une quantité d'unités connues. Un score «attitude», comme autre exemple, c'est-à-dire la somme des degrés d'accord avec des énoncés justifiant une cause, non plus. Chaque instrument possède ses particularités. En plus de l'absence d'unité connue, si ce n'est l'absence d'unité tout court lorsque les éléments additionnés sont d'inégales valeurs, l'amplitude ou la variation des résultats nous est tout aussi inconnue dans chacun des cas. Pour le non initié, il est donc difficile d'interpréter ce genre de résultat et de le situer dans un cadre de référence. Un score de 45 sur 60 correspond-il à un bon résultat ou à un résultat médiocre. Est-il l'indice d'un certain degré de maîtrise de ce qui est visé par l'instrument? Il revient à la personne qui a conçu l'instrument ou qui l'a utilisé dans des circonstances dont elle est témoin de nous aider à se prononcer, c'est-à-dire à nous guider dans l'interprétation.

Dans le domaine du rendement scolaire, celui de l'évaluation des apprentissages, il y a essentiellement deux approches pour donner une signification à un résultat ou à un pseudo-résultat de mesure: l'une est dite normative, l'autre est dite critériée.

 

L'interprétation normative

L'approche normative consiste à situer chaque résultat de mesure dans un ensemble de résultats. Le procédé le plus simple est la mise en rangs, du premier score au dernier, après avoir disposé les scores en ordre décroissant. Par exemple, un élève ayant obtenu le score 38 peut occuper le rang 11 dans une classe de 30 élèves. L'interprétation normative se réalise ici par l'attribution d'un rang simple à chaque score brut observé. Il existe d'autres modalités telles les rangs cinquièmes (subdivision du groupe d'élèves en sous-groupes composés «idéalement» de 20% d'élèves) ou encore les rangs centiles. En interprétation normative, le rang occupé par un élève dépend de ses habiletés, mais aussi de la force du groupe auquel il appartient. De plus, la valeur de l'interprétation normative tient à la connaissance que l'on a du groupe de référence et de sa taille. Les psychométriciens ont élaboré des tables de conversion de scores bruts en rangs, en déterminant des groupes d'individus bien identifiés (niveau socio-économique, sexe, âge, etc.). C'est ce qu'on appelle des normes (d'où l'expression interprétation normative).

 

L'interprétation critériée (ou critérielle)

L'approche critériée est plus récente et a été introduite par Glaser (1962) pour définir un procédé de quantification dont le but essentiel est de décrire le plus exactement possible ce dont un élève est capable. Dans les ouvrages antérieurs, ce type d'interprétation était étiquetée d'interprétation absolue puisqu'elle excluait toute forme de comparaison entre les individus. On comprendra que la facture des instruments de mesure associée depuis longtemps à l'interprétation normative ne pouvait demeurer inchangée. Un score brut à ce genre d'examen, composé de tâches hétéroclites, a toujours été et sera toujours difficile sinon impossible à interpréter correctement. Pour décrire ce dont un individu est capable, la somme des réussites doit être établie au regard de tâches essentiellement reliées à un même objectif, à une même habileté. On obtient ainsi des instruments homogènes en contenu et en structure. Il reste à l'expert, la personne qui a conçu l'épreuve, à déterminer le score qui sera choisi comme indice de maîtrise de l'habileté visée. Ainsi, pour une épreuve composée de dix additions de fractions simples, on pourrait choisir un score de 9 sur 10 (ou 90%) comme indice de maîtrise (ou seuil quantitatif de réussite). Tout individu dont le résultat est égal ou supérieur à ce score particulier (le seuil de réussite) sera dit en situation de maîtrise des additions de fractions simples. Au contraire, tout individu dont le résultat est inférieur à 9 sur 10 sera dit en situation de non maîtrise.

 

L'interprétation et les fonctions formative ou sommative de l'évaluation

L'approche normative est l'appanage de l'évaluation certificative. L'interprétation critériée peut également y être associée comme dans les systèmes d'attestation de compétences. Ce deuxième type d'interprétation peut être cependant étroitement associé à l'évaluation formative, comme dans une pédagogie par objectifs, lorsque la régulation des apprentissages emprunte la voie de l'enseignement correctif.

 

REMARQUE IMPORTANTE:

Il est malheureux que le mot «évaluation» ait été associé aux qualificatifs «normative» ou «critérielle». Dire d'un individu qu'il est parmi les plus âgés de son groupe, qu'il a démontré une performance inférieure à la moyenne, etc. ne sont pas des évaluations au sens propre du terme. Le rang et ses dérivés numériques ou sémantiques ne sont que des transpositions d'un score brut dans une autre métrique. Pour s'en convaincre, on n'a qu'à imaginer les impressions que pourraient nous livrer des marathoniens qui sont loin d'être premiers au fil d'arrivée. Certains en éprouveront une satisfaction s'ils comparent leur performance d'aujourd'hui à celle de l'an dernier. D'autres s'avoueront déçus car ils visaient une médaille! Le rang en lui même n'est aucunement porteur de l'évaluation qui va suivre et, de ce fait, il ne faut pas confondre ces deux entités. Le cas de l'interprétation critériée est quelle peu différent. Un score brut est comparé à un indicateur de maîtrise pris, avec une certaine tolérance, comme limite inférieure d'une performance idéale à atteindre. Cependant, même en cas de maîtrise assurée par un score élevé, l'importance de l'objectif visé par l'instrument, la difficulté des tâches doivent être prises en considération avant de porter un jugement éclairé. L'interprétation critériée n'est pas non plus porteuse de l'évaluation qui va suivre.

© G. Scallon (1999)

OUVRAGES CONSULTÉS
Glaser, R. (1963). Instructional technology and the measurement of learning outcomes: some questions. American Psychologist, 18, 519-521.

Scallon, G. (1988). L'évaluation formative des apprentissages. Tome 1: la réflexion. Sainte-Foy: Les Presses de l'Université Laval.