Teorie psicometriche: la TCT e la IRT

6 minuti

La valutazione del paziente spesso è fortemente condizionata dai risultati ottenuti dal test somministrato. Ma come sono stati formulati questi test e come verificarne l'efficacia?

Scritto e verificato la psicologa Paula Villasante.

Ultimo aggiornamento: 05 gennaio, 2023

I test vengono somministrati come strumenti di valutazione in ambito psicologico. Così come ci serviamo del metro per misurare le lunghezze, potremmo servirci di un test per misurare l’intelligenza, la memoria, i livelli di attenzione di una persona. Tuttavia, i test non risultano di così facile progettazione né applicazione. Di questo aspetto si occupano le teorie psicometriche.

Allo stesso modo, così come un’unica misurazione non ci permette di definire con esattezza il volume di un oggetto, neppure la somministrazione di un unico test ci permette di formulare una diagnosi precisa o di proporre un intervento esatto. Ne consegue che i test sono utili strumenti di valutazione, ma non sono determinanti.

Proprio qui subentra lo psicologo, a cui spetta il compito di rielaborare i dati ottenuti nel test e da altre fonti per formulare una valutazione più precisa. In altre parole, lo specialista dovrà integrare i risultati delle diverse fonti, possibile grazie alle competenze ma anche agli anni di esperienza.

Breve storia delle teorie psicometriche

Si fa risalire l’origine dei test di psicometria alle prove che gli imperatori cinesi somministravano nel 3000 a. C. agli ufficiali al loro servizio. Lo scopo era valutarne le competenze professionali. (1)

I test più moderni hanno origini più recenti, come i test eseguiti da Galton (1822-1911) nel suo laboratorio. Ciò nonostante, fu James Cattell ad aver usato per primo il termine “test psicologico” nel 1890.

Queste prove non erano precise in merito alle abilità cognitive del soggetto, motivo per cui i ricercatori Binet e Simon (1905) introdussero test conoscitivi per valutare aspetti quali il giudizio, la comprensione e il ragionamento.

Ciò spianò la strada a una tradizione di scale di valutazione individuali. Oltre ai test conoscitivi, si assistette a notevoli progressi nell’ambito dei test della personalità.

A cosa servono le teorie psicometriche?

Con il prosperare dei test in quanto strumenti di valutazione, si svilupparono anche diverse teorie per valutarne l’efficacia. Spinti dal bisogno di elaborare strumenti che presentassero il minor margine di errore possibile, ecco che sorse la psicometria. Le teorie psicometriche pretendono validità e affidabilità da qualunque test o strumento di misurazione in quanto tale.

Ricordiamo che per affidabilità si intende la stabilità o la consistenza delle misurazioni durante la ripetizione delle stesse. In altre parole, un test sarà tanto affidabile quanto maggiore sarà la replica dei stessi risultati ottenuti in diverse occasioni.

D’altra parte, per validità si intende il grado in cui l’evidenza empirica e la teoria supportano l’interpretazione del punteggio dei test (2).

Le teorie psicometriche (o approcci) volte ad analizzare e definire questi strumenti sono due: la teoria classica dei test (TCT) e la teoria di risposta all’item (IRT).

Le teorie psicometriche

La teoria classica dei test (TCT)

Si tratta della teoria dominante nella costruzione e nell’analisi dei test. Le sue origini risalgono ai lavori di Spearman, all’inizio del XX secolo. Successivamente, nel 1968, i ricercatori Lord e Novick hanno riformulato questa teoria e spianato la strada per un nuovo approccio, quello della IRT.

Questa teoria si fonda sul modello lineare classico proposto da Spearman per cui “il punteggio ottenuto da una persona in un test -che chiameremo punteggio empirico e che si solito viene indicato con la lettera X- è formato da due elementi (2).

Da un lato, troviamo il vero punteggio ottenuto dal soggetto durante il test (V) e dall’altro l’errore (e). Viene espresso con la seguente formula: X = V+ e”.

Spearman aggiunge tre postulati a questa teoria:

Definiamo il punteggio vero (V) come l’aspettativa matematica del punteggio empirico: si tratta del punteggio che una persona dovrebbe ottenere in un test se lo ripetesse per un numero infinito di volte.

Non esiste alcuna relazione tra il punteggio reale e l’entità degli errori.

Gli errori di misurazione di un test non sono associati a quelli di un test diverso.

Per concludere, Spearman definisce test paralleli quei test che misurano la stessa variabile, ma sulla base di item diversi.

Le teorie psicometriche: limiti dell’approccio classico

Il primo della teoria classica è le misurazioni non sono invarianti rispetto allo strumento applicato. Questo significa che se uno psicologo valutasse l’intelligenza di tre persone con un test diverso per ciascuna, i risultati non sarebbero paragonabili. Ma perché?

Perché i risultati dei tre strumenti di misurazione non si basano sulla stessa scala di valutazione. Per poter mettere a confronto l’intelligenza delle tre persone, bisognerà convertire il punteggio ottenuto in un’altra scala.

Il problema sorge dal fatto che diamo per certo che i criteri normativi con i quali sono state elaborate le scale dei diversi test sono equiparabili -stessa media, stessa deviazione standard-, cosa difficile da garantire nella pratica. (1).

Così, il nuovo approccio della RTI ha rappresentato un grande progresso in tal senso. Permette, di fatto, che i risultati ottenuti tramite diversi strumenti siano valutati sulla base della stessa scala.

Il secondo limite di questo approccio è l’assenza di invarianza delle proprietà dei test rispetto ai soggetti utilizzati per la stima. Questo aspetto ha una parziale soluzione nell’approccio RTI.

La teoria di risposta all’item (IRT)

La teoria di risposta all’item (IRT) nasce a integrazione della teoria dei test classica. L’IRT ci offre uno strumento molto più equilibrato, il problema è che questo paradigma è associato a costi maggiori e richiede la partecipazione di personale specializzato.

L’IRT prevede diversi scenari, ma l’idea di fondo è che qualsiasi strumento di misurazione presenti un rapporto di tipo funzionale tra i valori della variabile che misurano gli item e le probabilità che corrispondano al vero. Questa funzione prende il nome di Curva caratteristica dell’item (CCI). Quali conclusioni possiamo dedurre?

La TCT non valuta. Ad esempio, gli item più difficoltosi sarebbero quelli a cui rispondono solo i soggetti più intelligenti. D’altra parte, un item cui rispondono tutti i soggetti non servirebbe a nulla, perché non avrebbe nessun valore discriminante. Ovvero non offrirebbe nessuna informazione.

Per osservare meglio le differenze tra le teorie psicometriche descritte, possiamo prendere come punto di riferimento la tavola di José Muñiz (2010):

Tabella 1. Differenze tra la TCT e l’IRT (Muñiz, 2010)

Aspetti	TCT	IRT
Modello	Lineare	Non lineare
Ipotesi	Deboli (facili da soddisfare con i dati)	Forti (difficili da soddisfare con i dati)
Invarianza delle misurazioni	No	Sì
Invarianza delle proprietà del test	No	Sì
Scala di punteggio	Tra 0 e il massimo punteggio del test	Infinito
Enfasi	Test	Item
Relazione item-test	Non specificabile	Curva caratteristica dell’item
Descrizione degli Item	Indici di difficoltà e di discriminazione	Parametri a, b,c
Errori di misurazione	Errori tipici delle misurazioni, comuni a tutti i campioni	Funzioni di Informazione (varia a seconda dei livelli di attitudine)
Dimensioni del campione	Potenzialmente funzionante con campioni composti da un numero che va da 200 a 500 soggetti circa	Si consiglia un numero che ecceda i 500 soggetti

Sebbene siano quasi contemporanee, sembra chiaro che l’IRT nasce come risposta ai limiti o ai possibili problemi presentati dalla TCT. In ogni caso, sembra chiaro che la ricerca nell’ambito della psicometria ha ancora molta strada da fare.

Tutte le fonti citate sono state esaminate a fondo dal nostro team per garantirne la qualità, l'affidabilità, l'attualità e la validità. La bibliografia di questo articolo è stata considerata affidabile e di precisione accademica o scientifica.

1. Muñiz Fernández, J. (2010). Las teorías de los test: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos.
2. Binet, A. y Simon, T. H. (1905). Methodes nouvelles pour le diagnostic du niveau intellectuel des anormaux. L’année Psychologique, 11, 191-244.
3. Lord, F. M., y Novick, M. R. (1968). Statistical theories of mental test scores. New York: Addison-Wesley.

Questo testo è fornito solo a scopo informativo e non sostituisce la consultazione con un professionista. In caso di dubbi, consulta il tuo specialista.