Indici di dispersione nelle statistiche

8 Maggio 2019
Gli indici di dispersione sono importanti perché descrivono la variabilità rilevata in una determinata popolazione o campione. Ecco come si usano.

In una distribuzione di dati, gli indici di dispersione hanno un ruolo molto importante. Queste misure completano quelle della cosiddetta “posizione centrale”, caratterizzando la variabilità dei dati. Gli indici di tendenza centrale indicano valori rispetto ai quali i dati sembrano essere raggruppati. Vengono utilizzati per derivare il comportamento delle variabili in popolazioni e campioni. Alcuni esempi di questi sono la media aritmetica, la modalità o la mediana (1).

Gli indici di dispersione completano quelli di tendenza centrale. Inoltre, sono essenziali in una distribuzione di dati. Questo perché ne caratterizzano la variabilità. La loro rilevanza nella formazione statistica è stata sottolineata da Wild e Pfannkuch (1999).

La percezione della variabilità dei dati è una delle componenti di base del pensiero statistico, poiché ci fornisce informazioni sulla dispersione dei dati rispetto a una media.

L’interpretazione della media

La media aritmetica è ampiamente utilizzata nella pratica, ma può spesso essere male interpretata. Questo accade quando i valori della variabile sono molto sparsi. In queste occasioni, è necessario accompagnare gli indici di dispersione medie (2).

Gli indici di dispersione presentano tre componenti importanti relativi alla variabilità casuale (2):

  • La percezione della sua ubiquità nel mondo che ci circonda.
  • La competizione per la sua spiegazione.
  • La capacità di quantificarla (il che implica la comprensione e il saper applicare il concetto di dispersione).
Uomo con interrogativi

A cosa servono gli indici di dispersione?

Quando bisogna generalizzare i dati di un campione di una popolazione, gli indici di dispersione sono molto importanti in quanto condizionano direttamente l’errore con cui lavoriamo. Maggiore è la dispersione che raccogliamo in un campione, maggiore è la dimensione di cui abbiamo bisogno per lavorare con lo stesso errore.

D’altra parte, questi indici ci aiutano a determinare se i nostri dati sono lontani dal valore centrale. Ci indicano se questo valore centrale è adeguato per rappresentare la popolazione dello studio. Questo è molto utile per confrontare le distribuzioni e comprendere i rischi nel processo decisionale (1).

Questi indici sono molto utili per confrontare le distribuzioni e comprendere i rischi nel processo decisionale. Maggiore è la dispersione, meno rappresentativo è il valore centrale.

Quelli più usati sono:

Funzioni degli indici di dispersione

Rango

L’uso del rango serve per un confronto primario. In questo modo, considera solo le due osservazioni estreme. Questo è il motivo per cui è consigliato solo per piccoli campioni (1). È definito come la differenza tra l’ultimo valore della variabile e il primo (3).

Esempio di misure di dispersione

Deviazione statistica

La deviazione media indica dove i dati sarebbero concentrati se tutti fossero alla stessa distanza dalla media aritmetica (1). Consideriamo la deviazione di un valore della variabile come la differenza in valore assoluto tra quel valore della variabile e la media aritmetica della serie. È dunque considerato come la media aritmetica delle deviazioni (3).

Varianza

La varianza è una funzione algebrica di tutti i valori, appropriata per le attività statistiche inferenziali (1). Può essere definita come deviazione quadratica (3).

Deviazione standard o tipica

Per campioni prelevati dalla stessa popolazione, la deviazione standard è una delle più utilizzate (1). È la radice quadrata della varianza (3).

Coefficiente di variazione

È una misura utilizzata soprattutto per confrontare la variazione tra due serie di dati misurati in unità diverse. Ad esempio, altezza e peso corporeo degli studenti in un campione. Viene impiegato per determinare in quale distribuzione i dati sono più raggruppati e la media è più rappresentativa (1).

Le misure di dispersione servono in statistica e psicologia

Il coefficiente di variazione è un indice di dispersione più rappresentativo rispetto ai precedenti, poiché è un numero astratto. In altre parole, è indipendente dalle unità in cui compaiono i valori della variabile. In generale, questo coefficiente di variazione è espresso in percentuale (3).

Conclusioni sugli indici di dispersione

Gli indici di dispersione indicano, da un lato, il grado di variabilità nel campione. D’altro canto, la rappresentatività del valore centrale, poiché se si ottiene un valore basso, significa che i valori sono concentrati attorno a quel “centro”. Ciò significherebbe che c’è poca variabilità nei dati e il centro li rappresenta tutti bene.

Al contrario, se si ottiene un valore elevato, significa che i valori non sono concentrati, ma sparsi. Ciò significa che c’è molta variabilità e il centro non sarà molto rappresentativo. D’altra parte, quando si fanno inferenze, avremo bisogno di un campione più grande se vogliamo ridurre l’errore, aumentato precisamente per l’aumento della variabilità.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.