Per riassumere, generalmente se la distribuzione dei dati è inclinata a sinistra, la media è inferiore alla mediana, che spesso è inferiore alla modalità. Se la distribuzione dei dati è distorta a destra, la moda è spesso inferiore alla mediana, che è inferiore alla media.
Perché la mediana è meno influenzata dai dati distorti?
Perché la mediana è meno influenzata dai dati distorti rispetto alla media? Tuttavia, quando i dati diventano distorti, la media perde la sua capacità di fornire la migliore posizione centrale per i dati perché i dati distorti li stanno allontanando dal valore tipico.
Perché la mediana è migliore per i dati distorti?
Per le distribuzioni che hanno valori anomali o sono distorte, la mediana è spesso la misura preferita della tendenza centrale perché la mediana è più resistente ai valori anomali rispetto alla media… Notare che la media viene tirata nella direzione dell'asimmetria (cioè la direzione della coda).
Quando è inclinata a destra, la media è mediana?
Per una distribuzione asimmetrica a destra, la media è tipicamente maggiore della mediana Si noti inoltre che la coda della distribuzione sul lato destro (positivo) è più lunga che sul lato lato sinistro. Dal diagramma a scatola e baffi possiamo anche vedere che la mediana è più vicina al primo quartile che al terzo quartile.
In che modo l'asimmetria influisce sui dati?
Effetti di asimmetria
Se ci sono troppe asimmetrie nei dati, allora molti modelli statistici non funzionano, ma perché. Quindi, nei dati distorti, la regione della coda può fungere da valore anomalo per il modello statistico e sappiamo che i valori anomali influiscono negativamente sulle prestazioni del modello, in particolare sui modelli basati sulla regressione.