IL CONCETTO DI ANALISI
DELLA VARIANZA ANOVA


Il concetto di base dell'analisi della varianza (ANOVA "analysis of variance")  non è difficile da afferrare. I prerequisiti importanti per interpretare e capire i dati per un'analisi ANOVA sono: dimestichezza con i concetti di variabile indipendente (od arbitraria, quelle si s'impostano come set up sulla macchina) e di variabile dipendente (in genere quelle di sola  lettura, non impostate come input), conoscenze di base sull'analisi di regressione e la dimestichezza con gli strumenti statistici computerizzati. Ma al di la di questo, il concetto dell'analisi stessa è piuttosto semplice.  

Nei progetti di ricerca semi-sperimentali, (con esperimenti seriali, del tipo di quelli utilizzati nello stampaggio ad iniezione) l'analisi della varianza, è un'importante strumento per capire le differenze statistiche medie, fra due popolazioni di dati differenti, comunque, queste popolazioni, siano individuate e discriminate dal ricercatore. Quando siano riscontrabili delle differenze medie fra le due popolazioni, a quel punto è possibile fare dei ragionamenti comparativi più precisi fra i due gruppi.  Le differenze statistiche sono stimate appunto con un'analisi ANOVA. 

In un'analisi ANOVA la comparazione fra le misure della media e della varianza (od errore casuale) riscontrate nelle due popolazioni, consente di stabilire se la differenza fra le due popolazioni di dati è significativa o meno. Per illustrare i concetti di media e di varianza proponiamo uno stralcio di conferenza tenuta dal dott. Karl Popper nel lontano 1965. 


La metafora delle nuvole e degli orologi

Immaginiamo uno sciame di moscerini che stia volando nella nostra direzione. Quella massa di moscerini sembra muoversi verso di noi senza alcun apparente ordine. A mano a mano che s'avvicina, un certo qual ordine o coordinazione riusciamo a riconoscerlo, anche se i singoli individui sono dotati di moto caotico, il loro moto evolve attorno al nucleo, dal quale l'intero gruppo ed i singoli individui non si allontanano mai troppo. Procedendo in questo modo la nuvola di moscerini si muove compatta nella nostra direzione, ci sorpassa, anche se lascia qualche individuo sbandato ed in ritardo. Noi non potremo qualificare il movimento di quello sciame come efficiente o preciso, giacché i movimenti dei singoli moscerini non sono coordinati fra di loro e neanche allineati con la direzione del moto dell'intero gruppo. Il cammino dello sciame dal punto d'avvistamento A al punto B (la nostra locazione), può essere misurato invece con sufficiente precisione, basandoci sul cammino medio percorso dal gruppo, ma la varianza od errore standard, è piuttosto elevata poiché ogni singolo moscerino è arrivato in tempi diversi alla stessa meta percorrendo strade differenti. 

Immaginiamo ora un orologio. Con un orologio, come ad esempio un atomico al cesio, aggiustamenti d'ora sono necessari solo molto raramente e sempre si tratta di frazioni infinitesime di secondo. Un orologio come quello descritto è preciso al miliardesimo di secondo, anche se la maggior parte degli orologi commerciali sono affidabili nell'ambito del minuto, con una necessità di riallineamento periodico, diciamo due volte all'anno, sopratutto per l'ora legale. Popper, durante questa lezione, immagina che tutte le misure scientifiche possibili, debbano collocarsi, in qualche punto, fra i due estremi compresi fra la stravaganza più assoluta e quello della precisione cronometrica. Seguiamolo: 

"....... qualche fenomeno naturale, come il tempo atmosferico, oppure il comparire ed il dissolversi di una nuvola, sono pressoché impossibili da prevedere: non per nulla noi parliamo di stravaganza e capricciosità del tempo. Dall'altro lato parliamo invece di "precisione cronometrica" se noi vogliamo descrivere un fenomeno molto regolare e prevedibile. 

C'è un sacco di fenomeni naturali, e di processi produttivi industriali, che hanno un comportamento che deve essere collocato ad un certo punto fra questi due estremi, la imprevedibilità delle nuvole sulla sinistra e la precisione assoluta dell'orologio atomico sulla destra. Il cambiamento delle stagioni, ad esempio, è in certo qual modo non completamente prevedibile e quindi va sistemato fra i due estremi, ovviamente non molto lontano dal paletto di destra, l'orologio atomico." 

Anche i processi naturali, come la produzione di un albero di mele: la quantità totale di frutta, il calibro o peso medio singolo, il numero delle mele, ecc., sono soggetti ad un gran numero di parametri e quindi hanno un vistoso margine d'incertezza. Taluni processi produttivi industriali, come lo stampaggio ad iniezione, sono soggetti anch'essi ad un gran numero di variabili, vanno perciò sistemati, fra i due estremi della nostra immaginaria scaletta, ovviamente non troppo distanti dal paletto dell'orologio. 

Nello stampaggio ad iniezione, riscontriamo, ad esempio, una varianza nel peso delle stampate, ed ovviamente anche delle quote dei componenti prodotti, non solo fra pezzo e pezzo, ma si registrano anche strutture locali, che comportano ritiri diversi fra zone diverse dello stesso pezzo. I processi produttivi per metalli, come l'asportazione di truciolo, o la tranciatura delle lamiere, stanno, in genere,  molto alla destra dello stampaggio ad iniezione, più vicini alla metafora dell'orologio.  

La breve chiacchierata di Karl Popper sulle nuvole e sugli orologi descrive metaforicamente molto bene i fondamenti e la necessità delle analisi della varianza ANOVA. Ad una estremità del continuum vi sono le nubi. Le nubi sono accompagnate da un elevato errore casuale - con tutte le conseguenze dell'imprecisione associate ad una varianza elevata, di fatto pressoché imprevedibile il loro comportamento. Lo sciame dei moscerini, in confronto con le nuvole, è un sistema caratterizzato da una media di comportamenti medi, e molta varianza, poiché i singoli moscerini sono dispersi all'interno dello sciame e volano apparentemente maniera caotica, ma lo sciame ha una velocità di traslazione relativamente prevedibile, perciò va collocato sulla destra delle nubi. Ancora più a destra collocheremo la produzione naturale dell'albero delle mele, più a destra ancora lo stampaggio ad iniezione, e di seguito la tecnologia dell'asportazione truciolo ed infine, all'estrema destra, il miliare dell'orologio atomico, sistema efficientissimo con errori casuali praticamente non misurabili. 


Acronimi inglesi usati in statistica

T-test 

Un T-test è utilizzato per determinare se un valore medio, di due gruppi di dati, è diverso nella variabile presa in considerazione. Per esempio: si sta utilizzando un T-test se, in uno stampo a due cavità uguali, noi separiamo i pezzi prodotti dalle due impronte, facciamo la media di una quota significativa misurata sui pezzi provenienti dall'impronta A e la compariamo con la stessa media fatti sui pezzi dell'impronta B. Il T-test è appropriato solo quando vogliamo comparare una variabile presa all'interno di due diversi gruppi di dati omogenei.

One-Way ANOVA 

Questo test statistico è molto simile al T-test, salvo che vengono presi in considerazione anche le dispersioni, caratterizzate dall'errore medio, o sigma. Per rifarci all'esempio precedente, potremo scoprire che le medie delle quota di controllo, misurate sui pezzi stampati con le figura A e B del nostro stampo, sono passabilmente uguali, ma una delle due figure ha un errore tipo maggiore, per cui fa una produzione con una maggiore varianza attorno al valore medio.  

MANOVA (Multiple ANOVA) 

Questo strumento statistico serve per comparare due, o più, set di dati per vedere se esistono differenze su due o più variabili. Ritorniamo all'esempio precedente dello stampo a due impronte, se noi rileviamo una seconda variabile dai componenti prodotti, ad esempio pesiamo tutti i pezzi, l'analisi MANOVA ci consente di stabilire se c'è o meno correlazione fra la variazione del peso e la variazione delle quote ed in che modo le due variabili s'influenzano fra di loro. 


Lavoro citato:
Popper, Karl. Objective Knowledge. Oxford: Claredon Press. 1972.



Michele  Gambelli
Formatore tecnico

sito:          www.microcae.com
e-mail:   
  gambelli@microcae.com 
tel. cell:   335 6890 216