


Trovo sempre utili e didattiche le tabelle generate da Ministat che rappresentano le grandezze bayesiane in funzione dei valori di soglia. Infatti, per esempio, è sufficiente rianalizzare gli stessi dati imponendo una prevalenza della malattia dello 0,5% (o se preferite del 5 per mille, ovvero P = 0,005) per afferrare alcune proprietà molto importanti della grandezze bayesiane.
A questo punto è possibile a partire dal numero di casi osservati calcolare le grandezze bayesiane come:→ VP / (VP+FN) = sensibilità (positività del test nei malati);→ VN / (VN+FP) = specificità (negatività del test nei sani);→ (VP+FN) / (VP+FN+FP+VN) = prevalenza (numero dei malati);→ (VP / (VP+FP) = valore predittivo del test positivo (probabilità di essere malato se il test è positivo);→ VN / (VN+FN) = valore predittivo del test negativo (probabilità di essere sano se il test è negativo). Questo approccio corrisponde al percorso seguito quanto si raccolgono i risultati di un nuovo test di laboratorio in una casistica di soggetti affetti o non affetti da una specifica malattia, contando i casi da assegnare a ciascuna delle quattro caselle sopra individuate, per determinare appunto le caratteristiche di sensibilità e di specificità del test in questione. Uno strumento per effettuare con semplicità i calcoli necessari Con le espressioni riportate sopra possiamo calcolare i risultati dell’esempio tratto da Galen e Gambino [2] che si riferisce ai risultati della determinazione dell’alfa-fetoproteina nel cancro del fegato (malati) e in altri disordini (sani). I dati raccolti erano: 90 malati con il test positivo (VP), 2079 sani con il test negativo, (VN), 17 malati con il test negativo (FN), 39 sani con il test positivo (FP). Scaricate e aprite con Excel© o con OpenOffice.org© Calc il file “Bayes_num.xls” nelle celle da F2 a G3 vi ho mostrato come inserire i dati, che devono essere inseriti nelle celle corrispondenti de B2 a C3 sotto forma di numeri interi, cioè di casi osservati. Coerentemente con i calcoli sopra riportati, trovate che le grandezze bayesiane sono state calcolate rispettivamente come:→ sensibilità =B2/(B2+C2)→ specificità =C3/(C3+B3)→ prevalenza =(B2+C2)/SOMMA(B2:C3)→ valore predittivo del test positivo =B2/(B2+B3)→ valore predittivo del test negativo =C3/(C3+C2) Come vedete nel file la possibilità di disporre del numero di casi consente di calcolare per ciascuna di queste grandezze l’intervallo di confidenza (generalmente al 95%, ponendo z = 1,96, ma potete calcolarlo anche al 90% o al 99%, ponendo z rispettivamente uguale a 1,645 e 2,576). Si tratta di un punto cruciale, in quanto sia dal punto di vista epistemologico sia dal punto di vista metodologico è un “dovere scientifico” comunicare sempre il grado di incertezza che caratterizza l’informazione ottenuta. Pertanto la regola fondamentale è che qualsiasi conclusione statistica deve essere sempre accompagnata della misura dell’incertezza che la caratterizza, espressa sotto forma di intervallo di confidenza (vedere ad esempio in http://en.wikipedia.org/wiki/Confidence_interval). Il teorema di Bayes come ausilio per la definizione delle strategie diagnostiche Queste osservazioni introducono il concetto di strategia diagnostica a livello del singolo caso clinico. Se andate a rivedere il problema degli anticorpi anti-HIV (problema 7) vedete che il teorema di Bayes ci indica chiaramente come più economico e saggio eseguire ad un paziente prima gli anticorpi anti-HIV, anche se il valore predittivo del test positivo è “solamente” del 50% (cioè un paziente con anticorpi anti-HIV positivi ha il 50% di probabilità di essere malato, e reciprocamente ha il 50% di probabilità di essere sano: come dire che potremmo decidere se è sano e malato lanciando in aria una moneta!). Infatti i falsi positivi possono poi essere individuati successivamente mediante un test di secondo livello (western-blot), un test costoso, che però verrà praticato solamente al 6 per mille dei pazienti, mentre ai rimanenti ci si sarà limitati ad effettuare il test (assai meno costoso) degli anticorpi anti-HIV. Questa idea collega la strategia diagnostica individuale alla strategia diagnostica in termini di politica sanitaria. Qui l’argomento si fa un po più delicato, in quanto bisognerebbe poi valutare l’efficacia della strategia in termini di ricaduta sullo stato di salute della popolazione. Misurare l’efficacia della costruzione della fognature non ha richiesto la messa a punto di sofisticati indicatori statistici: l’efficacia è stata resa “evidente” dalla scomparsa delle epidemie di peste bubbonica. Anche l’efficacia della vaccinazioni è stato resa “evidente” dalla (ad esempio) scomparsa del vaiolo e della poliomelite. Ma già se abbiamo di fronte il caso della meningite meningococcica, la valutazione di efficacia diventa più difficile. Che dire poi di un test di screening per il sangue occulto nelle feci? Il teorema di Bayes ci consente quantomeno di misurare quello che accade/acccadrebbe in termini di veri positivi, falsi positivi, quindi di esiti per la salute. Su questi argomenti ho ripreso le argomentazioni sia di Galen e Gambino sia di Gerhardt e Keller, pure rendendomi conto del fatto che si tratta di un argomento difficile, che sarà necessario sviluppare ulteriormente. Ho riassunto gli argomenti trattati in questa parte anche in una presentazione, dal titolo teorema di Bayes e strategie diagnostiche. ******************************** |
|
|
|
|
|
|
|
Ultimo aggiornamento: 20 febbraio 2023

Programma di statistica Ministat (versione per Windows)

L’articolo da non perdere...

Questo sito è stato archiviato ed è reso disponibile esclusivamente come memoria storica: pertanto è escluso ogni suo possibile utilizzo medico. Le parti del sito riservate al teorema di Bayes rimangono concettualmente valide, ma declino qualsiasi responsabilità per la lenta ma inevitabile obsolescenza dei restanti contenuti dovuta alla comparsa di nuove analisi di laboratorio, di progressi nelle analisi genetiche, di link interrotti, e quant’altro.
.