R funzioni statistiche

Atlante di anatomia
Atlante di Anatomia
Umana
Entamoeba coli1
Atlante di Parassitologia
Virus2
Atlante di ematologia
new
Atlante del protozoi
new
Citologia e istologia
Atlante di Virologia
Atlante di Ematologia
Atlante dei protozoi intestinali
Atlante di citologia e istologia
Bayes
DNA_0527s
Informazioni: info@bayes.it
Scrivimi: webmaster@bayes.it

Ultimo aggiornamento: 13 maggio 2012

117.194 visitatori dal maggio 2008

Per la riproduzione dei contenuti del sito è necessario il permesso dell’Autore

NOTA LEGALE
 
L’interpretazione dei risultati delle analisi di laboratorio deve essere effettuata esclusivamente dal medico e alla luce dei dati clinici.
Questo sito ha uno scopo esclusivamente educativo e formativo. Pertanto le informazioni in esso contenute possono essere utilizzate esclusivamente a scopo didattico, e anche in questo caso sotto la responsabilità personale di chi le utilizza, sia per sé stesso sia per terzi.
Le informazioni contenute in questo sito non possono e non devono essere utilizzate né a scopo diagnostico, né a scopo prognostico, né a scopo terapeutico, né per qualsiasi attività che abbia un impatto sia diretto sia indiretto sullo stato di salute di  un individuo o di più individui.
Nessuna responsabilità può essere imputata all’autore per danni diretti o indiretti e di qualsivoglia natura che potrebbero essere causati a sé stessi o a terzi a causa di errori, imprecisioni, omissioni, interpretazioni o utilizzo dei contenuti di questo sito o dei siti cui esso fa riferimento.

 

 
NOTA SUI COLLEGAMENTI
ALLE FONTI BIBLIOGRAFICHE
 
La maggior parte dei collegamenti ad articoli scientifici riportati nel sito fa riferimento a riviste online che forniscono gratuitamente l’articolo originale. In alcuni casi è necessario registrarsi sul sito per avere libero accesso agli articoli: questo accade per esempio con il BMJ. Quando i collegamenti  fanno riferimento a fonti bibliografiche a pagamento, chi non ha sottoscritto un abbonamento con la rivista potrebbe vedere comparire un messaggio del tipo “access forbidden”, ma il più delle volte vedrà comparire una pagina che consente di acquistare online l’articolo originale.
 
 

Le statistiche complete del sito

Le funzioni statistiche di R sono trattate assumendo che abbiate familiarizzato adeguatamente con tutti gli argomenti contenuti nella parte preliminare.
 
Attenzione: le indicazioni qui riportate fanno riferimento alla versione di R per Windows©.
Per MacOS X© vedere come utilizzare i dati e gli script con MacOS X.
 
Potete imparare facilmente a calcolare con R le principali statistiche sui vostri dati, seguendo gli script e i dati di esempio attualmente raccolti sotto questi argomenti:
statistiche esplorative (misure di posizione, misure di dispersione, quantili)
confronto tra due campioni indipendenti (test t di Student, test non parametrici)
confronto tra dati appaiati (test t di Student, test non parametrici)
confronto con una media teorica (test t di Student)
correlazione (coefficienti di correlazione e correlogrammi)
regressione lineare (regressione lineare semplice e regressione lineare multipla)
cluster analysis
 
Attenzione: in alcuni casi gli esempi riportati prevedono l’uso di librerie che sono scaricate automaticamente dal CRAN e installate automaticamente sul PC (questo, ovviamente, solo se è la prima volta che le usate): per questa ragione è necessario essere collegati a Internet.
 
Statistiche esplorative (misure di posizione, misure di dispersione, quantili)
 
→ create la cartella C:\R\Statelem\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Statelem.txt e Statelem.csv;
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Statelem\Statelem.txt nell’Editor di R.
 
Il contenuto del file Statelem.csv aperto con un editor di testo come il Blocco note di Windows vi apparirà così, con i nomi delle variabili nella prima riga, e i dati di ciascun caso nelle righe successive:
 
Sesso;Eta;Colesterolo;HDL;LDL;Trigliceridi
M;33;56;44;9;19
M;62;60;5;;
F;90;70;30;;99
................
M;62;435;38;219;856
 
Nella prima riga sono riportati i nomi delle variabili, nelle successive i dati, relativi a quasi settemila casi per quali erano disponibili sesso, età, e i valori di colesterolo, colesterolo HDL, colesterolo LDL e trigliceridi (nel siero, in mg/dL). Come si vede già dal secondo e dal terzo caso, alcuni dati possono mancare (nel secondo caso mancano i risultati di colesterolo LDL e trigliceridi, nel terzo caso manca il risultato del colesterolo LDL).
 
Eseguite passo passo il codice dello script copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ innanzitutto importiamo i dati
mydata <- read.table("c:/R/Statelem/Statelem.csv", header=TRUE, sep=";")
→ nome delle variabili contenute in mydata
names(mydata)
→ struttura dell’oggetto mydata
str(mydata)
→ lista dei primi 10 casi di mydata
head(mydata, n=10)
→ lista degli ultimi 5 casi di mydata
tail(mydata, n=5)
→ mostra i casi con dati NA (Not Available)
mydata[!complete.cases(mydata),]
→ crea un nuovo oggetto denominato newdata omettendo i casi con dati NA
newdata <- na.omit(mydata)
→ crea un oggetto denominato newdataset che include solamente le colonne da 2 a 6 con le variabili quantitative
newdataset <- newdata[c(2,3,4,5,6)]
→ calcola la media del colesterolo LDL su mydata
attach(mydata)
mean(LDL) # da notare che R restituisce NA anche per la media
mean(LDL, na.rm=TRUE) # rimuovendo i dati NA questa volta R restituisce il valore della media
→ è ora facile a calcolare le altre principali statistiche del colesterolo LDL su mydata
var(LDL, na.rm=TRUE) # calcola la varianza
sd(LDL, na.rm=TRUE) # calcola la deviazione standard
min(LDL, na.rm=TRUE) # calcola il valore minimo
max(LDL, na.rm=TRUE) # calcola il valore massimo
range(LDL, na.rm=TRUE) # calcola il range
quantile(LDL, probs = seq (0, 1, 0.25), na.rm=TRUE) # calcola i quartili, sostituendo in seq() il valore 0.25 con 0.10 calcola i decili, eccetera...
→ con sapply si calcolano le statiche di tutte le variabili (questa volta su newdataset, nel quale sono inclusi solamente i dati completi, e dal quale è stata esclusa la variabile qualitativa Sesso)
sapply(newdataset, mean) # calcola la media
sapply(newdataset, sd) # calcola la deviazione standard
sapply(newdataset, var) # calcola la varianza
sapply(newdataset, min) # calcola il valore minimo
sapply(newdataset, max) # calcola il valore massimo
sapply(newdataset, range) # calcola il range
sapply(newdataset, median) # calcola la mediana
sapply(newdataset, quantile) # calcola i quartili
→ se volete avere rapidamente le statistiche sintetiche di mydata
summary(mydata)
→ queste sono le statistiche che potete ottenere utilizzando la libreria Hmisc
library(Hmisc)
describe(mydata)
→ queste sono le statistiche che potete ottenere utilizzando la libreria pastecs
library(pastecs)
stat.desc(mydata)
→ queste sono le statistiche che potete ottenere utilizzando la libreria psych
library(psych)
describe(mydata)
 
Confronto tra due campioni indipendenti (test t di Student, test non parametrici)
 
→ create la cartella C:\R\Statind\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Statind.txt e Statind.csv.
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Staind\Statind.txt nell’Editor di R.
 
Il contenuto del file Statind.csv aperto con un editor di testo come il Blocco note di Windows vi apparirà così, con i nomi delle variabili nella prima riga, e i dati di ciascun caso nelle righe successive:
 
Tessuto;Riboflavina
Fegato;0.95
................
Muscolo;0.42
 
Nella prima riga sono riportati i nomi delle variabili, nelle successive i dati. La variabile Tessuto è una variabile classificativa, che caratterizza il tipo di tessuto nel quale è stata determinata la concentrazione di riboflavina riportata poi nella seconda variabile (Riboflavina).
 
Eseguite passo passo il codice dello script copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ innanzitutto importiamo i dati
mydata <- read.table("c:/R/Statind/Statind.csv", header=TRUE, sep=";")
→ con il test F per il rapporto tra varianze si verifica se le varianze delle misure effettuate nel tessuno e nel muscolo sono omogenee
attach(mydata)
var.test(Riboflavina~Tessuto)
→ test t di Student per due campioni indipendenti con varianze non omogenee
t.test(Riboflavina~Tessuto, var.equal = FALSE)
→ in alternativa si può applicare il test U di Mann-Whitney per campioni indipendenti (test non parametrico)
wilcox.test(Riboflavina~Tessuto)
→ in alternativa si può applicare il test di Kruskal Wallis (test non parametrico)
kruskal.test(Riboflavina~Tessuto)
 
Confronto tra dati appaiati (test t di Student, test non parametrici)
 
→ create la cartella C:\R\Statapp\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Statapp.txt e Statapp.csv.
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Stapp\Statapp.txt nell’Editor di R.
 
Il contenuto del file Statapp.csv aperto con un editor di testo come il Blocco note di Windows vi apparirà così, con i nomi delle variabili nella prima riga, e i dati di ciascun caso nelle righe successive:
 
Subito;Dopo24ore
17;16
................
652;631
 
Nella prima riga sono riportati i nomi delle variabili, nelle successive i dati. La prima variabile riporta i valori di transaminasi (AST, in U/L) misurati immediatamente su un campione di siero, mentre la seconda riporta i valori determinati sullo stesso campione di siero dopo 24 ore (condizioni di conservazione: campioni in provetta madre, tappati, per evitare fenomeni di evaporazione, e conservati alla temperatura di + 4 °C).
 
Eseguite passo passo il codice dello script copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ innanzitutto importiamo i dati
mydata <- read.table("c:/R/Statapp/Statapp.csv", header=TRUE, sep=";")
→ test t di Student per dati appaiati
attach(mydata)
t.test(Subito, Dopo24ore, paired=TRUE)
→ in alternativa si può applicare il test di Wilcoxon (Wilcoxon Signed Rank Test) per dati appaiati (test non parametrico)
wilcox.test(Subito, Dopo24ore, paired=TRUE, exact=FALSE)
 
Confronto con una media teorica (test t di Student)
 
Supponete di avere analizzato cinque volte un siero di controllo con un valore assegnato “certo” di 8 g/dL di proteine totali (che definiamo come “media teorica” della concentrazione delle proteine totali in quel siero). Volete sapere se i vostri risultati (che erano rispettivamente 8.2, 8.3, 7.9, 8.1 e 8.0 g/dL) si discostano significativamente dal valore assegnato.
→ aprite la Console di R e inserite direttamente i valori ottenuti in un vettore y digitando esattamente quello che vedete qui sotto
 y <- c(8.2, 8.3, 7.9, 8.1, 8.0)
→ se lo desiderate potete visualizzare a scopo di verifica i dati inseriti
y
→ potete ora confrontare i cinque valori ottenuti con il valore assegnato di 8 g/dL mediante il test t di Student per una media teorica
t.test(y, mu = 8)
 
Correlazione (coefficienti di correlazione e correlogrammi)
 
→ create la cartella C:\R\Statcorr\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Statcorr.txt e Statcorr.csv;
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Statcorr\Statcorr.txt nell’Editor di R.
 
I dati contenuti nel file Statcorr.csv sono gli stessi utilizzati nell’esempio relativo a Diagrammi di distribuzione (scatter-plot) e grafici 3. Da notare che  questo esempio richiede tre librerie, denominate Hmisc, corrgram e car, che, se non lo avete ancora fatto, dovete scaricare dal CRAN prima di eseguire l’esempio stesso (per ulteriori informazioni vedere il capitolo su Documentazione di R e pacchetti aggiuntivi rispetto all’installazione base).
 
Eseguite passo passo il codice dello script copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ innanzitutto importiamo i dati
mydata <- read.table("c:/R/Statcorr/Statcorr.csv", header=TRUE, sep=";")
→ matrice dei coefficienti di correlazione, method può essere pearson (il classico r), spearman, kendall
cor(mydata, use="complete.obs", method="pearson")
→ calcola i coefficienti di correlazione con i livelli di significatività
library(Hmisc)
x <- as.matrix(mydata) # trasforma mydata in una matrice denominata x
rcorr(x, type="pearson") # type può essere pearson (il classico r) o spearman
→ correlogramma, primo esempio
library(corrgram)
corrgram(mydata, order=TRUE, lower.panel=panel.shade, upper.panel=panel.pie, text.panel=panel.txt, main="Analisi della correlazione")
→ correlogramma, secondo esempio
library(corrgram)
corrgram(mydata, order=TRUE, lower.panel=panel.ellipse, upper.panel=panel.pts, text.panel=panel.txt, diag.panel=panel.minmax, main="Analisi della correlazione")
→ correlogramma, ecco come cambiare i colori
library(corrgram)
col.corrgram <- function(ncol){colorRampPalette(c("darkgoldenrod4", "burlywood1", "darkkhaki", "darkgreen"))(ncol)}
corrgram(mydata, order=TRUE, lower.panel=panel.shade, upper.panel=panel.pie, text.panel=panel.txt, main="Analisi della correlazione")
→ potete confermare le forti correlazioni tra HB/HCT e tra MCH/MCV anche con uno scatterplot
library(car)
scatterplot.matrix(~GR+RGO+HB+HCT+HBA2+MCV+HBF+MCH+RDW+FERRO, reg.line=lm, smooth=TRUE, span=0.5, diagonal = "density", main="Matrice di dispersione", data=mydata)
 
Regressione lineare (regressione lineare semplice e regressione lineare multipla)
 
→ create la cartella C:\R\Statreglin\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Statreglin.txt e Statreglin.csv;
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Statreglin\Statreglin.txt nell’Editor di R.
 
Il contenuto del file Statreglin.csv aperto con un editor di testo come il Blocco note di Windows vi apparirà così, con i nomi delle variabili nella prima riga, e i dati di ciascun caso nelle righe successive:
 
Sesso;Eta;Colesterolo;HDL;LDL;Trigliceridi
M;33;56;44;9;19
F;81;101;63;26;62
................
F;74;385;52;256;327
F;64;397;70;292;96
 
Nella prima riga sono riportati i nomi delle variabili, nelle successive i dati, relativi a oltre duemila casi per quali erano disponibili sesso, età, e i valori di colesterolo, colesterolo HDL, colesterolo LDL e trigliceridi (nel siero, in mg/dL). Si tratta degli stessi casi utilizzati per le statistiche esplorative, dai quali sono stati esclusi tutti i casi con dati mancanti.
 
Eseguite passo passo il codice dello script copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ innanzitutto importiamo i dati
mydata <- read.table("c:/R/Statreglin/Statreglin.csv", header=TRUE, sep=";")
→ viene calcolate la regressione lineare mediante la funzione lm(y ~ x1 + x2 + x3, data=); y è la variabile dipendente in ordinate. Se x1 è l'unica variabile indipendente, viene calcolata la regressione lineare semplice, se x1 + x2 + .... sono più varibili indipendenti viene calcolata la regressione lineare multipla
fit <- lm(LDL ~ Colesterolo + HDL + Trigliceridi, data=mydata)
summary(fit) # mostra i risultati
→ calcola intercetta e coefficienti delle x
coefficients(fit)
→ calcola gli intervalli di confidenza dell'intercetta e dei coefficienti delle x
confint(fit, level=0.95)
→ ricalcola i valori mediante l'equazione della retta di regressione
fitted(fit)
→ calcola le differenze residue tra valore osservato e valore calcolato
residuals(fit)
→ analisi della varianza per le differenze spiegate dalle x
anova(fit)
→ matrice di covarianza dell'intercetta e dei coefficienti delle x
vcov(fit)
→ confronta la regressione a tre variabili con quella a due variabili mediante analisi della varianza
fit1 <- lm(LDL ~ Colesterolo + HDL + Trigliceridi, data=mydata)
fit2 <- lm(LDL ~ Colesterolo + HDL, data=mydata)
anova(fit1, fit2)
→ calcola l'importanza relativa di ciascuna variabile indipendente con quattro diversi metodi
library(relaimpo)
myplot <- calc.relimp(fit,type=c("lmg","last","first","pratt"), rela=TRUE)
plot(myplot, main="Importanza relativa delle variabili indipendenti") # stampa il grafico
→ calcola l'importanza relativa di ciascuna variabile indipendente mediante bootstrap
boot <- boot.relimp(fit, b = 1000, type = c("lmg", "last", "first", "pratt"), rank = TRUE, diff = TRUE, rela = TRUE)
booteval.relimp(boot) # presenta i risultati e stampa il grafico
plot(booteval.relimp(boot,sort=TRUE), main="Importanza relativa delle variabili indipendenti")
→ identificazione degli outliers, inizia caricando la libreria car
library(car)
→ identificazione degli outliers, valore p di Bonferonni per le osservazioni estreme (outliers)
outlier.test(fit)
→ identificazione degli outliers, grafico dei quantili per i residui studentizzati (fare click con il mouse su un punto per identificarlo)
qq.plot(fit, main="Grafico dei quantili per i residui")
→ identificazione degli outliers, grafico dell'influenza dei dati sulle conclusioni
leverage.plots(fit, ask=FALSE)
→ identificazione degli outliers, grafico della distanza D di Cook, identifica i valori con D > 4/(n-k-1)
cutoff <- 4/((nrow(mydata)-length(fit$coefficients)-2))
plot(fit, which=4, cook.levels=cutoff)
→ identificazione degli outliers, un altro grafico dell'influenza dei dati sulle conclusioni
influencePlot(fit, main="Grafico dell'influenza dei dati", sub="Dimensione dei cerchi proporzionale alla distanza D di Cook" )
→ test per la linearità, grafico componenti + residui
cr.plots(fit, one.page=TRUE, ask=FALSE)
→ test per la linearità, grafico di Ceres
ceres.plots(fit, one.page=TRUE, ask=FALSE)
→ test per la linearità, un test globale per l'assunto di linearità
library(gvlma)
gvmodel <- gvlma(fit)
summary(gvmodel)
→ se desiderate aggiungere uno scatterplot...
library(car)
scatterplot.matrix(~Colesterolo+HDL+LDL+Trigliceridi, reg.line=lm, smooth=TRUE, span=0.5,  diagonal = "density", data=mydata)
→ se desiderate aggiungere un correlogramma...
newdata <- mydata[c(3,4,5,6)] # crea un oggetto che include solamente le variabili che interessano
# correlogramma con gestione personalizzabile dei colori
library(corrgram)
col.corrgram <- function(ncol){colorRampPalette(c("darkgoldenrod4", "burlywood1", "darkkhaki", "darkgreen"))(ncol)}
corrgram(newdata, order=TRUE, lower.panel=panel.shade, upper.panel=panel.pie, text.panel=panel.txt, main="Analisi della correlazione")
→ se desiderate aggiungere uno scatterplot 3d che potete ruotare con il mouse...
library(rgl)
attach(newdata)
plot3d(LDL,Colesterolo,HDL, col="red", size=3)
 
Cluster analysis
 
→ create la cartella C:\R\Cluster\;
→ salvate (tasto destro del mouse, Salva con nome...) in questa cartella i file Cluster.txt, Clusterhclust.csv  e Clusterpvclust.csv;
→ dalla Console di R con File >> Apri script... aprite il file C:\R\Cluster\Cluster.txt nell’Editor di R.
 
Il contenuto del file Clusterhclust.csv aperto con Excel© o con OpenOffice.org Calc© vi apparirà così, con i nomi delle variabili nella prima riga, i dati di ciascun caso nelle righe successive, e l’dentificativo di ciascun caso nella prima colonna:
 

id

Calcio

Fosfato

Ossalato

Magnesio

C1

99

81

69

61

C2

78

65

53

43

C3

81

66

38

54

C4

45

23

19

16

C5

44

18

24

19

C6

102

83

72

66

C7

83

68

49

45

C8

74

71

41

57

C9

38

19

22

14

C10

48

14

21

12

 
Si tratta dei dati relativi alla composizione in calcio, fosfato, ossalato e magnesio di 10 calcoli delle vie urinarie.
 
Eseguite passo passo il codice dello script del primo esempio copiandolo dalla finestra dell’Editor di R nella quale lo avete aperto e incollandolo nella Console di R per eseguirlo (se non  viene eseguito premete il tasto invio):
→ importa i dati
mydata <- read.table("c:/R/Cluster/Clusterhclust.csv", header=TRUE, sep=";", row.names="id")
→ visualizza i dati
mydata
→ effettua il clustering gerarchico con il metodo di Ward
d <- dist(mydata, method = "euclidean") # matrice delle distanze euclidee
fit <- hclust(d, method="ward")
plot(fit, main="Cluster analysis: dendrogramma", xlab="Differenti calcoli delle vie urinarie analizzati", ylab="Distanza nella composizione") # traccia il dendrogramma
groups <- cutree(fit, k=3) # divide in n cluster principali, da cambiare al bisogno
# evidenzia gli n cluster, attenzione a digitare invio nella Console di R
rect.hclust(fit, k=3, border="red")
 
Al termine vi comparirà una finestra con il dendrogramma risultante dalla cluster analysis mediante clustering gerarchico.
 
Non entro nei dettagli del codice utilizzato, che potete facilmente riutilizzare per le vostre specifiche esigenze semplicemente ricordandovi di:
→ sostituire il nome del file "c:/R/Cluster/Clusterhclust.csv" con quello del vostro file;
→ controllare il separatore di campo usato ed eventualmente correggere opportunamente il punto e virgola in sep=";";
→ togliere per intero “, row.names="id"” se il votro file non contiene una variabile id con gli identificativi univoci dei vostri casi;
→ adattare il testo delle legende main=””, xlab=”” e ylab=””;
→ cambiare nel comando groups <- cutree(fit, k=3) il valore di k, che indica quanti sono i gruppi principali identificati dalla cluster analysis (sta a voi valutarlo in base alle distanze verticali dei dendrogrammi);
→  adattare il codice rect.hclust(fit, k=3, border="red") al valore di k prescelto ed eventualmente cambiare il colore del bordo (border=) dei riquadri che evidenziano  i gruppi principali identificati dalla cluster analysis.
 
Adesso nella finestra dell’Editor di R selezionate il codice del secondo esempio, copiatelo e incollatelo per intero nella Console di R. Di nuovo vi comparirà una finestra con il dendrogramma. Notate che il comando
library(pvclust)
vi farà (la prima volta che lo utilizzate) collegare a Internet per scaricare dal CRAN la libreria pvclust e installarla sul vostro PC.
 
Si tratta sempre degli stessi dati relativi ai calcoli: ma attenzione! I dati delle righe sono stati trasposti nelle colonne (verificatelo aprendo il file di dati Clusterpvclust.csv con Excel© o con OpenOffice.org Calc©):
 

id

C1

C2

C3

C4

C5

C6

C7

C8

C9

C10

Calcio

99

78

81

45

44

102

83

74

38

48

Fosfato

81

65

66

23

18

83

68

71

19

14

Ossalato

69

53

38

19

24

72

49

41

22

21

Magnesio

61

43

54

16

19

66

45

57

14

12

 
La trasposizione tra righe e colonne sopra indicata si rende necessaria per la libreria pvclust. Il metodo di clustering gerarchico applicato prevede in più, rispetto al caso precedente, il calcolo mediante bootstrap dei valori di probabilità p che caratterizzano i cluster formati in due modi differenti: come “Bootstrap Probability values” (indicati con BP) e come “Approximately Unbiased probability values” (indicati con AU). Anche in questo caso il codice può essere interamente riutilizzato personalizzandolo opportunamente, come indicato a proposito del primo esempio.
 
 
********************************
 
 

 

BuiltWithNOF
[Home] [Errori cognitivi] [Epistemologia] [Teorema di Bayes] [Decisioni mediche] [Le basi biochimiche]
[Analisi tradizionali] [Analisi genetiche] [Qualità in laboratorio] [Statistica e laboratorio]
[Storia delle medicina] [Download] [Link] [Bacheca] [FAQ] [Chi sono]
Cornice_265
iNRiM
Il linguaggio delle misure
it
LabTestOnline
The_Merck_Manual
Tavole metaboliche
IEoMet
Manuale Merck di diagnosi
e terapia
Tavole metaboliche
Errori congeniti del metabolismo
R
Corso base di statistica con R
new
Espressione dei risultati nel laboratorio di chimica clinica
Espressione dei risultati
Inprimopianochiaro

Senza dati di appropriatezza i tagli indiscriminati sono inevitabili

 Attualità in tema di eGFR:

 eGFR o creatinina nel siero?

 eGFR, indagine in Piemonte  [b]

 eGFR, riflessioni critiche  [b]

Esercizi di statistica

Teorema di Bayes e medicina basata sull’evidenza (EBM)

Informazione diagnostica e curve ROC

Gradi centigradi o gradi Celsius?

Download02

Programma di statistica Ministat (versione per Windows)

Programma di statistica Open Source R
(per Linux, Mac OS X e Windows)
OpenOffice, la suite Open Source (per Linux, Mac OS X e Windows)

Regressione lineare parametrica con quattro modelli inclusa la regressione di Deming

Calcolo degli intervalli di confidenza di sensibilità, specificità, valore predittivo, likelihood ratio

 I migliori  02  scelti per voi...

The Medical Biochemistry Page

Corso di Epidemiologia

FreeBooks4Doctors

Westgard QC

Le letture
consigliate
Book-03-june

         L’articolo da non perdere...    

E ora che i test genetici sono alla portata di tutti?
Con meno di mille euro è possibile comprare un test genetico su Internet: si manda un piccolo campione di cellule e poi si aspetta la risposta.
Ma... a che cosa serve la risposta?
Un dossier di Marika De Acetis,
lo trovate sul sito www.torinoscienza.it
I migliori libri del mese
 
Leonard Mlodinow
   La passeggiata dell’ubriaco. Le leggi scientifiche del caso.
Rizzoli Editore, 2009, pp. 294. ISBN: 17034081.
I migliori libri del mese
 
  Giovanni Federspil
   Logica clinica. I principi del metodo in medicina.
McGraw-Hill, 2004, pp. 368. ISBN: 88 386 2984-6.
ebooks...
new 
M. Besozzi
Errori cognitivi, probabilità e decisioni mediche. Applicazioni e utilità del teorema di Bayes nella diagnostica di laboratorio.
ebooks...
 
Wim P. Krijnen
Applied Statistics for Bioinformatics using R
 ebooks...
 
Mauss, Berg, Rockstroh, Sarrazin, Wedemeyer, at al.
Hepatology - A clinical textbook. Terza Edizione - 2012
ebooks...
 
Dennis A. Noe
The logic of Laboratory Medicine.