Esempio:

I dati dello studio Kawasaki sono in un set di dati SAS con 167 osservazioni (una per ogni bambino) e tre variabili, un numero ID, il braccio di trattamento (GG o ASA), e una variabile indicatore per qualsiasi anomalia CA alla visita 3 o alla visita 4.

L’opzione ORDER=

L’istruzione PROC FREQ ha un’opzione che definisce l’ordine in cui i valori appaiono nelle frequenze e nelle tabelle incrociate generate da PROC FREQ.

Il default è ORDER=INTERNAL, che significa che i dati sono ordinati (alfabeticamente o numericamente) in base ai valori non formattati dei dati. Per esempio, la variabile ARM nell’esempio precedente assume un valore di ‘ASA’ o ‘GG,’ e quindi, per default, i valori ASA appariranno prima dei valori GG nell’output di PROC FREQ.

L’opzione ORDER=FORMATTED ordinerà i dati per valori formattati (ascendenti) delle variabili. Gli impatti delle altre opzioni ORDER= sono dati alla fine di questo modulo.

Formattare il risultato in modo che l’evento sia nella prima colonna

Utilizzando il formato qui sotto, poiché “E” viene prima di “N” in ordine alfabetico, “Evento” sarà nella colonna 1 e “Nessun evento” nella colonna 2. Tuttavia, ASA sarà nella riga 1 e “N” nella colonna 2. Tuttavia, ASA sarà nella riga 1 poiché ASA è formattato “0-Aspirina” e GG è formattato “1-Gamma Globulin”.

proc format;

valore $armf “ASA”=”0-Aspirina” “GG”=”1-Gamma Globulin”;

value eventf 0=’Nessun evento’ 1=’Evento’;

run;

proc freq data=d.kawa; order=formatted;

format arm $armf. anyv34 eventf.;

tables arm*anyv34;

run;

Altre opzioni

Possiamo continuare a includere una dichiarazione di formato in ogni processo, ma formattiamoli invece in un passo di dati.

data one;set d.kawa;

format arm $armf. anyv34 eventf.;

Ci sono diverse opzioni che possono essere incluse dopo una / nell’istruzione TABLE.

  • Le opzioni norow, nocol, e nopercent limitano il numero di voci nella tabella.
  • L’opzione measures stima l’odds ratio e il rischio relativo con i relativi intervalli di confidenza.
  • L’opzione chisq richiede il test chi-square. L’opzione expected richiede che le frequenze attese delle celle siano incluse nelle celle. Un avvertimento viene visualizzato nell’output se più del 20% delle celle ha un conteggio atteso inferiore a 5.

Suppressione della colonna e della percentuale complessiva

proc freq data=one order=formatted;

tables arm*anyv34 / nocol nopercent;

run;

Includere le frequenze attese

proc freq data=one order=formatted;

tables arm*anyv34 / expected ;

run;

Richiesta del test del Chi Quadrato

proc freq data=one order=formatted;

tables arm*anyv34 / chisq ;

run;

La tabella 2 x 2 è prodotta come sopra, più il seguente output.

La riga evidenziata contiene la statistica del chi quadro e il suo valore p-

Nota: Se > il 20% delle frequenze delle celle sono <5, SAS stamperà un avviso e non si dovrebbe usare il test del chi-quadrato. Invece, usate il test esatto di Fisher a due facce (stampato di default quando la tabella è 2 x 2).

Categorie: Articles

0 commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *