Exemple:

Les données de l’étude Kawasaki se trouvent dans un ensemble de données SAS avec 167 observations (une pour chaque enfant) et trois variables, un numéro d’identification, le bras de traitement (GG ou ASA) et une variable indicatrice pour toute anomalie de l’AC à la visite 3 ou à la visite 4.

L’option ORDER=

L’instruction PROC FREQ possède une option qui définit l’ordre dans lequel les valeurs apparaissent dans les fréquences et les tableaux croisés générés par PROC FREQ.

La valeur par défaut est ORDER=INTERNAL, ce qui signifie que les données sont ordonnées (alphabétiquement ou numériquement) par les valeurs non formatées des données. Par exemple, la variable ARM dans l’exemple ci-dessus prend la valeur ‘ASA’ ou ‘GG’, et donc, par défaut, les valeurs ASA apparaîtront avant les valeurs GG dans la sortie de PROC FREQ.

L’option ORDER=FORMATTED ordonne les données selon les valeurs formatées (par ordre croissant) des variables. Les impacts des autres options ORDER= sont donnés à la fin de ce module.

Formater le résultat pour que l’événement soit dans la première colonne

En utilisant le format ci-dessous, puisque « E » vient avant « N » par ordre alphabétique, « Événement » sera dans la colonne 1 et « Pas d’événement » dans la colonne 2. Cependant, ASA sera dans la ligne 1 puisque ASA est formaté  » 0-Aspirine  » et GG est formaté  » 1-Gamma Globuline « .

proc format;

value $armf « ASA »= »0-Aspirine » « GG »= »1-Gamma Globuline » ;

value eventf 0=’No event’ 1=’Event’;

run;

proc freq data=d.kawa ; order=formatted;

format arm $armf. anyv34 eventf.

tables arm*anyv34;

run ;

Autres options

Nous pouvons continuer à inclure une instruction de formatage dans chaque proc, mais préférons les formater dans une étape de données.

data one;set d.kawa;

format arm $armf. anyv34 eventf.;

Il existe plusieurs options qui peuvent être incluses après un / dans l’instruction TABLE.

  • Les options norow, nocol,et nopercent limitent le nombre d’entrées dans le tableau.
  • L’option measures estime l’odds ratio et le risque relatif avec les intervalles de confiance qui les accompagnent.
  • L’option chisq demande le test du chi-deux. L’option expected demande que les fréquences attendues des cellules soient incluses dans les cellules. Un avertissement affiché dans la sortie si plus de 20 % des cellules ont un nombre attendu inférieur à 5.

Suppression de la colonne et du pourcentage global

proc freq data=one order=formatted;

tables arm*anyv34 / nocol nopercent ;

run;

Inclusion des fréquences attendues

proc freq data=one order=formatted ;

tables arm*anyv34 / expected ;

exécution ;

Demande du test du chi carré

proc freq data=one order=formatted ;

tables arm*anyv34 / chisq ;

run;

Le tableau 2 x 2 est produit comme ci-dessus, plus la sortie suivante.

La ligne en surbrillance contient la statistique du chi carré et sa valeur p- associée.valeur

Note : Si > 20% des fréquences des cellules sont <5, SAS imprimera un avertissement et vous ne devez pas utiliser le test du chi-deux. Utilisez plutôt le test exact bilatéral de Fisher (imprimé par défaut lorsque le tableau est 2 x 2).

.

Catégories : Articles

0 commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *