L'istruzione per estrarre da una matrice dati tutte le righe che hanno un certo campo valorizzato in una particolare maniera è subset. La funzione vuole come parametri il dataset e la condizione
dati_pippo = subset(dati, miacolonna %in% c(1) )
nell'esempio precedente vengono filtrate tutte le righe della variabile dati che hanno il valore della colonna miacolonna impostato ad 1
Per estrarre una riga, una colonna o un singolo elemento da una matrice dati è necessario utilizzare la notazione
matrice[R,C]
con R o C opzionali. Omettendo il numero di riga ma non quello di colonna C si ottiene tutta la colonna C; omettendo il numero di colonna ma non il numero di riga R si ottiene tutta la riga R; valorizzando sia R che C si ottiene l'elemento di posizione (R,C). Attenzione! La numerazione parte da 1!!!
ES:
> mtcars[,2] [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4 #mostra la seconda colonna di mtcars > mtcars[1,] mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21 6 160 110 3.9 2.62 16.46 0 1 4 4 #mostra la prima riga di mtcars
Queste due istruzioni producono lo stesso risultato
subset(dati, state.region ==2)
e
dati[dati$state.region==2 ,]