reshape2 pakete

Ļoti bieži dati, kas ir jāizmanto analīzēm programmā R, ir sagatavoti nepareizā formātā, piemēram, katra mēneša dati ir savā kolonnā, bet reāli vajadzētu, ka ir viena kolonna ar mēnešu nosaukumiem, bet otrā kolonnā būtu jābūt visiem mērījumiem. Lai ērti varētu veikt datu pārveidošanu no viena formāta uz otru (no “gara” uz “platu” vai no “plata” uz “garu”), ir pieejamas vairākas funkcijas un paketes. Viena no šādām paketēm ir pakete reshape2.

Nozīmīgākās funkcijas šajā paketē ir melt() un dcast(). Funkcija melt() pārveido tabulu no “platā” formāta uz “garo”, bet funkcija dcast() tabulu pārvērš no “garā” formāta uz “plato” formātu.

df<-data.frame(diena=c(1,2,3),janv=c(1.2,3.4,5.6),febr=c(7.8,8.9,1.7))
df
##   diena janv febr
## 1     1  1.2  7.8
## 2     2  3.4  8.9
## 3     3  5.6  1.7
library(reshape2) 
df.long<-melt(df,id.vars="diena",variable.name="menesis",value.name="temp")
df.long
##   diena menesis temp
## 1     1    janv  1.2
## 2     2    janv  3.4
## 3     3    janv  5.6
## 4     1    febr  7.8
## 5     2    febr  8.9
## 6     3    febr  1.7
df.atp<-dcast(df.long,diena~menesis) 
## Using temp as value column: use value.var to override.
df.atp
##   diena janv febr
## 1     1  1.2  7.8
## 2     2  3.4  8.9
## 3     3  5.6  1.7
Didzis Elferts
Didzis Elferts
Datu zinātnieks, vadošais pētnieks

Manas zinātniskās intereses saistītas ar statistiku un programmu R.