Excel failu importēšana programmā R ar paketi readxl

Lai arī bieži ir dzirdēts, kā arī pats tā iesaku, ka datu failus labāk glabāt un importēt R kā .txt un .csv failus, jo tādējādi varam izvairīties no dažādām problēmām, tomēr reizēm ir vēlme importēt pa tiešo no Excel failiem. Lai to darītu, programmā R ir nepieciešamas papildus paketes, no kurām viena ir readxl.

Šajā paketē ir tikai divas funkcijas – excel_sheets() un read_excel(). Ar pirmo funkciju ir iespējams noskaidrot kādi ir lapu nosaukumi Excel failā, kuru vēlamies importēt. Otrā funkcija ir paša faila importēšanai.

Pēc noklusējuma read_excel() importēs pirmo lapu no faila, bet to var izmainīt ar argumentu sheet = un norādīt, kuru lapu (pēc skaita vai pēc nosaukuma) importēt. Nākamais pieņēmums ir, ka Jūsu failā pirmā rinda satur kolonnu nosaukumus – ja tas tā nav, tad jāizmanto arguments col_names =. Šī funkcija visnotaļ veiksmīgi māk pati “saprast” kāda veida dati ir katrā no kolonnām, bet, ja tas neizdodas automātiski, tad izmantojiet argumentu col_types = un norādiet katras kolonnas veidu (“blank”, “numeric”, “date” vai “text”). Tas, ka funkcija atpazīst datumu kolonnu, lielā mērā aiztaupa papildus darbības kolonnu pārvēršanā turpmākajā darba procesā.

library(readxl)
dati <- read_excel("faila.nosaukums.xlsx")
Didzis Elferts
Didzis Elferts
Datu zinātnieks, vadošais pētnieks

Manas zinātniskās intereses saistītas ar statistiku un programmu R.