Excel failu importēšana programmā R ar paketi readxl
Lai arī bieži ir dzirdēts, kā arī pats tā iesaku, ka datu failus labāk glabāt un importēt R kā .txt un .csv failus, jo tādējādi varam izvairīties no dažādām problēmām, tomēr reizēm ir vēlme importēt pa tiešo no Excel failiem. Lai to darītu, programmā R ir nepieciešamas papildus paketes, no kurām viena ir readxl.
Šajā paketē ir tikai divas funkcijas – excel_sheets()
un read_excel()
. Ar pirmo funkciju ir iespējams noskaidrot kādi ir lapu nosaukumi Excel failā, kuru vēlamies importēt. Otrā funkcija ir paša faila importēšanai.
Pēc noklusējuma read_excel()
importēs pirmo lapu no faila, bet to var izmainīt ar argumentu sheet =
un norādīt, kuru lapu (pēc skaita vai pēc nosaukuma) importēt. Nākamais pieņēmums ir, ka Jūsu failā pirmā rinda satur kolonnu nosaukumus – ja tas tā nav, tad jāizmanto arguments col_names =
. Šī funkcija visnotaļ veiksmīgi māk pati “saprast” kāda veida dati ir katrā no kolonnām, bet, ja tas neizdodas automātiski, tad izmantojiet argumentu col_types =
un norādiet katras kolonnas veidu (“blank”, “numeric”, “date” vai “text”). Tas, ka funkcija atpazīst datumu kolonnu, lielā mērā aiztaupa papildus darbības kolonnu pārvēršanā turpmākajā darba procesā.
library(readxl)
dati <- read_excel("faila.nosaukums.xlsx")