Kāpēc man patīk R un kāpēc to lieku mācīties citiem?

Tie, kas pēdējos gados pie manis ir studējuši, vai arī tie, kuriem esmu sniedzis kādas konsultācijas statistikas jomā, būs sapratuši, ka esmu kļuvis par lielu R programmas fanu.

Vairums no iepriekšminētajiem cilvēkiem, vismaz pirmajā reizē, ieraugot R nodomā, ka tā ir kaut kāda briesmīga, varbūt pat novecojusi un grūti saprotama programma/valoda, par kuras lietderību ir ilgi jāšaubās.

Kāpēc tad es tomēr esmu par R. Lūk, pāris mani argumenti:

  1. R ir brīvā koda bezmaksas programma – izvēloties šo programmu Jums nav jāiegulda līdzekļi programmā, nav katru gadu jāatjauno licences, kā tas ir dažās plaši zināmās statistikas programmās (piemēram, SPSS), vai arī Jums nav jākļūst par datorpirātu un jāmeklē iespēja nelegāli tikt pie programmas, ja to nevarat atļauties. Turklāt atšķirībā no dažām citām programmām, Jums nav pienākums katru gadu pāriet uz citu programmas versiju, kurā bieži daudz kas ir mainījis.

  2. Ar R Jūs varat izveidot ļoti augstas kvalitātes grafikus – Jums ir dota gandrīz pilnīgi brīva vaļa izpausties savās mākslinieciskajās domās, kombinēt neskaitāmus mainīgos, veidot vairāku grafiku savienojumus utt. Ierobežojums ir Jūsu iztēle un diemžēl Jūsu vēlme pavadīt laiku rakstos atbilstošās komandu rindas.

  3. Principā, šobrīd lielākā daļa statistisko testu un procedūru, kas ir pieejamas, ir veicamas programmā R, turklāt norisinās nepārtraukts darbs pie tā, lai ieviestu jaunas iespējas. Kā lielākā priekšrocība jāmin tas, ka šīs jaunās iespējas parādās programmā īsā laikā. Kā domājat, cik ilgi Jums būtu jāgaida, lai, piemēram, SPSS tiktu ieviests kāds specifisks tests, ko varbūt pasaulē vajag kādiem 100 vai 1000 lietotājiem?

  4. Saistībā ar programmu R ir daudz lietotāju forumu, mailing-lists utt., kas ļauj atrast risinājumu problēmām, ar kurām paši reizēm netiekat galā.

Protams, šajā “medus mucā” ir arī kāda darvas karote, turklāt vairākas:

  1. Vairumam lietotāju kā galvenā problēma ir tas, ka visas darbības notiek ar komandu rindām. Jums ir jāzina, ko vēlaties darīt un ar kādu funkciju to izdarīt (bet tas izslēdz iespēju kaut ko vienkārši klikšķināt, lai kaut kas notiktu). Protams, risinājums ir speciālie rīki kā R-commander, kas ļauj strādāt arī “klikšķināšanas” režīmā, bet, ja vajadzēs kaut ko specifisku, nāksies atgriezties pie komandu rindām.

  2. Bāzes R versijā ir pieejami tikai pamatstatistiskie testi, pamatgrafiki un funkcijas datu apstrādei, bet specifiskas lietas ir iekļautas papildus paketēs, kuru skaits ir mērāms tūkstošos. Lūk, šeit sākas galvenā problēma – ja ir nepieciešams kaut ko atrast, reizēm ir jāpavada ilgs laiks meklējot internetā pēc Jums vajadzīgo funkciju un pakešu nosaukuma, jo vismaz dažiem autoriem ir slinkums izveidot normālus aprakstus, kas ļautu ātrāk nonākt pie rezultāta. Diemžēl arī R projekta mājaslapa nav tā izpalīdzīgākā šajā jautājumā. Tāpēc arī pats mēdzu kaut kādas funkcijas uzrakstīt pats, nekā cenšos noskaidrot vai kāds cits to jau nav izdarījis.

Kādi tad būtu ieteikumi attiecībā uz R un citām statistikas programmām:

  1. Es nesaku, ka citas programmas ir sliktas – ja Jums ir pieejams SPSS, Stata vai kāda cita programma, tad to lietojiet. Bet, ja Jums ir jāizvēlas vai pirkt jaunu programmu vai sākt lietot programmu R, apdomājiet kārtīgi vai ir vērts tērēt lielu naudu, ja reāli izmantosiet tikai sīku daļu no visām iespējām.

  2. Ja esat nolēmuši sākt mācīties vai Jums liek mācīties R, galvenais nosacījums ir: atmetiet visus aizspriedumus un nesāciet ar domu, ka neko nesaprotat un ka Jums to nekad nevajadzēs. Jāatzīstas, ka arī es pats R apguvu tikai ar otro piegājienu, jo pirmajā reizē atmetu ar roku kā pārāk sarežģītai lietai.

  3. Lai apgūtu R, būs nepieciešams vairāk laika, nekā citām programmām, un visdrīzāk, ka nekad Jūs neiemācīsieties visas iespējas. Bet sasniedzot noteiktu līmeni, sapratīsiet, ka ieguldītais laiks atmaksājas.

Didzis Elferts
Didzis Elferts
Datu zinātnieks, vadošais pētnieks

Manas zinātniskās intereses saistītas ar statistiku un programmu R.