Tag Archives: RPrograme

Menyajikan data : Boxplot

Mempelajari karakteristik dan distribusi data dapat dilakukan dengan beberapa teknik. Salah satu diantaranya adalah melalui penggunaan box plot. Box plot atau boxplot (diagram box-and-whisker) merupakan suatu kotak berbentuk bujur sangkar. Melalui penggunaan boxplot kita dapat mendeskripsikan data numeris melalui grafik dalam beberapa ukuran yaitu  yaitu: nilai observasi terkecil, kuartil terendah atau kuartil pertama (Q1), median (Q2) atau nilai pertengahan, kuartil tertinggi atau kuartil ketiga (Q3), dan nilai observasi terbesar. Selain itu, dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari data yang telah kita observasi. Nilai outlier biasanya dicari sebagai langkah awal untuk melihat kenormalan data yang kita miliki.

Pada kesempatan ini saya akan mencoba membuat boxplot dengan menggunakan program R dengan langkah-langkah sebagai berikut :

  1. Download file berikut: Data suku tanaman dan tinggi, kemudian dengan menggunakan Microsoft excel, ubah data tersebut ke format *.csv seperti yang telah dijelaskan pada tutorial sebelumnya. 
  2. Tahap selanjutnya silahkan buka RStudio dan masukkan data tersebut. Aabila saudara belum mengetahui cara memasukkan data di RStudio, saudara dapat       mempelajarinya di materi Cara Input Data Pada Rstudio.
  3. Apabila data sudah berhasil masuk ke dalam sistem, tampilan data tersebut akan terlihat di jendela View Files and Data seperti di bawah ini.Slide5
  4. Tulis kode berikut: names(Data1) pada jendela console untuk melihat daftar nama variable dalam data tersebut,  kemudian tulis kode berikut: attach(Data1) agar data tersebut dapat dikenali oleh RStudio.
  5. Tulis kode berikut boxplot(Tinggi..cm~Suku) kemudian tekan enter. Boxplot akan muncul pada jendela See Files, Plots, Packages, and Help. Jika saudara ingin menyimpan image dari boxplot tersebut, klik export > save as image pada jendela See Files, Plots, Packages, and Help. Saudara dapat mengganti format image tersebut ke dalam berbgai format seperti PNG, JPG dan BMP. Selamat Mencoba. 🙂

Slide6

Analisis Deskriptif dengan menggunakan RPrograme

Sebelum melakukan olah data yang lebih dalam banyak diantara kita yang mengawalinya dengan melakukan analisis deskriptif. Program R menyediakan tools untuk dapat mengetahui nilai mean, standard deviasi, nilai max dan minimum serta range. Berikut beberapa code di RStudio untuk menghitung nilai dari beberapa parameter statistika deskriptif:

  1. Mean: mean(nama.variable)
  2. Standard deviation: sd(nama.variable)
  3. Nilai maksimum (maximum value): max(nama.variable)
  4. Nilai minimum (minimum value): min(nama.variable)
  5. Range: range(nama.variable) 

Pada kesempatan ini, kita akan menghitung mean, sd, max, min, dan range dari Data Tinggi Tanaman sudah pernah kita gunakan pada tutorial sebelumnya. Untuk melakukan analisis deskriptif ada beberapa langkah dilakukan, sama seperti awal saat kita memasukkan data tinggi tanaman.

  1. Dengan menggunakan Ms. Excel, Ubah data tersebut dari format *.xlsx ke *.csv
  2. Buka RStudio
  3. Masukkan data tersebut ke RStudio (bisa melihat tulisan saya sebelumnya)
  4. Tulis names(Data1) untuk melihat nama variable yang digunakan pada data tersebut
  5. Attachdata dengan menuliskan attach(Data1) di jendela console dan tekan enter
  6. Tulis kode-kode diatas dan ganti nama variable dengan nama variable tinggi tanaman (Tinggi..cm.). Kode-kode tersebut selanjutnya berubah menjadi:
      • mean(Tinggi..cm.)
      • sd(Tinggi..cm.)
      • max(Tinggi..cm.)
      • min(Tinggi..cm.)
      • range(Tinggi..cm.)
  1. Setelah semua tertulis, tekan enter, maka akan keluar output seperti di bawah ini :Slide4