Tag Archives: RStatistic

Menyajikan data : Boxplot

Mempelajari karakteristik dan distribusi data dapat dilakukan dengan beberapa teknik. Salah satu diantaranya adalah melalui penggunaan box plot. Box plot atau boxplot (diagram box-and-whisker) merupakan suatu kotak berbentuk bujur sangkar. Melalui penggunaan boxplot kita dapat mendeskripsikan data numeris melalui grafik dalam beberapa ukuran yaitu  yaitu: nilai observasi terkecil, kuartil terendah atau kuartil pertama (Q1), median (Q2) atau nilai pertengahan, kuartil tertinggi atau kuartil ketiga (Q3), dan nilai observasi terbesar. Selain itu, dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari data yang telah kita observasi. Nilai outlier biasanya dicari sebagai langkah awal untuk melihat kenormalan data yang kita miliki.

Pada kesempatan ini saya akan mencoba membuat boxplot dengan menggunakan program R dengan langkah-langkah sebagai berikut :

  1. Download file berikut: Data suku tanaman dan tinggi, kemudian dengan menggunakan Microsoft excel, ubah data tersebut ke format *.csv seperti yang telah dijelaskan pada tutorial sebelumnya. 
  2. Tahap selanjutnya silahkan buka RStudio dan masukkan data tersebut. Aabila saudara belum mengetahui cara memasukkan data di RStudio, saudara dapat       mempelajarinya di materi Cara Input Data Pada Rstudio.
  3. Apabila data sudah berhasil masuk ke dalam sistem, tampilan data tersebut akan terlihat di jendela View Files and Data seperti di bawah ini.Slide5
  4. Tulis kode berikut: names(Data1) pada jendela console untuk melihat daftar nama variable dalam data tersebut,  kemudian tulis kode berikut: attach(Data1) agar data tersebut dapat dikenali oleh RStudio.
  5. Tulis kode berikut boxplot(Tinggi..cm~Suku) kemudian tekan enter. Boxplot akan muncul pada jendela See Files, Plots, Packages, and Help. Jika saudara ingin menyimpan image dari boxplot tersebut, klik export > save as image pada jendela See Files, Plots, Packages, and Help. Saudara dapat mengganti format image tersebut ke dalam berbgai format seperti PNG, JPG dan BMP. Selamat Mencoba. 🙂

Slide6

Analisis Deskriptif dengan menggunakan RPrograme

Sebelum melakukan olah data yang lebih dalam banyak diantara kita yang mengawalinya dengan melakukan analisis deskriptif. Program R menyediakan tools untuk dapat mengetahui nilai mean, standard deviasi, nilai max dan minimum serta range. Berikut beberapa code di RStudio untuk menghitung nilai dari beberapa parameter statistika deskriptif:

  1. Mean: mean(nama.variable)
  2. Standard deviation: sd(nama.variable)
  3. Nilai maksimum (maximum value): max(nama.variable)
  4. Nilai minimum (minimum value): min(nama.variable)
  5. Range: range(nama.variable) 

Pada kesempatan ini, kita akan menghitung mean, sd, max, min, dan range dari Data Tinggi Tanaman sudah pernah kita gunakan pada tutorial sebelumnya. Untuk melakukan analisis deskriptif ada beberapa langkah dilakukan, sama seperti awal saat kita memasukkan data tinggi tanaman.

  1. Dengan menggunakan Ms. Excel, Ubah data tersebut dari format *.xlsx ke *.csv
  2. Buka RStudio
  3. Masukkan data tersebut ke RStudio (bisa melihat tulisan saya sebelumnya)
  4. Tulis names(Data1) untuk melihat nama variable yang digunakan pada data tersebut
  5. Attachdata dengan menuliskan attach(Data1) di jendela console dan tekan enter
  6. Tulis kode-kode diatas dan ganti nama variable dengan nama variable tinggi tanaman (Tinggi..cm.). Kode-kode tersebut selanjutnya berubah menjadi:
      • mean(Tinggi..cm.)
      • sd(Tinggi..cm.)
      • max(Tinggi..cm.)
      • min(Tinggi..cm.)
      • range(Tinggi..cm.)
  1. Setelah semua tertulis, tekan enter, maka akan keluar output seperti di bawah ini :Slide4

Cara input data pada RStudio

Bagi rekan yang menggunakan program R sebagai tools dalam pengolahan data maka kegiatan input data merupakan hal yang sangat penting saat memulai analisis data. Di bawah ini saya sampaikan bagaimana menginput data melalui R Studio. Semoga bermanfaat

  1. Silahkan mendownload file berikut : data_tinggi_tanaman lalu buka file tersebut dengan menggunakan Microsoft Excel. Format yang digunakan sebagai bahan input harus dalam bentuk format .csv oleh sebab itu lakukan perubahan format file dengan cara Pilih menu > file > save as dan dilanjutkan dengan memilih direktori penyimpanan file. Setelah kotak dialog Save As muncul, pada drop-downsave as type pilih CSV (Comma delimited) kemudian simpan dengan nama yang sama lalu klik save.
  2. Langkah selanjutnya buka RStudio, tulis kode berikut Data1 <- read.csv(file.choose(), header=TRUE)pada jendela consoledan tekan enter. Penjelasan dari kode Data1 <- read.csv(file.choose(), header=TRUE) adalah
    • Data1 merupakan identifier (nama) dari data yang anda masukan. Saudara dapat menggantinya dengan nama lain sesuai keinginan saudara.
    • read.csv berarti file yang akan dibuka berformat csv.
    • file.choose() berarti file yang akan dibuka ditentukan dengan cara memilih
    • Header=TRUE berarti baris pertama pada file csv tersebut akan digunakan sebagai header.
  1. Setelah muncul kotak dialog Select file, pilih file Data Tinggi Tanaman.csv, lalu klik OpenSlide2
  2. Untuk melihat data yang di-input-kan, tulis code View(Data1)pada jendela console.

Slide3

  1. Apabila data berhasil dimasukkan, data tersebut akan terlihat di jendela View Files and Data