Analisis Komponen Utama (Principal Component Analysis)

Analisis komponen utama (AKU) adalah salah satu metode yang digunakan untuk mengatasi permasalahan ketika kita menghadapi begitu banyaknya dimensi gugus data yang diperoleh dalam sebuah penelitian. Banyaknya sumber daya data yang kita peroleh seringkali mengakibatkan tumpang tindih antara data yang satu dengan data yang lainnnya, AKU mampu mempertahankan sebagian besar informasi yang diukur dengan menggunakan sedikit peubah yang menjadi komponen utamanya saja.

Sebagai contoh analisis komponen utama dapat digunakan peneliti yang sedang melakukan pengamatan karakterisasi tanaman. Akan ada begitu banyak gugus data yang diperoleh seperti tinggi tanaman, jumlah daun, panjang dan lebar daun, jumlah batang, panjang batang, diameter batang, jumlah tunas, dan masih banyak yang lainnya. Tentunya peneliti menginginkan data yang diperoleh tidak sebanyak data tersebut namun tanpa kehilangan informasi yang diukur.

Menentukan banyaknya komponen utama dapat ditentukan dengan tiga metode yaitu berdasarkan kumulatif proporsi keragaman total, menggunakan matriks korelasi dan penggunaan grafik/plot scree.

Ada banyak aplikasi/software statistik yang dapat kita gunakan untuk menentukan jumlah komponen utama saat ini saya akan mencoba menggunakan aplokasi SAS untuk menentukan banyaknya komponen utama. Prosedur PRINCOMP merupakan prosedur yang biasa digunakan dalam mengerjakan analisis komponen utama. Bentuk perintahnya adalah :

PROC PRINCOMP;

VAR variables;

RUN;

Berikut ini ilustrasi penggunaan aplikasi SAS untuk analisis komponen utama.

Sejumlah benih mendapatkan perlakuan radiasi sinar gamma untuk memperoleh mutan tanaman jeruk yang memiliki keragaman yang tinggi. Keragaman yang diperoleh dapat digunakan untuk bahan seleksi sehingga diperoleh tanaman jeruk unggul. Benih tanaman jeruk hasil radiasi ini ditanaman pada sepetak lahan kemudian diamati karakter vegetatifnya. Dari sejumlah benih yang ditanam dalam beberapa bulan setelah tanamn ternyata hanya 10 tanaman jeruk yang mampu bertahan.

Langkah pertama adalah kita harus memasukan data terlebih dahulu seperti di bawah ini :

Jeruk

Keterangan     : TT=Tinggi tanaman, JB=jumlah batang, DB=Diameter batang, JD=Jumlah daun, PDL=panjang daun terluas, PDS=Panjang daun tersempit, LDL=Lebar daun terluas, LDS=Lebar daun tersempit, PPL=panjang petiole daun terluas, PPS=panjang petiole daun tersempit, BB=Bobot buah.

Catatan          : Dalam analisis yang sesungguhnya sebaiknya perlu dilakukan eksplorasi data lengkap termasuk pembuatan plot dan grafik analisis korelasi dan statistika deskriptif. Pada ilustrasi ini kita lakukan korelasi antar peubah yang terlibat seperti di bawah ini :

Jeruk2

Keluaran dari perintah di atas adalah :

Korelasi Jeruk

Jika kita amati secara seksama tabel korelasi di atas kita lihat bahwa beberapa peubah saling berkorelasi. Misalnya saja tinggi tanaman berkorelasi dengan diameter batang dengan koefisien korelasi sebesar 0,48032. Selanjutnya, untuk memperoleh komponen utama perintah yang diberikan adalah :

Jeruk3

Out put yang dihasilkan terdiri atas beberapa bagian yang perlu dicermati. Pertama, PROC PRINCOMP membuat daftar banyaknya peubah dan objek yang diamati (Gambar). Selanjutnya PROC PRINCOMP menampilkan akar ciri dan vektor ciri dari matrix korelasi. Akar ciri dapat diinterpretasikan sebagai ragam dari kombinasi-kombinasi komponen dan vektor ciri sebagai bobot yang digunakan untuk menyusun skor komponen utama.

Jeruk4

Jeruk5

Komponen utama pertama mengandung hampir 50% keragaman data asal dan empat komponen pertama mampu menjelaskan hampir 95% keragaman data. Masing-masing komponen sisanya hanya memiliki kontribusi keragaman kurang dari lima persen, ini berarti kita bisa membuang komponen-komponen akhir, kita hanya empat komponen pertama tanpa kehilangan banyak informasi.

Output hasil selanjutnya adalah sebagai berikut :

Jeruk6

Vektor-vektor ciri dapat diinterpretasikan sebagaikoefisien yang menyusun skor komponen dari data terpusat. Jika kita melihat besarnya koefisien pada KU terlihat bahwa nilai koefisien ada yang bernilai negatif dan positif, hal ini wajar dalam analisis komponen utama. Dengan melihat nilai dari vektor ciri tersebut maka diperoleh :

KU1 TT, PDL, LDL, dan LDS.
KU2 PPL dan PPS.
KU3 DB dan BB.
KU4 JB, JD dan PDS.

 Demikian ulasan singkat analisis komponen utama, semoga bermanfaat🙂