Academia.eduAcademia.edu

ANALISIS BIPLOT

ANALISIS PEUBAH GANDA Oleh: Siswanto (G151150021) Fizry L. Maulida (G151150251) Abraham Madison Manurung (G151150311) Ira Rosianal Hikmah (G151150341) SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGORBOGOR 2016 22 PENDAHULUAN Dalam analisis multivariat terdapat banyak metode yang dapat digunakan untuk menyelesaikan masalah atau mengolah data yang melibatnya banyak variabel. Semakin banyak variabel yang diukur maka semakin banyak pula objek yang diamati. Akibatnya, ukuran tabel yang dimiliki akan semakin besar dan sulit diinterpretasikan. Oleh karena itu, diperlukan suatu metode yang memudahkan dalam menginterpretasikan data yang kita miliki. Salah satu metode multivariat yang dapat digunakan untuk mengatasi permasalahan itu adalah metode biplot. Metode biplot mampu menggambarkan data yang ada pada tabel ringkasan dalam grafik dimensi dua. Analisis biplot bersifat deskriptif yaitu dengan menyajikan secara visual suatu kumpulan objek dan variabel dalam satu grafik yang berbentuk bidang datar. Menurut Sartono, dkk (2003), terdapat 4 informasi penting yang diperoleh dari tampilan biplot, diantaranya : 1. Kedekatan antar objek yang diamati Yaitu mengetahui objek yang memiliki kemiripan karakteristik dengan objek lain. Dua objek dikatakan memiliki karakteristik yang sama jika digambarkan sebagai dua titik dengan posisi yang berdekatan. 2. Keragaman variabel Yaitu melihat apakah ada variabel yang memiliki nilai keragaman yang hampir sama untuk setiap objek. Variabel yang memiliki nilai keragaman kecil digambarkan dengan vektor pendek sedangkan variabel yang memiliki nilai keragaman besar digambarkan dengan vektor panjang. 3. Korelasi antar variabel Yaitu mengetahui bagaimana suatu variabel mempengaruhi atau dipengaruhi variabel lain.variabel akan digambarkan sebagai garis berarah. Dua variabel yang memiliki nilai korelasi positif (+) digambarkan sebagai dua buah garis dengan arah yang sama atau membentuk sudut sempit < ° . Dua variabel yang memiliki nilai korelasi negatif digambarkan sebagai dua buah garis dengan arah yang berlawanan atau membentuk 1 sudut lebar > ° . Dua variabel yang tidak berkorelasi digambarkan sebagai garis dengan sudut mendekati ° (siku-siku). 4. Nilai variabel pada suatu objek Yaitu melihat keunggulan dari setiap objek. Suatu objek dikatakan memiliki nilai di atas rata-rata jika objek tersebut terletak searah dengan arah vektor variabel. Jika objek terletak berlawanan dengan arah dari vektor variabel maka objek tersebut dikatakan memiliki nilai di bawah rata-rata. Jika objek hampir berada di tengah-tengahmaka objek itu dikatakan memiliki nilai yang dekat dengan rata-rata. TUJUAN Laporan tugas ini bertujuan untuk : 1. Melakukan analisis biplot pada data yang diberikan dengan menggunakan software SAS, R, dan Minitab. 2. Membandingkan hasil analisis biplot untuk ketiga software yang digunakan. 3. Menginterpretasikan hasil analisis biplot. ILUSTRASI DATA Krisis ekonomi telah berdampak pada berbagai aspek kehidupan. Salah satu sektor yang terkena dampaknya adalah sektor pendidikan. Dampak yang paling dirasakan adalah berkurangnya kemampuan untuk menyediakan pendidikan yang layak bagi anak-anak. Angka drop-out siswa dengan demikian semakin meningkat dan kualitas pelayanan pendidikan yang diselenggarakan sekolah semakin jauh berkurang. Hal ini menjadi keprihatinan tersendiri karena berkembangnya pembangunan di suatu wilayah tidak terlepas dari sumber daya yang tersedia di daerah tersebut. Tentunya hal ini tidak bisa dipisahkan dari dunia pendidikan. Sebagai salah satu upaya mengatasi dampak krisis ekonomi terhadap dunia pendidikan pemerintah telah mengembangkan Program Jaring Pengaman Sosial Beasiswa dan Dana Bantuan Operasional, yang lebih dikenal sebagai Program JPS Beasiswa dan DBO. 2 Berbagai indikator dilihat dalam hubungannya dengan keberhasilan pembangunan pendidikan di suatu wilayah, antara lain : 1. Indeks Pembanguan Manusia (HDI) 2. Produk Domestik Regional Bruto (PDRB) 3. Indeks Kemiskinan (IK) 4. Anggaran Pendapatan dan Belanja Daerah (APBD) 5. Angka Partisipasi Kasar untuk tingkat SD (APSSD) 6. Angka Partisipasi Kasar untuk tingkat SLTP (APSLTP) 7. Tingkat Drop Out untuk SD (Drop SD) 8. Tingkat Drop Out untuk SLTP (Drop SLTP) Berikut ini merupakan ringkasan data yang digunakan : Prop 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Nama Aceh Sumut Sumbar Riau Jambi Sumsel Bengkulu Lampung DKI Jabar Jateng Yogya Jatim Kalbar Kalteng Kalsel Kaltim Sulut Sulteng Sulsel Sultra Bali NTB HDI 65.3 66.6 65.8 67.3 65.4 63.9 64.8 63 72.5 64.6 64.6 68.7 61.8 60.6 66.7 62.2 67.8 67.1 62.8 63.6 62.9 65.7 54.2 PDRB 2548 1976 1678 4773 1254 1692 1158 952 5943 1616 1282 1554 1628 1871 2350 1975 8401 1434 1070 1207 907 2431 852 IK 14.91 16.15 13.56 10.95 14.54 15.68 13.11 17.23 4.33 12.89 17.97 13.53 18.34 25.65 16.06 16.97 14.98 11.69 11.13 9.38 12.79 5.31 19.65 APBD APSSD APSSLTP DropSD DropSMP 895.48 96.3 81.7 3 10.4 397.4 97.2 87.4 2.9 11.8 582.13 96.7 84 4.7 16.6 491.07 96.3 85.2 2.6 11.2 456.46 96.2 81.1 3.5 11.7 329.36 95.2 77 5 18 447.55 95.4 82.2 3.7 16.8 226.19 95.1 81 2.9 12.3 801.61 98.4 92.4 1.6 5.9 274.04 95.4 72.2 3.3 10.3 299.32 97.4 81.5 1.6 7.1 431.69 99.2 95.4 0.5 3.5 326.86 95.4 80.4 2.5 9.2 470.64 90.3 76 5.4 25.2 699.73 97.5 80.6 3.2 17 600.54 94.7 72.2 5 16.4 576.04 97 84.6 3.1 10.8 521.82 93.6 76.7 6.8 23.2 450.94 94.6 69.4 5.8 23.1 482.69 91.1 69.6 6.7 18.9 602.48 93.7 77 5.8 21.4 829.25 96.7 83.6 2.1 6.9 412.18 93 71.5 5.8 21.7 3 24 25 26 27 28 NTT Maluku IRJA Maluku Utara Banten 60.4 67.2 58.8 712 1339 4074 23.97 173.06 26.21 726.99 24.59 923.13 89 94.4 82.8 69.7 84.8 75.5 6 3 4.5 29.5 14.4 20 66.4 1329.5 21.91 238.45 63.5 1992.4 9.43 252.35 95.25 94.94 80.75 70.12 4.55 3.24 24.95 12.14 PEMBAHASAN Dari ilustrasi di atas, akan dilakukan analisis biplot untuk melihat karakteristik propinsi dilihat dari berbagai indikator pembangunan pendidikan. 1. Analisis Biplot dengan Software SAS a. Dengan Makro SAS SINTAKS : %macro BIPLOT( data=pendidikan, /* Data set for biplot */ var = hdi pdrb ik apbd apssd apssmp dropsd dropsmp, /* Variables for biplot */ id = prov, /* Observation ID variable */ dim =2, /* Number of biplot dimensions */ factype=SYM, /* Biplot factor type: GH, SYM, or JK */ scale=0, /* Scale factor for variable vectors */ power=1, /* Power transform of response */ out =BIPLOT, /* Output dataset: biplot coordinates */ anno=BIANNO, /* Output dataset: annotate labels */ xanno=dim1, yanno=dim2, zanno=dim3, std=STD, /* How to standardize columns: NONE|MEAN|STD*/ colors=BLUE RED, /* Colors for OBS and VARS */ symbols=none none, /* Symbols for OBS and VARS */ interp=none vec, /* Markers/interpolation for OBS and VARS */ pplot=NO, /* Produce printer plot? */ gplot=YES, haxis=, /* AXIS statement for horizontal axis */ vaxis=, /* and for vertical axis- use to equate axes */ name=biplot); %let std=%upcase(&std); %let factype=%upcase(&factype); %if &factype=GH %then %let p=0; %else %if &factype=SYM %then %let p=.5; %else %if &factype=JK %then %let p=1; %else %do; %put BIPLOT: FACTYPE must be GH, SYM, or JK. "&factype" is not valid.; %goto done; %end; %if %upcase("&var") ^= "_NUM_" %then %let var={&var}; %if &data=_LAST_ %then %let data=&syslast; proc iml; start biplot(y,id,vars,out, g, scale); N = nrow(Y); P = ncol(Y); %if &std = NONE %then Y = Y - Y[:] %str(;); %else Y = Y - J(N,1,1)*Y[:,] %str(;); /* remove grand mean */ /* remove column means */ 4 %if &std = STD %then %do; S = sqrt(Y[##,] / (N-1)); Y = Y * diag (1 / S ); %end; *-- Singular value decomposition: Y is expressed as U diag(Q) V prime Q contains singular values, in descending order; call svd(u,q,v,y); reset fw=8 noname; percent = 100*q##2 / q[##]; cum = cusum(percent); c1={'Singular Values'}; c2={'Percent'}; c3={'Cum % '}; Print "Singular values and variance accounted for",, q [colname=c1 format=9.4 ] percent [colname=c2 format=8.2 ] cum [colname=c3 format=8.2 ]; d = &dim ; *-- Assign macro variables for dimension labels; lab = '%let p' + char(t(1:d),1) + '=' + left(char(percent[t(1:d)],8,1)) + ';'; call execute(lab); /* call execute('%let p1=', char(percent[1],8,1), ';'); call execute('%let p2=', char(percent[2],8,1), ';'); if d > 2 then call execute('%let p3=', char(percent[3],8,1), ';'); */ *-- Extract first d columns of U & V, and first d elements of Q; U = U[,1:d]; V = V[,1:d]; Q = Q[1:d]; *-- Scale the vectors by QL, QR; * Scale factor 'scale' allows expanding or contracting the variable vectors to plot in the same space as the observations; QL= diag(Q ## g ); QR= diag(Q ## (1-g)); A = U * QL; B = V * QR; ratio = max(sqrt(A[,##])) / max(sqrt(B[,##])); print 'OBS / VARS ratio:' ratio 'Scale:' scale; if scale=0 then scale=ratio; B = B # scale; OUT=A // B; *-- Create observation labels; id = id // vars`; type = repeat({"OBS "},n,1) // repeat({"VAR "},p,1); id = concat(type, id); factype = {"GH" "Symmetric" "JK"}[1 + 2#g]; print "Biplot Factor Type", factype; cvar = concat(shape({"DIM"},1,d), char(1:d,1.)); print "Biplot coordinates", out[rowname=id colname=cvar f=9.4]; %if &pplot = YES %then %do; call pgraf(out[,{1 2}],substr(id,5),'Dimension 1', 'Dimension 2', 'Biplot'); %end; create &out from out[rowname=id colname=cvar]; append from out[rowname=id]; finish; start power(x, pow); if pow=1 then return(x); 5 if any(x <= 0) then x = x + ceil(min(x)+.5); if abs(pow)<.001 then xt = log(x); else xt = ((x##pow)-1) / pow; return (xt); finish; /*--- Main routine */ use &data; read all var &var into y[ c=vars ]; %if &id = %str() %then %do; id=compress(char(1:nrow(xy),4))`; %end; %else %do; read all var{&id} into id; %end; * read all var &var into y[colname=vars rowname=&id]; %if &power ^= 1 %then %do; y = power(y, &power); %end; scale = &scale; run biplot(y, id,vars,out, &p, scale ); quit; /*----------------------------------* | Split ID into _TYPE_ and _NAME_ | *----------------------------------*/ data &out; set &out; drop id; length _type_ $3 _name_ $16; _type_ = substr(id,1,3); _name_ = substr(id,5); label %do i=1 %to &dim; dim&i = "Dimension &i (&&p&i%str(%%))" %end; ; /*--------------------------------------------------* | Annotate observation labels and variable vectors | *--------------------------------------------------*/ %*-- Assign colors and symbols; %let c1= %scan(&colors,1); %let c2= %scan(&colors,2); %if &c2=%str() %then %let c2=&c1; %let v1= %upcase(%scan(&symbols,1)); %let v2= %upcase(%scan(&symbols,2)); %if &v2=%str() %then %let v2=&v1; %let i1= %upcase(%scan(&interp,1)); %let i2= %upcase(%scan(&interp,2)); %if &i2=%str() %then %let i2=&i1; data &anno; set &out; length function color $8 text $16; xsys='2'; ysys='2'; %if &dim > 2 %then %str(zsys='2';); text = _name_; if _type_ = 'OBS' then do; /* Label observations (row points) */ color="&c1"; if "&i1" = 'VEC' then link vec; x = &xanno; y = &yanno; %if &dim > 2 %then %str(z = &zanno;); 6 %if &v1=NONE %then %str(position='5';); %else %do; if dim1 >=0 then position='>'; else position='<'; /* rt justify */ /* lt justify */ %end; function='LABEL '; output; end; if _type_ = 'VAR' then do; /* Label variables (col points) */ color="&c2"; if "&i2" = 'VEC' then link vec; x = &xanno; y = &yanno; if dim1 >=0 then position='6'; /* down justify */ else position='2'; /* up justify */ function='LABEL '; output; /* variable name */ end; return; vec: origin to point */ x = 0; y = 0; %if &dim > 2 %then %str(z = 0;); function='MOVE' ; output; x = &xanno; y = &yanno; %if &dim > 2 %then %str(z = &zanno;); function='DRAW' ; output; /* Draw line from the return; %if &gplot = YES %then %do; %if &i1=VEC %then %let i1=NONE; %if &i2=VEC %then %let i2=NONE; %let legend=nolegend; %let warn=0; %if %length(&haxis)=0 %then %do; %let warn=1; axis2 offset=(1,5) ; %let haxis=axis2; %end; %if %length(&vaxis)=0 %then %do; %let warn=1; axis1 offset=(1,5) label=(a=90 r=0); %let vaxis=axis1; %end; proc gplot data=&out &GOUT; plot dim2 * dim1 = _type_/ anno=&anno frame &legend href=0 vref=0 lvref=3 lhref=3 vaxis=&vaxis haxis=&haxis vminor=1 hminor=1 name="&name" des="Biplot of &data"; symbol1 v=&v1 c=&c1 i=&i1; symbol2 v=&v2 c=&c2 i=&i2; run; quit; %if &warn %then %do; %put WARNING: No VAXIS= or HAXIS= parameter was specified, so the biplot axes have not; %put WARNING: been equated. This may lead to incorrect interpretation of distance and; %put WARNING: angles. See the documentation.; %end; goptions reset=symbol; %end; /* %if &gplot=YES */ %done: %mend BIPLOT; 7 data pendidikan; input prov$ hdi pdrb ik apbd apssd apssmp dropsd dropsmp; datalines; Aceh 65.30 2548.00 14.91 895.48 96.30 Sumut 66.60 1976.00 16.15 397.40 97.20 Sumbar 65.80 1678.00 13.56 582.13 96.70 Riau 67.30 4773.00 10.95 491.07 96.30 Jambi 65.40 1254.00 14.54 456.46 96.20 Sumsel 63.90 1692.00 15.68 329.36 95.20 Bengkulu 64.80 1158.00 13.11 447.55 95.40 Lampung 63.00 952.00 17.23 226.19 95.10 DKI 72.50 5943.00 4.33 801.61 98.40 Jabar 64.60 1616.00 12.89 274.04 95.40 Jateng 64.60 1282.00 17.97 299.32 97.40 Yogya 68.70 1554.00 13.53 431.69 99.20 Jatim 61.80 1628.00 18.34 326.86 95.40 Kalbar 60.60 1871.00 25.65 470.64 90.30 Kalteng 66.70 2350.00 16.06 699.73 97.50 Kalsel 62.20 1975.00 16.97 600.54 94.70 Kaltim 67.80 8401.00 14.98 576.04 97.00 Sulut 67.10 1434.00 11.69 521.82 93.60 Sulteng 62.80 1070.00 11.13 450.94 94.60 Sulsel 63.60 1207.00 9.38 482.69 91.10 Sultra 62.90 907.00 12.79 602.48 93.70 Bali 65.70 2431.00 5.31 829.25 96.70 NTB 54.20 852.00 19.65 412.18 93.00 NTT 60.40 712.00 23.97 173.06 89.00 Maluku 67.20 1339.00 26.21 726.99 94.40 IRJA 58.80 4074.00 24.59 923.13 82.80 Malut 66.40 1329.50 21.91 238.45 95.25 Banten 63.50 1992.40 9.43 252.35 94.94 ; %biplot; run; 81.70 87.40 84.00 85.20 81.10 77.00 82.20 81.00 92.40 72.20 81.50 95.40 80.40 76.00 80.60 72.20 84.60 76.70 69.40 69.60 77.00 83.60 71.50 69.70 84.80 75.50 80.75 70.12 3.00 2.90 4.70 2.60 3.50 5.00 3.70 2.90 1.60 3.30 1.60 0.50 2.50 5.40 3.20 5.00 3.10 6.80 5.80 6.70 5.80 2.10 5.80 6.00 3.00 4.50 4.55 3.24 10.40 11.80 16.60 11.20 11.70 18.00 16.80 12.30 5.90 10.30 7.10 3.50 9.20 25.20 17.00 16.40 10.80 23.20 23.10 18.90 21.40 6.90 21.70 29.50 14.40 20.00 24.95 12.14 OUTPUT : 8 Dari output di atas, dapat diinterpretasikan sebagai berikut : 1. Besarnya keragaman yang mampu dijelaskan oleh semua indikator yang digunakan untuk melihat hubungannya terhadap keberhasilan pembangunan pendidikan adalah sebesar %. Akan tetapi, dengan melakukan analisis biplot dengan mereduksi seluruh indikator ke dalam ruang berdimensi dua maka informasi yang mampu dijelaskan hanya . % yang diperoleh dari penjumlahan dari yang mampu dijelaskan dengan biplot < . % dan . %. Artinya, informasi %. Oleh karena itu, dapat dikatakan bahwa biplot belum cukup memberikan informasi mengenai hubungan kedelapan indikator tersebut. 2. Provinsi Bengkulu, Sumbar, Jambi, Jatim, Banten, Jabar, Lampung, Sumut, Jateng, Sumsel, dan Malut memiliki kemiripan karakteristik tertentu. Maluku, Kalteng, Aceh, Riau, Bali, dan Kaltim juga membentuk kelompok sendiri. Provinsi NTT, NTB, Kalbar, Sulsel, Sulteng, Sultra, Sulut, dan Kalsel juga membentuk kelompok sendiri berdasarkan kemiripan sifat peubah. 3. Terdapat keragaman yang tinggi pada peubah dropsmp, apbd, apssd, dan apssmp. Namun setiap peubah yang lain juga memiliki tingkat keragaman yang juga relatif tinggi. 4. dropsd, dropsmp,dan ik; apssmp dan hdi; memiliki korelasi positif yang cukup tinggi karena nilai cosinus sudut antar vektornya cukup sempit, begitu pula dengan variabel lain. Sedangkan ik dan apssd; dropsmp dan apssmp; hdi dan dropsd; apssd dan dropsd; dan variabel lainnya, memiliki korelasi negatif karena sudut yang dibentuk adalah sudut yang lebar. 5. Provinsi IRJA, Kalbar, NTB, NTT, Sulsel, Kalsel, Sulteng, Sulut, dan Sultra merupakan provinsi yang memiliki tingkat dropsd, dropsmp, dan ik yang tinggi. Provinsi DKI, Bali, Riau, dan Yogya memiliki tingkat apssmp dan hdi yang tinggi. Provinsi Sumbar, Bengkulu, Jambi, Jatim, Sumsel, Malut, Banten, Jabar, Lampung, Jateng, Sumut memiliki tingkat apsd yang tinggi. Sedangkan sisanya yaitu Provinsi Maluku, Kalteng, Aceh, dan Kaltim memiliki tingkat apbd dan pdrb yang tinggi. 9 b. Dengan proc printqual SAS SINTAKS : data pendidikan; input prov$ hdi pdrb ik apbd apssd apssmp dropsd dropsmp; datalines; Aceh 65.30 2548.00 14.91 895.48 96.30 81.70 3.00 10.40 Sumut 66.60 1976.00 16.15 397.40 97.20 87.40 2.90 11.80 Sumbar 65.80 1678.00 13.56 582.13 96.70 84.00 4.70 16.60 Riau 67.30 4773.00 10.95 491.07 96.30 85.20 2.60 11.20 Jambi 65.40 1254.00 14.54 456.46 96.20 81.10 3.50 11.70 Sumsel 63.90 1692.00 15.68 329.36 95.20 77.00 5.00 18.00 Bengkulu 64.80 1158.00 13.11 447.55 95.40 82.20 3.70 16.80 Lampung 63.00 952.00 17.23 226.19 95.10 81.00 2.90 12.30 DKI 72.50 5943.00 4.33 801.61 98.40 92.40 1.60 5.90 Jabar 64.60 1616.00 12.89 274.04 95.40 72.20 3.30 10.30 Jateng 64.60 1282.00 17.97 299.32 97.40 81.50 1.60 7.10 Yogya 68.70 1554.00 13.53 431.69 99.20 95.40 0.50 3.50 Jatim 61.80 1628.00 18.34 326.86 95.40 80.40 2.50 9.20 Kalbar 60.60 1871.00 25.65 470.64 90.30 76.00 5.40 25.20 Kalteng 66.70 2350.00 16.06 699.73 97.50 80.60 3.20 17.00 Kalsel 62.20 1975.00 16.97 600.54 94.70 72.20 5.00 16.40 Kaltim 67.80 8401.00 14.98 576.04 97.00 84.60 3.10 10.80 Sulut 67.10 1434.00 11.69 521.82 93.60 76.70 6.80 23.20 Sulteng 62.80 1070.00 11.13 450.94 94.60 69.40 5.80 23.10 Sulsel 63.60 1207.00 9.38 482.69 91.10 69.60 6.70 18.90 Sultra 62.90 907.00 12.79 602.48 93.70 77.00 5.80 21.40 Bali 65.70 2431.00 5.31 829.25 96.70 83.60 2.10 6.90 NTB 54.20 852.00 19.65 412.18 93.00 71.50 5.80 21.70 NTT 60.40 712.00 23.97 173.06 89.00 69.70 6.00 29.50 Maluku 67.20 1339.00 26.21 726.99 94.40 84.80 3.00 14.40 IRJA 58.80 4074.00 24.59 923.13 82.80 75.50 4.50 20.00 Malut 66.40 1329.50 21.91 238.45 95.25 80.75 4.55 24.95 Banten 63.50 1992.40 9.43 252.35 94.94 70.12 3.24 12.14 ; ods graphics on; proc prinqual data=pendidikan n=2 mdpref; transform identity(hdi pdrb ik apbd apssd apssmp dropsd dropsmp); id prov; run; 10 OUTPUT : Pada output di atas, yaitu dengan menggunakan SAS melibatkan prosedur proc prinqual menghasilkan biplot yang sama dengan total keragaman yang dapat dijelaskan oleh kedua komponen sebesar . % . %+ . %= . % . Dimana interpretasi dari keempat hal penting berdasarkan Sartono (2003) dari hasil di atas adalah sama dengan interpretasi yang dihasilkan dengan menggunakan makro SAS. 2. Analisis Biplot dengan Software R SINTAKS : ##Memanggil data awal data<-read.table("G:/ira.csv",header=T,sep=",") data.m<-as.matrix(data) ##Menyeleksi data yang akan dianalisis x<-data[,c(-1,-2)] 11 ##Biplot dengan Manual #Singular Value Decomposition y<-svd(x) #Matriks L, A, dan U L<-diag(y$d) A<-y$v U<-y$u L A #jika alfa=1 G=U H=A%*%L H #Membuat Biplot G2<-G[,1:2] H2<-H[,1:2] H2 biplot(G2,H2) ##Biplot dengan menggunakan fungsi princomp atau prcomp #Mendefinisikan Model PCA ###Model 1 model1<-princomp(x,cor=T) summary(model1) biplot(model1) ###Model 2 model2<-prcomp(x,scale=T) summary(model2) biplot(model2) OUTPUT MANUAL: 12 Karena U adalah matriks berukuran 28x8 (sangat besar) maka tidak dikeluarkan hasilnya. Begitu pula dengan G. Karena biplot, maka hanya kolom pertama dan kolom kedua dari G dan H yang dipakai. 13 OUTPUT MODEL 1: Dari output di atas, terlihat bahwa analisis biplot mampu menjelaskan keragaman sebesar 68.7%. Hasil ini sama seperti hasil makro atau prosedur prinqual pada SAS. 14 Pada output di atas, terlihat bahwa biplot pada model 1 dengan menggunakan software R menghasilkan output yang sedikit berbeda. Interpretasi output R dan SAS adalah sama, karena keempat informasi penting yang telah dijabarkan pada bagian awal (makro SAS) menghasilkan interpretasi yang sama. Perbedaannya hanyalah pada visual grafik dari segi kuadran. Jika kuadran suatu grafik kami definisikan sebagai berikut : Kuadran 2 Kuadran 1 Kuadran 3 Kuadran 4 Maka kuadran 1 pada output SAS sama dengan kuadran 3 pada output R, kuadran 2 pada output SAS sama dengan kuadran 4 pada output R, kuadran 3 pada output SAS sama dengan kuadran 1 pada output R, dan kuadran 4 pada output SAS sama dengan kuadran 2 pada output R. Oleh karena itu, dapat dikatakan bahwa grafik (biplot) R model 1 merupakan cerminan dengan SAS pada sumbu horizontal x dan vertikal y dengan hasil interpretasi yang sama dengan hasil SAS. OUTPUT MODEL 2: Dari output di atas, terlihat bahwa analisis biplot mampu menjelaskan keragaman sebesar 68.7%. Hasil ini sama seperti hasil makro atau prosedur prinqual pada SAS. 15 Pada output di atas, terlihat bahwa biplot pada model 2 dengan menggunakan software R menghasilkan output yang sedikit berbeda. Interpretasi output R dan SAS adalah sama, karena keempat informasi penting yang telah dijabarkan pada bagian awal (makro SAS) menghasilkan interpretasi yang sama. Perbedaannya hanyalah pada visual grafik dari segi kuadran. Jika kuadran suatu grafik kami definisikan sebagai berikut : Kuadran 2 Kuadran 1 Kuadran 3 Kuadran 4 Maka kuadran 1 pada output SAS sama dengan kuadran 2 pada output R, kuadran 2 pada output SAS sama dengan kuadran 1 pada output R, kuadran 3 pada output SAS sama dengan kuadran 4 pada output R, dan kuadran 4 pada output SAS sama dengan kuadran 3 pada output R. Oleh karena itu, dapat dikatakan bahwa grafik (biplot) R 16 model 2 merupakan cerminan dengan SAS pada sumbu vertikal y dengan hasil interpretasi yang sama dengan hasil SAS. 3. Analisis Biplot dengan Software Minitab Berikut ini merupakan langkah-langkah analisi biplot dengan minitab : 1. Tuliskan kembali data di atas ke dalam minitab 2. Selanjutnya kita gunakan analisis yang ada pada Minitab yaitu : Stat-MultivariatePrincipal Component 3. Lakukan Analisis. Masukan variabel yang akan dijadikan biplot, caranya adalah :  Pilih nama variabel yang ada di kolom kiri atas (HDI, PDRB, IK, APBD, APSSD, APSSLTP, DropSD, DropSMP) lalu tekan tombol Select di bagian bawahnya 17  Setelah itu kita klik tombol Graphs.. untuk menampilkan biplot dari minitab. Beri tanda centang untuk pilihan Biplot for first 2 components lalu klik OK.  Untuk menampilkan data yang digunakan oleh Minitab dalam membuat biplot, klik pilihan storage, lalu tuliskan kolom yang akan kita sisipkan data hasil perhitungan Minitab untuk membuat biplot yaitu 2 kolom untuk Coefficients dan 2 kolom untuk 18 Scores. (Di sini digunakan kolom C10, C11, C12 dan C13 karena kolom tersebut masih kosong. Lalu klik OK  Setelah itu klik tombol OK 19 Maka akan muncul grafik biplot seperti berikut: Biplot of HDI, ..., DropSMP 2 1 Second Component APSSD HDI APSSLTP DropSMP DropSD IK 0 PDRB APBD -1 -2 -3 -4 -5.0 -2.5 0.0 2.5 5.0 First Component Perhatikan grafik di atas. Terlihat bahwa output Minitab memiliki grafik yang sama dengan SAS sehingga memiliki interpretasi yang sama dengan SAS dan R. Untuk melihat berapa besar keragaman yang dapat dijelaskan oleh analisis biplot dapat dilihat pada output berikut: ————— 11/25/2016 10:10:56 PM —————————————————— —— Welcome to Minitab, press F1 for help. Principal Component Analysis: HDI, PDRB, IK, APBD, APSSD, APSSLTP, DropSD, DropSMP Eigenanalysis of the Correlation Matrix 20 Eigenvalue Proportion Cumulative Variable HDI PDRB IK APBD APSSD APSSLTP DropSD DropSMP 4.1504 0.519 0.519 PC1 0.406 0.254 -0.267 0.148 0.384 0.416 -0.415 -0.429 1.3458 0.168 0.687 PC2 -0.004 -0.548 -0.089 -0.710 0.403 -0.055 -0.110 -0.102 0.9748 0.122 0.809 PC3 0.172 0.041 -0.800 0.094 0.144 -0.336 0.415 0.120 0.5864 0.073 0.882 PC4 -0.599 -0.010 -0.258 0.101 -0.176 -0.348 -0.333 -0.550 0.5411 0.068 0.950 PC5 -0.000 -0.764 -0.022 0.613 0.064 0.186 0.027 -0.017 0.2043 0.026 0.975 PC6 0.448 -0.218 -0.216 -0.215 -0.783 0.070 -0.170 -0.113 0.1433 0.018 0.993 PC7 -0.491 0.043 -0.352 -0.169 -0.140 0.732 0.156 0.155 0.0538 0.007 1.000 PC8 -0.073 -0.003 -0.208 0.070 0.040 -0.120 -0.692 0.672 Perhatikan output di atas, terlihat bahwa keragaman yang dapat dijelaskan dengan analisis biplot adalah sebesar 68,7%. Hasil ini sama dengan output yang diperoleh dengan menggunakan SAS. Selain itu muncul pula nilai-nilai yang digunakan oleh minitab untuk membuat biplot, dimana kolom C10 dan C11 menggambarkan variabel sedangkan C12 dan C13 menggambarkan observasi (objek pengamatan), yaitu sebagai berikut: Selanjutnya, 4 kolom (C10 – C13) diproyeksikan ke dalam satu grafik bidang datar yang kemudian disebut biplot. 21 BIPLOT dengan Makro SAS BIPLOT dengan Proc Prinqual BIPLOT dengan Menggunakan R BIPLOT dengan Menggunakan Minitab Biplot of HDI, ..., DropSMP 2 1 Second Component APSSD HDI APSSLTP DropSMP DropSD IK 0 PDRB APBD -1 -2 -3 -4 -5.0 -2.5 0.0 2.5 5.0 First Component Dengan menggunakan makro SAS, Minitab dan R menghasilkan gambar biplot yang hampir sama, hanya berbeda letak vektornya saja, sehingga hasil interpretasi datanya pun sama. 22