ANALISIS PEUBAH GANDA
Oleh:
Siswanto
(G151150021)
Fizry L. Maulida
(G151150251)
Abraham Madison Manurung
(G151150311)
Ira Rosianal Hikmah
(G151150341)
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGORBOGOR
2016
22
PENDAHULUAN
Dalam analisis multivariat terdapat banyak metode yang dapat digunakan untuk
menyelesaikan masalah atau mengolah data yang melibatnya banyak variabel. Semakin
banyak variabel yang diukur maka semakin banyak pula objek yang diamati. Akibatnya,
ukuran tabel yang dimiliki akan semakin besar dan sulit diinterpretasikan. Oleh karena itu,
diperlukan suatu metode yang memudahkan dalam menginterpretasikan data yang kita
miliki. Salah satu metode multivariat yang dapat digunakan untuk mengatasi permasalahan
itu adalah metode biplot.
Metode biplot mampu menggambarkan data yang ada pada tabel ringkasan dalam
grafik dimensi dua. Analisis biplot bersifat deskriptif yaitu dengan menyajikan secara
visual suatu kumpulan objek dan variabel dalam satu grafik yang berbentuk bidang datar.
Menurut Sartono, dkk (2003), terdapat 4 informasi penting yang diperoleh dari tampilan
biplot, diantaranya :
1. Kedekatan antar objek yang diamati
Yaitu mengetahui objek yang memiliki kemiripan karakteristik dengan objek lain. Dua
objek dikatakan memiliki karakteristik yang sama jika digambarkan sebagai dua titik
dengan posisi yang berdekatan.
2. Keragaman variabel
Yaitu melihat apakah ada variabel yang memiliki nilai keragaman yang hampir sama
untuk setiap objek. Variabel yang memiliki nilai keragaman kecil digambarkan dengan
vektor pendek sedangkan variabel yang memiliki nilai keragaman besar digambarkan
dengan vektor panjang.
3. Korelasi antar variabel
Yaitu mengetahui bagaimana suatu variabel mempengaruhi atau dipengaruhi variabel
lain.variabel akan digambarkan sebagai garis berarah. Dua variabel yang memiliki nilai
korelasi positif (+) digambarkan sebagai dua buah garis dengan arah yang sama atau
membentuk sudut sempit <
° . Dua variabel yang memiliki nilai korelasi negatif
digambarkan sebagai dua buah garis dengan arah yang berlawanan atau membentuk
1
sudut lebar >
° . Dua variabel yang tidak berkorelasi digambarkan sebagai garis
dengan sudut mendekati
° (siku-siku).
4. Nilai variabel pada suatu objek
Yaitu melihat keunggulan dari setiap objek. Suatu objek dikatakan memiliki nilai di atas
rata-rata jika objek tersebut terletak searah dengan arah vektor variabel. Jika objek
terletak berlawanan dengan arah dari vektor variabel maka objek tersebut dikatakan
memiliki nilai di bawah rata-rata. Jika objek hampir berada di tengah-tengahmaka objek
itu dikatakan memiliki nilai yang dekat dengan rata-rata.
TUJUAN
Laporan tugas ini bertujuan untuk :
1. Melakukan analisis biplot pada data yang diberikan dengan menggunakan software SAS,
R, dan Minitab.
2. Membandingkan hasil analisis biplot untuk ketiga software yang digunakan.
3. Menginterpretasikan hasil analisis biplot.
ILUSTRASI DATA
Krisis ekonomi telah berdampak pada berbagai aspek kehidupan. Salah satu sektor yang
terkena dampaknya adalah sektor pendidikan. Dampak yang paling dirasakan adalah
berkurangnya kemampuan untuk menyediakan pendidikan yang layak bagi anak-anak.
Angka drop-out siswa dengan demikian semakin meningkat dan kualitas pelayanan
pendidikan yang diselenggarakan sekolah semakin jauh berkurang. Hal ini menjadi
keprihatinan tersendiri karena berkembangnya pembangunan di suatu wilayah tidak
terlepas dari sumber daya yang tersedia di daerah tersebut. Tentunya hal ini tidak bisa
dipisahkan dari dunia pendidikan. Sebagai salah satu upaya mengatasi dampak krisis
ekonomi terhadap dunia pendidikan pemerintah telah mengembangkan Program Jaring
Pengaman Sosial Beasiswa dan Dana Bantuan Operasional, yang lebih dikenal sebagai
Program JPS Beasiswa dan DBO.
2
Berbagai indikator dilihat dalam hubungannya dengan keberhasilan pembangunan
pendidikan di suatu wilayah, antara lain :
1. Indeks Pembanguan Manusia (HDI)
2. Produk Domestik Regional Bruto (PDRB)
3. Indeks Kemiskinan (IK)
4. Anggaran Pendapatan dan Belanja Daerah (APBD)
5. Angka Partisipasi Kasar untuk tingkat SD (APSSD)
6. Angka Partisipasi Kasar untuk tingkat SLTP (APSLTP)
7. Tingkat Drop Out untuk SD (Drop SD)
8. Tingkat Drop Out untuk SLTP (Drop SLTP)
Berikut ini merupakan ringkasan data yang digunakan :
Prop
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Nama
Aceh
Sumut
Sumbar
Riau
Jambi
Sumsel
Bengkulu
Lampung
DKI
Jabar
Jateng
Yogya
Jatim
Kalbar
Kalteng
Kalsel
Kaltim
Sulut
Sulteng
Sulsel
Sultra
Bali
NTB
HDI
65.3
66.6
65.8
67.3
65.4
63.9
64.8
63
72.5
64.6
64.6
68.7
61.8
60.6
66.7
62.2
67.8
67.1
62.8
63.6
62.9
65.7
54.2
PDRB
2548
1976
1678
4773
1254
1692
1158
952
5943
1616
1282
1554
1628
1871
2350
1975
8401
1434
1070
1207
907
2431
852
IK
14.91
16.15
13.56
10.95
14.54
15.68
13.11
17.23
4.33
12.89
17.97
13.53
18.34
25.65
16.06
16.97
14.98
11.69
11.13
9.38
12.79
5.31
19.65
APBD APSSD APSSLTP DropSD DropSMP
895.48 96.3
81.7
3
10.4
397.4
97.2
87.4
2.9
11.8
582.13 96.7
84
4.7
16.6
491.07 96.3
85.2
2.6
11.2
456.46 96.2
81.1
3.5
11.7
329.36 95.2
77
5
18
447.55 95.4
82.2
3.7
16.8
226.19 95.1
81
2.9
12.3
801.61 98.4
92.4
1.6
5.9
274.04 95.4
72.2
3.3
10.3
299.32 97.4
81.5
1.6
7.1
431.69 99.2
95.4
0.5
3.5
326.86 95.4
80.4
2.5
9.2
470.64 90.3
76
5.4
25.2
699.73 97.5
80.6
3.2
17
600.54 94.7
72.2
5
16.4
576.04
97
84.6
3.1
10.8
521.82 93.6
76.7
6.8
23.2
450.94 94.6
69.4
5.8
23.1
482.69 91.1
69.6
6.7
18.9
602.48 93.7
77
5.8
21.4
829.25 96.7
83.6
2.1
6.9
412.18
93
71.5
5.8
21.7
3
24
25
26
27
28
NTT
Maluku
IRJA
Maluku
Utara
Banten
60.4
67.2
58.8
712
1339
4074
23.97 173.06
26.21 726.99
24.59 923.13
89
94.4
82.8
69.7
84.8
75.5
6
3
4.5
29.5
14.4
20
66.4 1329.5 21.91 238.45
63.5 1992.4 9.43 252.35
95.25
94.94
80.75
70.12
4.55
3.24
24.95
12.14
PEMBAHASAN
Dari ilustrasi di atas, akan dilakukan analisis biplot untuk melihat karakteristik propinsi
dilihat dari berbagai indikator pembangunan pendidikan.
1. Analisis Biplot dengan Software SAS
a. Dengan Makro SAS
SINTAKS :
%macro BIPLOT(
data=pendidikan,
/* Data set for biplot */
var = hdi pdrb ik apbd apssd apssmp dropsd dropsmp, /* Variables for biplot */
id = prov,
/* Observation ID variable */
dim =2,
/* Number of biplot dimensions */
factype=SYM,
/* Biplot factor type: GH, SYM, or JK */
scale=0,
/* Scale factor for variable vectors */
power=1,
/* Power transform of response */
out =BIPLOT,
/* Output dataset: biplot coordinates */
anno=BIANNO,
/* Output dataset: annotate labels */
xanno=dim1, yanno=dim2, zanno=dim3, std=STD, /* How to standardize columns:
NONE|MEAN|STD*/
colors=BLUE RED,
/* Colors for OBS and VARS */
symbols=none none,
/* Symbols for OBS and VARS */
interp=none vec,
/* Markers/interpolation for OBS and VARS */
pplot=NO,
/* Produce printer plot? */
gplot=YES, haxis=,
/* AXIS statement for horizontal axis */
vaxis=,
/* and for vertical axis- use to equate axes */
name=biplot);
%let std=%upcase(&std);
%let factype=%upcase(&factype);
%if &factype=GH %then %let p=0;
%else %if &factype=SYM %then %let p=.5;
%else %if &factype=JK %then %let p=1;
%else %do;
%put BIPLOT: FACTYPE must be GH, SYM, or JK. "&factype" is not valid.; %goto done;
%end;
%if %upcase("&var") ^= "_NUM_" %then %let var={&var};
%if &data=_LAST_ %then %let data=&syslast;
proc iml;
start biplot(y,id,vars,out, g, scale);
N = nrow(Y);
P = ncol(Y);
%if &std = NONE
%then Y = Y - Y[:] %str(;);
%else Y = Y - J(N,1,1)*Y[:,] %str(;);
/* remove grand mean */
/* remove column means */
4
%if &std = STD %then %do;
S = sqrt(Y[##,] / (N-1));
Y = Y * diag (1 / S ); %end;
*-- Singular value decomposition:
Y is expressed as U diag(Q) V prime
Q contains singular values, in descending order;
call svd(u,q,v,y);
reset fw=8 noname;
percent = 100*q##2 / q[##];
cum = cusum(percent);
c1={'Singular Values'};
c2={'Percent'};
c3={'Cum % '};
Print "Singular values and variance accounted for",,
q [colname=c1 format=9.4 ]
percent [colname=c2 format=8.2 ]
cum [colname=c3 format=8.2 ];
d = &dim ;
*-- Assign macro variables for dimension labels;
lab = '%let p' + char(t(1:d),1) + '=' +
left(char(percent[t(1:d)],8,1)) + ';';
call execute(lab);
/*
call execute('%let p1=', char(percent[1],8,1), ';');
call execute('%let p2=', char(percent[2],8,1), ';');
if d > 2 then
call execute('%let p3=', char(percent[3],8,1), ';');
*/
*-- Extract first d columns of U & V, and first d elements of Q;
U = U[,1:d];
V = V[,1:d];
Q = Q[1:d];
*-- Scale the vectors by QL, QR;
* Scale factor 'scale' allows expanding or contracting the variable
vectors to plot in the same space as the observations;
QL= diag(Q ## g );
QR= diag(Q ## (1-g));
A = U * QL;
B = V * QR;
ratio = max(sqrt(A[,##])) / max(sqrt(B[,##]));
print 'OBS / VARS ratio:' ratio 'Scale:' scale;
if scale=0 then scale=ratio;
B = B # scale;
OUT=A // B;
*-- Create observation labels;
id = id // vars`;
type = repeat({"OBS "},n,1) // repeat({"VAR "},p,1);
id = concat(type, id);
factype = {"GH" "Symmetric" "JK"}[1 + 2#g];
print "Biplot Factor Type", factype;
cvar = concat(shape({"DIM"},1,d), char(1:d,1.));
print "Biplot coordinates",
out[rowname=id colname=cvar f=9.4];
%if &pplot = YES %then %do;
call pgraf(out[,{1 2}],substr(id,5),'Dimension 1', 'Dimension 2', 'Biplot');
%end;
create &out from out[rowname=id colname=cvar];
append from out[rowname=id];
finish;
start power(x, pow);
if pow=1 then return(x);
5
if any(x <= 0) then x = x + ceil(min(x)+.5);
if abs(pow)<.001 then xt = log(x); else xt = ((x##pow)-1) / pow;
return (xt);
finish;
/*--- Main routine */
use &data;
read all var &var into y[ c=vars ];
%if &id = %str() %then %do;
id=compress(char(1:nrow(xy),4))`;
%end;
%else %do;
read all var{&id} into id;
%end;
* read all var &var into y[colname=vars rowname=&id];
%if &power ^= 1 %then %do;
y = power(y, &power);
%end;
scale = &scale;
run biplot(y, id,vars,out, &p, scale );
quit;
/*----------------------------------*
| Split ID into _TYPE_ and _NAME_ |
*----------------------------------*/
data &out;
set &out;
drop id;
length _type_ $3 _name_ $16;
_type_ = substr(id,1,3);
_name_ = substr(id,5);
label
%do i=1 %to &dim;
dim&i = "Dimension &i (&&p&i%str(%%))"
%end; ;
/*--------------------------------------------------*
| Annotate observation labels and variable vectors |
*--------------------------------------------------*/
%*-- Assign colors and symbols;
%let c1= %scan(&colors,1);
%let c2= %scan(&colors,2);
%if &c2=%str() %then %let c2=&c1;
%let v1= %upcase(%scan(&symbols,1));
%let v2= %upcase(%scan(&symbols,2));
%if &v2=%str() %then %let v2=&v1;
%let i1= %upcase(%scan(&interp,1));
%let i2= %upcase(%scan(&interp,2));
%if &i2=%str() %then %let i2=&i1;
data &anno;
set &out;
length function color $8 text $16;
xsys='2'; ysys='2'; %if &dim > 2 %then %str(zsys='2';);
text = _name_;
if _type_ = 'OBS' then do;
/* Label observations (row points) */
color="&c1";
if "&i1" = 'VEC' then link vec;
x = &xanno; y = &yanno;
%if &dim > 2 %then %str(z = &zanno;);
6
%if &v1=NONE %then
%str(position='5';);
%else %do;
if dim1 >=0
then position='>';
else position='<';
/* rt justify */
/* lt justify */
%end;
function='LABEL '; output;
end;
if _type_ = 'VAR' then do;
/* Label variables (col points) */
color="&c2";
if "&i2" = 'VEC' then link vec;
x = &xanno; y = &yanno;
if dim1 >=0
then position='6';
/* down justify */
else position='2';
/* up justify */
function='LABEL '; output;
/* variable name */
end;
return;
vec:
origin to point */
x = 0; y = 0;
%if &dim > 2 %then %str(z = 0;);
function='MOVE' ; output;
x = &xanno; y = &yanno;
%if &dim > 2 %then %str(z = &zanno;);
function='DRAW' ; output;
/* Draw line from the
return;
%if &gplot = YES %then %do;
%if &i1=VEC %then %let i1=NONE;
%if &i2=VEC %then %let i2=NONE;
%let legend=nolegend;
%let warn=0;
%if %length(&haxis)=0 %then %do;
%let warn=1;
axis2 offset=(1,5) ;
%let haxis=axis2;
%end;
%if %length(&vaxis)=0 %then %do;
%let warn=1; axis1 offset=(1,5) label=(a=90 r=0);
%let vaxis=axis1;
%end;
proc gplot data=&out &GOUT;
plot dim2 * dim1 = _type_/
anno=&anno frame &legend
href=0 vref=0 lvref=3 lhref=3
vaxis=&vaxis haxis=&haxis
vminor=1 hminor=1
name="&name" des="Biplot of &data";
symbol1 v=&v1 c=&c1 i=&i1;
symbol2 v=&v2 c=&c2 i=&i2;
run; quit;
%if &warn %then %do;
%put WARNING: No VAXIS= or HAXIS= parameter was specified,
so the biplot axes have not;
%put WARNING: been equated. This may lead to incorrect
interpretation of distance and;
%put WARNING: angles. See the documentation.;
%end;
goptions reset=symbol;
%end;
/* %if &gplot=YES */
%done:
%mend BIPLOT;
7
data pendidikan;
input prov$ hdi pdrb ik apbd apssd apssmp dropsd dropsmp;
datalines;
Aceh
65.30
2548.00
14.91
895.48
96.30
Sumut
66.60
1976.00
16.15
397.40
97.20
Sumbar
65.80
1678.00
13.56
582.13
96.70
Riau
67.30
4773.00
10.95
491.07
96.30
Jambi
65.40
1254.00
14.54
456.46
96.20
Sumsel
63.90
1692.00
15.68
329.36
95.20
Bengkulu 64.80
1158.00
13.11
447.55
95.40
Lampung
63.00
952.00
17.23
226.19
95.10
DKI
72.50
5943.00
4.33
801.61
98.40
Jabar
64.60
1616.00
12.89
274.04
95.40
Jateng
64.60
1282.00
17.97
299.32
97.40
Yogya
68.70
1554.00
13.53
431.69
99.20
Jatim
61.80
1628.00
18.34
326.86
95.40
Kalbar
60.60
1871.00
25.65
470.64
90.30
Kalteng
66.70
2350.00
16.06
699.73
97.50
Kalsel
62.20
1975.00
16.97
600.54
94.70
Kaltim
67.80
8401.00
14.98
576.04
97.00
Sulut
67.10
1434.00
11.69
521.82
93.60
Sulteng
62.80
1070.00
11.13
450.94
94.60
Sulsel
63.60
1207.00
9.38
482.69
91.10
Sultra
62.90
907.00
12.79
602.48
93.70
Bali
65.70
2431.00
5.31
829.25
96.70
NTB
54.20
852.00
19.65
412.18
93.00
NTT
60.40
712.00
23.97
173.06
89.00
Maluku
67.20
1339.00
26.21
726.99
94.40
IRJA
58.80
4074.00
24.59
923.13
82.80
Malut
66.40
1329.50
21.91
238.45
95.25
Banten
63.50
1992.40
9.43
252.35
94.94
;
%biplot;
run;
81.70
87.40
84.00
85.20
81.10
77.00
82.20
81.00
92.40
72.20
81.50
95.40
80.40
76.00
80.60
72.20
84.60
76.70
69.40
69.60
77.00
83.60
71.50
69.70
84.80
75.50
80.75
70.12
3.00
2.90
4.70
2.60
3.50
5.00
3.70
2.90
1.60
3.30
1.60
0.50
2.50
5.40
3.20
5.00
3.10
6.80
5.80
6.70
5.80
2.10
5.80
6.00
3.00
4.50
4.55
3.24
10.40
11.80
16.60
11.20
11.70
18.00
16.80
12.30
5.90
10.30
7.10
3.50
9.20
25.20
17.00
16.40
10.80
23.20
23.10
18.90
21.40
6.90
21.70
29.50
14.40
20.00
24.95
12.14
OUTPUT :
8
Dari output di atas, dapat diinterpretasikan sebagai berikut :
1. Besarnya keragaman yang mampu dijelaskan oleh semua indikator yang digunakan
untuk melihat hubungannya terhadap keberhasilan pembangunan pendidikan adalah
sebesar
%. Akan tetapi, dengan melakukan analisis biplot dengan mereduksi seluruh
indikator ke dalam ruang berdimensi dua maka informasi yang mampu dijelaskan hanya
. % yang diperoleh dari penjumlahan dari
yang mampu dijelaskan dengan biplot <
. % dan
. %. Artinya, informasi
%. Oleh karena itu, dapat dikatakan bahwa
biplot belum cukup memberikan informasi mengenai hubungan kedelapan indikator
tersebut.
2. Provinsi Bengkulu, Sumbar, Jambi, Jatim, Banten, Jabar, Lampung, Sumut, Jateng,
Sumsel, dan Malut memiliki kemiripan karakteristik tertentu. Maluku, Kalteng, Aceh,
Riau, Bali, dan Kaltim juga membentuk kelompok sendiri. Provinsi NTT, NTB, Kalbar,
Sulsel, Sulteng, Sultra, Sulut, dan Kalsel juga membentuk kelompok sendiri berdasarkan
kemiripan sifat peubah.
3. Terdapat keragaman yang tinggi pada peubah dropsmp, apbd, apssd, dan apssmp.
Namun setiap peubah yang lain juga memiliki tingkat keragaman yang juga relatif
tinggi.
4. dropsd, dropsmp,dan ik; apssmp dan hdi; memiliki korelasi positif yang cukup tinggi
karena nilai cosinus sudut antar vektornya cukup sempit, begitu pula dengan variabel
lain. Sedangkan ik dan apssd; dropsmp dan apssmp; hdi dan dropsd; apssd dan dropsd;
dan variabel lainnya, memiliki korelasi negatif karena sudut yang dibentuk adalah sudut
yang lebar.
5. Provinsi IRJA, Kalbar, NTB, NTT, Sulsel, Kalsel, Sulteng, Sulut, dan Sultra merupakan
provinsi yang memiliki tingkat dropsd, dropsmp, dan ik yang tinggi. Provinsi DKI, Bali,
Riau, dan Yogya memiliki tingkat apssmp dan hdi yang tinggi. Provinsi Sumbar,
Bengkulu, Jambi, Jatim, Sumsel, Malut, Banten, Jabar, Lampung, Jateng, Sumut
memiliki tingkat apsd yang tinggi. Sedangkan sisanya yaitu Provinsi Maluku, Kalteng,
Aceh, dan Kaltim memiliki tingkat apbd dan pdrb yang tinggi.
9
b. Dengan proc printqual SAS
SINTAKS :
data pendidikan;
input prov$ hdi pdrb ik apbd apssd apssmp dropsd dropsmp;
datalines;
Aceh
65.30
2548.00
14.91
895.48
96.30
81.70
3.00
10.40
Sumut
66.60
1976.00
16.15
397.40
97.20
87.40
2.90
11.80
Sumbar
65.80
1678.00
13.56
582.13
96.70
84.00
4.70
16.60
Riau
67.30
4773.00
10.95
491.07
96.30
85.20
2.60
11.20
Jambi
65.40
1254.00
14.54
456.46
96.20
81.10
3.50
11.70
Sumsel
63.90
1692.00
15.68
329.36
95.20
77.00
5.00
18.00
Bengkulu
64.80
1158.00
13.11
447.55
95.40
82.20
3.70
16.80
Lampung
63.00
952.00
17.23
226.19
95.10
81.00
2.90
12.30
DKI
72.50
5943.00
4.33
801.61
98.40
92.40
1.60
5.90
Jabar
64.60
1616.00
12.89
274.04
95.40
72.20
3.30
10.30
Jateng
64.60
1282.00
17.97
299.32
97.40
81.50
1.60
7.10
Yogya
68.70
1554.00
13.53
431.69
99.20
95.40
0.50
3.50
Jatim
61.80
1628.00
18.34
326.86
95.40
80.40
2.50
9.20
Kalbar
60.60
1871.00
25.65
470.64
90.30
76.00
5.40
25.20
Kalteng
66.70
2350.00
16.06
699.73
97.50
80.60
3.20
17.00
Kalsel
62.20
1975.00
16.97
600.54
94.70
72.20
5.00
16.40
Kaltim
67.80
8401.00
14.98
576.04
97.00
84.60
3.10
10.80
Sulut
67.10
1434.00
11.69
521.82
93.60
76.70
6.80
23.20
Sulteng
62.80
1070.00
11.13
450.94
94.60
69.40
5.80
23.10
Sulsel
63.60
1207.00
9.38
482.69
91.10
69.60
6.70
18.90
Sultra
62.90
907.00
12.79
602.48
93.70
77.00
5.80
21.40
Bali
65.70
2431.00
5.31
829.25
96.70
83.60
2.10
6.90
NTB
54.20
852.00
19.65
412.18
93.00
71.50
5.80
21.70
NTT
60.40
712.00
23.97
173.06
89.00
69.70
6.00
29.50
Maluku
67.20
1339.00
26.21
726.99
94.40
84.80
3.00
14.40
IRJA
58.80
4074.00
24.59
923.13
82.80
75.50
4.50
20.00
Malut
66.40
1329.50
21.91
238.45
95.25
80.75
4.55
24.95
Banten
63.50
1992.40
9.43
252.35
94.94
70.12
3.24
12.14
;
ods graphics on;
proc prinqual data=pendidikan n=2 mdpref;
transform identity(hdi pdrb ik apbd apssd apssmp dropsd dropsmp);
id prov;
run;
10
OUTPUT :
Pada output di atas, yaitu dengan menggunakan SAS melibatkan prosedur proc
prinqual menghasilkan biplot yang sama dengan total keragaman yang dapat
dijelaskan oleh kedua komponen sebesar
. %
.
%+
.
%=
. % .
Dimana interpretasi dari keempat hal penting berdasarkan Sartono (2003) dari hasil
di atas adalah sama dengan interpretasi yang dihasilkan dengan menggunakan makro
SAS.
2. Analisis Biplot dengan Software R
SINTAKS :
##Memanggil data awal
data<-read.table("G:/ira.csv",header=T,sep=",")
data.m<-as.matrix(data)
##Menyeleksi data yang akan dianalisis
x<-data[,c(-1,-2)]
11
##Biplot dengan Manual
#Singular Value Decomposition
y<-svd(x)
#Matriks L, A, dan U
L<-diag(y$d)
A<-y$v
U<-y$u
L
A
#jika alfa=1
G=U
H=A%*%L
H
#Membuat Biplot
G2<-G[,1:2]
H2<-H[,1:2]
H2
biplot(G2,H2)
##Biplot dengan menggunakan fungsi princomp atau prcomp
#Mendefinisikan Model PCA
###Model 1
model1<-princomp(x,cor=T)
summary(model1)
biplot(model1)
###Model 2
model2<-prcomp(x,scale=T)
summary(model2)
biplot(model2)
OUTPUT MANUAL:
12
Karena U adalah matriks berukuran 28x8 (sangat besar) maka tidak dikeluarkan hasilnya.
Begitu pula dengan G.
Karena biplot, maka hanya kolom pertama dan kolom kedua dari G dan H yang dipakai.
13
OUTPUT MODEL 1:
Dari output di atas, terlihat bahwa analisis biplot mampu menjelaskan keragaman
sebesar 68.7%. Hasil ini sama seperti hasil makro atau prosedur prinqual pada SAS.
14
Pada output di atas, terlihat bahwa biplot pada model 1 dengan menggunakan software R
menghasilkan output yang sedikit berbeda. Interpretasi output R dan SAS adalah sama,
karena keempat informasi penting yang telah dijabarkan pada bagian awal (makro
SAS) menghasilkan interpretasi yang sama. Perbedaannya hanyalah pada visual
grafik dari segi kuadran.
Jika kuadran suatu grafik kami definisikan sebagai berikut :
Kuadran 2 Kuadran 1
Kuadran 3 Kuadran 4
Maka kuadran 1 pada output SAS sama dengan kuadran 3 pada output R, kuadran 2
pada output SAS sama dengan kuadran 4 pada output R, kuadran 3 pada output SAS
sama dengan kuadran 1 pada output R, dan kuadran 4 pada output SAS sama dengan
kuadran 2 pada output R. Oleh karena itu, dapat dikatakan bahwa grafik (biplot) R
model 1 merupakan cerminan dengan SAS pada sumbu horizontal x dan vertikal y
dengan hasil interpretasi yang sama dengan hasil SAS.
OUTPUT MODEL 2:
Dari output di atas, terlihat bahwa analisis biplot mampu menjelaskan keragaman
sebesar 68.7%. Hasil ini sama seperti hasil makro atau prosedur prinqual pada SAS.
15
Pada output di atas, terlihat bahwa biplot pada model 2 dengan menggunakan software R
menghasilkan output yang sedikit berbeda. Interpretasi output R dan SAS adalah sama,
karena keempat informasi penting yang telah dijabarkan pada bagian awal (makro
SAS) menghasilkan interpretasi yang sama. Perbedaannya hanyalah pada visual
grafik dari segi kuadran.
Jika kuadran suatu grafik kami definisikan sebagai berikut :
Kuadran 2 Kuadran 1
Kuadran 3 Kuadran 4
Maka kuadran 1 pada output SAS sama dengan kuadran 2 pada output R, kuadran 2
pada output SAS sama dengan kuadran 1 pada output R, kuadran 3 pada output SAS
sama dengan kuadran 4 pada output R, dan kuadran 4 pada output SAS sama dengan
kuadran 3 pada output R. Oleh karena itu, dapat dikatakan bahwa grafik (biplot) R
16
model 2 merupakan cerminan dengan SAS pada sumbu vertikal y dengan hasil
interpretasi yang sama dengan hasil SAS.
3. Analisis Biplot dengan Software Minitab
Berikut ini merupakan langkah-langkah analisi biplot dengan minitab :
1. Tuliskan kembali data di atas ke dalam minitab
2. Selanjutnya kita gunakan analisis yang ada pada Minitab yaitu : Stat-MultivariatePrincipal Component
3. Lakukan Analisis. Masukan variabel yang akan dijadikan biplot, caranya adalah :
Pilih nama variabel yang ada di kolom kiri atas (HDI, PDRB, IK, APBD, APSSD,
APSSLTP, DropSD, DropSMP) lalu tekan tombol Select di bagian bawahnya
17
Setelah itu kita klik tombol Graphs.. untuk menampilkan biplot dari minitab. Beri
tanda centang untuk pilihan Biplot for first 2 components lalu klik OK.
Untuk menampilkan data yang digunakan oleh Minitab dalam membuat biplot, klik
pilihan storage, lalu tuliskan kolom yang akan kita sisipkan data hasil perhitungan
Minitab untuk membuat biplot yaitu 2 kolom untuk Coefficients dan 2 kolom untuk
18
Scores. (Di sini digunakan kolom C10, C11, C12 dan C13 karena kolom tersebut
masih kosong. Lalu klik OK
Setelah itu klik tombol OK
19
Maka akan muncul grafik biplot seperti berikut:
Biplot of HDI, ..., DropSMP
2
1
Second Component
APSSD
HDI
APSSLTP
DropSMP
DropSD IK
0
PDRB
APBD
-1
-2
-3
-4
-5.0
-2.5
0.0
2.5
5.0
First Component
Perhatikan grafik di atas. Terlihat bahwa output Minitab memiliki grafik yang sama dengan
SAS sehingga memiliki interpretasi yang sama dengan SAS dan R. Untuk melihat berapa
besar keragaman yang dapat dijelaskan oleh analisis biplot dapat dilihat pada output
berikut:
————— 11/25/2016 10:10:56 PM ——————————————————
——
Welcome to Minitab, press F1 for help.
Principal Component Analysis: HDI, PDRB, IK, APBD, APSSD, APSSLTP,
DropSD, DropSMP
Eigenanalysis of the Correlation Matrix
20
Eigenvalue
Proportion
Cumulative
Variable
HDI
PDRB
IK
APBD
APSSD
APSSLTP
DropSD
DropSMP
4.1504
0.519
0.519
PC1
0.406
0.254
-0.267
0.148
0.384
0.416
-0.415
-0.429
1.3458
0.168
0.687
PC2
-0.004
-0.548
-0.089
-0.710
0.403
-0.055
-0.110
-0.102
0.9748
0.122
0.809
PC3
0.172
0.041
-0.800
0.094
0.144
-0.336
0.415
0.120
0.5864
0.073
0.882
PC4
-0.599
-0.010
-0.258
0.101
-0.176
-0.348
-0.333
-0.550
0.5411
0.068
0.950
PC5
-0.000
-0.764
-0.022
0.613
0.064
0.186
0.027
-0.017
0.2043
0.026
0.975
PC6
0.448
-0.218
-0.216
-0.215
-0.783
0.070
-0.170
-0.113
0.1433
0.018
0.993
PC7
-0.491
0.043
-0.352
-0.169
-0.140
0.732
0.156
0.155
0.0538
0.007
1.000
PC8
-0.073
-0.003
-0.208
0.070
0.040
-0.120
-0.692
0.672
Perhatikan output di atas, terlihat bahwa keragaman yang dapat dijelaskan dengan analisis
biplot adalah sebesar 68,7%. Hasil ini sama dengan output yang diperoleh dengan
menggunakan SAS.
Selain itu muncul pula nilai-nilai yang digunakan oleh minitab untuk membuat biplot,
dimana kolom C10 dan C11 menggambarkan variabel sedangkan C12 dan C13
menggambarkan observasi (objek pengamatan), yaitu sebagai berikut:
Selanjutnya, 4 kolom (C10 – C13) diproyeksikan ke dalam satu grafik bidang datar yang
kemudian disebut biplot.
21
BIPLOT dengan Makro SAS
BIPLOT dengan Proc Prinqual
BIPLOT dengan Menggunakan R
BIPLOT dengan Menggunakan Minitab
Biplot of HDI, ..., DropSMP
2
1
Second Component
APSSD
HDI
APSSLTP
DropSMP
DropSD IK
0
PDRB
APBD
-1
-2
-3
-4
-5.0
-2.5
0.0
2.5
5.0
First Component
Dengan menggunakan makro SAS, Minitab dan R menghasilkan gambar biplot yang hampir sama, hanya berbeda letak vektornya
saja, sehingga hasil interpretasi datanya pun sama.
22