Algoritam Machine Learning Dan Implementasi

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 8

Algoritma machine learning adalah adalah algoritma yang digunakan dalam proses machine

learning, di mana sistem melakukan pembelajaran berdasarkan data. Jenis-jenis algoritma


machine learning dapat dikelompokkan menjadi supervised learning, unsupervised learning dan
reinforcement learning. Beberapa algoritma machine learning paling sering digunakan antara
lain:

1. Linear regression
2. Logistic regression
3. K-means clustering
4. Hierarchical clustering
5. K Nearest Neighbor (KNN)
6. Decision Tree
7. Random Forest
8. Support Vector Machine (SVM)
9. Naïve Bayes
10. Neural Network
11. Principal Component Analysis (PCA)

Apa itu algoritma Machine Learning?


Algoritma machine learning adalah algoritma yang digunakan dalam proses machine learning, di
mana sistem melakukan pembelajaran berdasarkan data.
Algoritma machine learning diterapkan dalam membuat model, berdasarkan kumpulan data.
Semakin banyak data, algoritma akan menyesuaikan diri agar model dapat bekerja lebih baik.

Jenis-jenis algoritma machine learning


• Supervised learning
Supervised learning atau pembelajaran yang diawasi adalah metode pembelajaran mesin
(machine learning) yang ditentukan berdasarkan penggunaan kumpulan data berlabel. Pada
dataset ini terdapat “label”, yaitu kolom yang menjadi target keluaran model.
Supervised learning dapat dibagi menjadi dua kategori, yaitu:
Klasifikasi
Regresi

• Unsupervised learning
Unsupervised learning merupakan metode pembelajaran dengan menggunakan algoritme
machine learning untuk menganalisis dan mengelompokkan kumpulan data yang tidak berlabel
(unlabelled data). Algoritme ini menemukan pola tersembunyi dalam data tanpa perlu campur
tangan manusia, sehingga disebut dengan unsupervised (tanpa pengawasan).
Unsupervised learning digunakan untuk melakukan:
clustering
asosiasi
dimensionality reduction

• Reinforcement learning
Reinforcement learning adalah model machine learning yang mirip dengan supervised learning,
tetapi algoritme tidak dilatih menggunakan data sampel atau data training.
Pada reinforcement learning, model ini belajar sambil berjalan dengan menggunakan trial and
error.

Beberapa Algoritma Machine Learning yang sering digunakan


1. Linear regression
Regresi linier atau linear regression merupakan jenis algoritma supervised learning yang
digunakan untuk mengidentifikasi hubungan antara variabel dependen/terikat dan satu atau lebih
variabel independen/bebas dan biasanya digunakan untuk membuat prediksi di masa depan.
2. Logistic regression
Logistic regression atau regresi logistik adalah algoritma supervised learning yang digunakan
untuk memperkirakan nilai diskrete (biasanya nilai biner seperti 0/1, ya/tidak, benar//salah) dari
sekumpulan variabel independen dengan memprediksi probabilitas suatu peristiwa dengan
menyesuaikan data ke fungsi logit.
3. K-means clustering
K-means clustering adalah salah satu algoritma analisis klaster (cluster analysis) non hirarki.
Analisis klaster merupakan salah satu alat untuk mengelompokkan data berdasarkan
variabel atau feature.
Algoritma K-means clustering mengelompokkan data berdasarkan jarak antara data terhadap titik
centroid klaster yang didapatkan melalui proses berulang. Analisis perlu menentukan jumlah K
sebagai input algoritma.
Dalam ranah machine learning, algoritma k-means clustering termasuk ke dalam jenis
unsupervised learning.
4. Hierarchical clustering
Metode analisis klaster dapat dibagi menjadi dua jenis:
• Analisis klaster non hirarki (tidak bertingkat)
• Analisis klaster hirarki (bertingkat)
Hierarchical clustering atau analisis cluster hirarki menggunakan proses klasterisasi bertingkat.
Analisis klaster bertingkat dapat dibagi menjadi dua tipe:
• Divisive (top-down): dimulai dari klaster yang besar lalu dipisah, dibagi menjadi klaster-
klaster yang lebih kecil. Contoh: taksonomi tumbuhan.
• Agglomerative (bottom-up): dimulai dari setiap observasi dan dikelompokkan melalui
penggabungan klaster secara bertahap, sampai didapatkan satu klaster yang mencakup
semuanya.

5. K Nearest Neighbor
K-nearest neighbor (KNN) merupakan salah satu algoritma machine learning dengan pendekatan
supervised learning yang paling sederhana.
Algoritma ini mengkelaskan data baru menggunakan kemiripan antara data baru dengan
sejumlah data (k) pada lokasi yang terdekat yang telah tersedia.
KNN merupakan algoritma non parametrik, yaitu tidak membuat asumsi apapun terhadap data.
6. Decision Tree
Decision tree adalah jenis algoritma supervised learning yang banyak digunakan untuk masalah
klasifikasi. Algoritma ini dapat bekerja pada variabel dependen dengan data kategorikal dan
kontinu.
Dalam algoritma ini, kita membagi populasi menjadi dua atau lebih kelompok homogen.
Pembagian dilakukan berdasarkan atribut/variabel independen atau feature yang paling
signifikan untuk membuat kelompok yang berbeda sebanyak mungkin. Proses ini dilakukan
berulang sampai target kelas sudah tercapai.
7. Random Forest
Algoritma random forest adalah bentuk ensemble learning dengan metode bagging yang
mengkombinasikan banyak “tree” hasil algoritma decision tree yang tidak berkorelasi satu sama
lain.
Untuk mendapatkan hasil akhir, hasil model dari setiap “tree” dilakukan voting, atau dihitung
rata-ratanya. Random forest ini merupakan algoritma supervised learning yang fleksibel.
8. Support Vector Machine
Support Vector Machine (SVM) adalah salah satu algoritma machine learning dengan
pendekatan supervised learning yang bekerja dengan mencari hyperplane atau fungsi pemisah
terbaik untuk memisahkan kelas.
9. Naïve Bayes
Naive Bayes adalah algoritma klasifikasi yang mengadopsi prinsip dari Teorema Bayes.
Algoritma ini menganggap bahwa kehadiran satu fitur tidak memengaruhi keberadaan fitur lain
dalam probabilitas hasil yang diberikan, dan setiap prediktor memiliki efek yang sama pada hasil
tersebut.
Ada tiga jenis algoritma klasifikasi Naïve Bayes:
• Multinomial Naive Bayes,
• Bernoulli Naive Bayes, dan
• Gaussian Naïve Bayes.
Teknik ini terutama digunakan dalam klasifikasi teks, identifikasi spam, dan sistem rekomendasi.
10. Artificial Neural Network
Artificial Neural Network atau jaringan syaraf tiruan merupakan algoritma yang meniru operasi
otak manusia untuk mengenali hubungan dalam data.
Algoritma jaringan syaraf tiruan yang paling populer adalah:
• Perceptron
• Multilayer Perceptron (MLP)
• Back-propagation

11. Principal Component Analysis


Analisis komponen utama/ Principal Component Analysis (PCA) adalah jenis algoritma
pengurangan dimensi (dimensionality reduction) yang digunakan untuk mengurangi redundansi
dan untuk mengompresi dataset melalui ekstraksi fitur.
Metode ini menggunakan transformasi linier untuk membuat representasi data baru,
menghasilkan sejumlah set “principal component” atau PC sesuai dengan jumlah feature.
PCA menghitung varians maksimum dalam dataset, sehingga PC 1 dan PC 2 sama sekali tidak
berkoleasi. Proses perhitungan ini dilakukan berulang sampai sejumlah dimensi datanya.
Kelompok algoritma Instance-based Learning
Algoritma yang termasuk “lazy learning” atau “instant based learning” adalah algoritma yang
tidak melakukan proses training. Algoritma ini menyimpan set data training dan “belajar” atau
melakukan learning darinya hanya pada saat membuat prediksi secara real-time.
Contoh dari algoritma dengan Instant-based learning adalah:
• K Nearest Neighbor
• Support Vector Machine
• Learning Vector Quantization
• Locally Weighted Learning

Kelompok algoritma Transfer Learning


Transfer learning adalah suatu teknik atau metode yang memanfaatkan model yang sudah dilatih
(pre-trained model) terhadap suatu dataset dan digunakan pada dataset yang baru untuk
menyelesaikan permasalahan lain yang serupa.
Model awal ini digunakan sebagai starting point, kemudian memodifikasi dan mengupdate
parameternya sehingga sesuai dengan dataset yang baru.

Kelompok algoritma Association Rule Learning


Association rule adalah metode unsupervised learning berbasis aturan (rule-based) yang
digunakan untuk menentukan hubungan penting antara variabel atau feature.
Cara kerja algoritma ini adalah dengan menghitung frekuensi kemunculan kejadian/ objek/
fenomena yang terjadi bersamaan (atau berasosiasi) dalam suatu dataset. Lalu, algoritma ini akan
menemukan asosiasi yang lebih sering terjadi dibandingkan dengan kemungkinan asosiasi yang
terjadi secara acak.
Contohnya dapat dilihat pada sistem rekomendasi playlist “Discover Weekly” Spotify yang
dihasilkan dari riwayat lagu atau musik yang sering kita dengarkan sebelum-sebelumnya.
Beberapa algoritma association rule learning antara lain:
• Algoritma apriori
• Algoritma ECLAT
Meskipun ada beberapa algoritma berbeda yang digunakan untuk menghasilkan Association
Rule seperti Eclat, dan FP-Growth, algoritma Apriori paling banyak digunakan.
Kelompok algoritma Ensemble Learning
Ensemble Learning adalah metode di mana beberapa algoritma pembelajaran digunakan secara
bersamaan, lalu dikombinasikan untuk mendapatkan hasil pemodelan yang lebih akurat.
Beberapa jenis Ensemble learning di antaranya:
• Bagging (misal Random Forest)
• Boosting (misal Adaboost, XGBoost)
• Stacking

Kelompok algoritma untuk dimensionality reduction


Dimensionality reduction adalah teknik untuk mengurangi jumlah variabel atau feature data
input atau data training.
Proses ini dilakukan karena kita data dengan variabel yang sangat besar atau sering disebut
dengan high dimensional data. Semakin tinggi feature-nya, model menjadi lebih kompleks.
Semakin tinggi feature-nya, semakin tinggi kemungkinan untuk overfitting.
Ada dua pendekatan untuk melakukan dimensionality reduction, yaitu:
• Feature selection: teknik yang digunakan untuk menilai feature mana yang terpilih dan
dipertahankan, dan feature mana yang dihapus.
• Feature extraction: proses ini mereduksi data dalam ruang berdimensi tinggi (high
dimensional space) ke ruang berdimensi lebih rendah (lower dimensional space)
Beberapa algoritma untuk dimensionality reduction antara lain:
• Principle Component Analysis (PCA)
• Principle Component Regression (PCR)
• Linear Discriminat Analysis (LDA)
• Mixed Discriminat Analysis (MDA)

Kelompok algoritma Deep Learning


Metode Deep Learning adalah pembaruan algoritma neural network. Algoritma ini membangun
jaringan saraf yang jauh lebih besar dan lebih kompleks.
Contoh algoritma deep learning yang paling populer adalah:
• Convolution Neural Network (CNN)
• Recurrent Neural Network (RNN)
• Deep Boltzman Machine (DBM)
Contoh implementasi Big Data, Machine Learning, Artificial Intelligence

Big data
1. Transportasi Big Data juga diterapkan dalam bidang transportasi. Kemacetan sudah
menjadi hal yang tidak terpisahkan di kota besar Indonesia. Dengan data di GPS yang
dimiliki oleh kendaraan warga kota bisa dilakukan konversi menjadi kecepatan,
percepatan dan juga durasi berhenti. Selain itu juga dilakukan konversi yang lainnya.
Data konversi tersebut bisa gunakan untuk memberikan rekomendasi kapan waktu terbaik
untuk berkendaraan dan waktu buruk di perjalanan kepada masyarakat.

2. Perbankan Big data dalam bidang keuangan bisa digunakan untuk memonitor kondisi
atau aktivitas pasar keuangan. Penggunaan network analytics dan NLP bisa menangkap
aktivitas trading ilegal di pasar keuangan. Industri keuangan juga bergantung pada big
data untuk menganalisa risiko bisnis. Hal ini meliputi anti pencucian uang (Anti Money
Laundry), manajemen risiko perusahaan (risk management), pengenalan pelanggan, dan
mitigasi penipuan (anti fraud).

3. Komunikasi, Media, dan Hiburan Pada bidang ini big data bisa berperan dalam
menciptakan profil konsumen yang rinci. Ini dapat digunakan untuk menciptakan konten
bagi target penonton yang berbeda, merekomendasikan konten sesuai permintaan, dan
mengukur performa konten. Layanan streaming musik misalnya mengoleksi data dari
jutaan pengguna dan menganalisa data tersebut untuk memberikan rekomendasi musik
bagi setiap individu.

Machine Learning

1. Rekomendasi video Youtube, Netflix, dan Spotify. Aplikasi seperti Youtube, Netflix
dan Spotify memanfaatkan model dengan algoritma machine learning untuk memberikan
rekomendasi video atau lagu sesuai dengan preferensi unik pengguna. Tujuannya adalah
kita sebagai pengguna memiliki peluang untuk lebih berlama-lama di aplikasi mereka.

2. Fitur Home di Facebook, Instagram, dan Twitter. Contoh aplikasi machine learning
selanjutnya adalah beranda Facebook atau timeline Twitter. Facebook menampilkan post-
post dari teman-teman Facebook terdekat, atau post dengan topik yang sedang kita minati
untuk meningkatkan engagement. Machine learning juga digunakan mencari orang-orang
yang kemudian muncul di bagian: “Orang yang mungkin Anda kenal”.
3. Ads: iklan produk yang sesuai Kemunculan produk yang sesuai atau terkait dengan
hostori pencarian kita adalah salah satu contoh penggunaan machine learning.Google
mengumpulkan daftar riwayat browsing kita untuk kemudian mengolahnya menjadi
prediksi produk rekomendasi yang kemudian muncul di media sosial kita sebagai iklan
produk.
4. Speech to text Machine learning dapat mengubah ucapan yang berupa suara menjadi
teks. Software seperti Speechnotes atau SpeechTexter dapat mengubah suara langsung
dan ucapan yang direkam menjadi file teks.

Artificial Intelligence

1. Lock Screen ponsel Ketika membuka smartphone dengan biometrik, seperti face ID, kita
sedang memanfaatkan AI. Apple FaceI D, misalnya, bekerja dengan menempatkan
30.000 titik inframerah yang tak terlihat pada wajah kita dan merekam image dari wajah
kita. Kemudian Face ID akan menggunakan algoritme machine learning untuk
membandingkan hasil pemindaian itu dengan data tentang wajah kita yang sudah
disimpan sebelumnya.
2. Media Sosial Hal pertama yang kerap kita lakukan di ponsel adalah memeriksa update
media sosial, seperti Facebook, Instagram, dan Twitter. Di sini AI bekerja
mempersonalisasi feed pengguna medsos, memberikan friend suggestion,
mengidentifikasi dan melakukan filtering terhadap berita bohong, dan mencegah
cyberbullying
3. Rekomendasi Produk Marketplace Hampir semua orang menggunakan marketplace,
misalnya Tokopedia, Bukalapak, dan Shopee tiap detik bisa dipastikan terjadi transaksi
antar pedagang dan pembeli. Untuk meningkatkan pengalaman pengguna, setiap akun
perlu menampilkan rekomendasi produk yang sesuai dengan minat pembelian pembeli.
Untuk melakukan ini secara otomatis dan real time, tentunya machine learning sangat
menentukan keakuratan rekomendasi produk tiap pembeli di masing-masing akun.
4. Konten yang Ditampilkan Periklanan Digital Google Adword mengumpulkan data
situs berdasarkan topik, kemudian menampilkan iklan-iklan yang relevan dengan topik
tersebut. Selain itu Google Adword juga menggunakan cookies, sebagai referensi
aktivitas pengunjung suatu website terkait situs-situs yang dikunjungi sebelumnya.
Adword melakukan akumulasi terhadap 2 faktor tersebut, sehingga dapat ditampilkan
iklan yang sesuai dengan pengunjung website.

Anda mungkin juga menyukai