Makalah BIG DATA Kelompok 3

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 13

MAKALAH

BIG DATA
ANALISIS DATA DALAM BIG DATA
Dosen Pengampu : Muhammad Atnang, S. Kom., M. Kom

Penyusun :
Kelompok III
Muhammad Ashar (122.56202.024)
Akbar Saleh (122.56202.079)
Iskandar (122.56202.019)
Mita Surahmawanti (122.56202.023)
Zakiyah Konasarah (122.56202.052)

INSTITUT TEKNOLOGI DAN SAINS MUHAMMADIYAH KOLUT

PRODI TEKNIK KOMPUTER

FAKULTAS TEKNIK

i
KATA PENGANTAR

Dunia digital saat ini telah mengalami ledakan data yang tak terbayangkan sebelumnya.
Setiap detik, kita menghasilkan data baru dalam jumlah yang sangat besar, mulai dari interaksi di
media sosial, transaksi online, sensor di perangkat IoT, dan berbagai aktivitas digital lainnya.
Fenomena ini dikenal sebagai "Big Data", yang membawa tantangan sekaligus peluang bagi
organisasi untuk mengambil keputusan yang lebih cerdas dan efektif.

Makalah ini bertujuan untuk mengeksplorasi pendekatan analisis data dalam ekosistem Big
Data. Sebagai topik yang semakin penting dan relevan, analisis data di era Big Data membutuhkan
pengetahuan, metodologi, dan alat yang berbeda dari pendekatan tradisional. Melalui makalah ini,
kami akan meninjau konsep-konsep kunci dalam Big Data, karakteristik data yang unik, serta
teknik-teknik analisis data yang dapat diterapkan untuk memperoleh wawasan yang berharga.

Lebih lanjut, makalah ini akan membahas bagaimana organisasi dapat memanfaatkan
kekuatan Big Data untuk mendapatkan keunggulan kompetitif, mengoptimalkan proses bisnis, dan
membuat keputusan yang lebih baik. Selain itu, kami juga akan menyoroti tantangan dan isu-isu
yang harus dipertimbangkan dalam implementasi analisis data di lingkungan Big Data.

Kami berharap makalah ini dapat memberikan pemahaman yang mendalam tentang peran
vital analisis data dalam memanfaatkan kekuatan Big Data, serta menjadi referensi bagi pembaca
yang tertarik untuk memperdalam topik ini lebih lanjut.

Lapai, 10 Juli 2024

Penyusun,

ii
DAFTAR ISI

Sampul ............................................................................................................................ i

Kata Pengantar .............................................................................................................. ii

Daftar Isi ........................................................................................................................ iii

BAB I PENDAHULUAN

A. Latar Belakang ..................................................................................................... 1


B. Rumusan Masalah ................................................................................................ 2
C. Manfaat ................................................................................................................ 2

BAB II PEMBAHASAN

A. Defenisi Big Data ................................................................................................. 3


B. Fungsi dan Peran dari Big Data.............................................................................. 4
C. Metode Analisis Data dalam Konteks Big Data ..................................................... 5
D. Algoritma Umum yang Digunakan dalam Big Data .............................................. 6
E. Tahap Implementasi di Indonesia .......................................................................... 7

BAB III PENUTUP

A. Kesimpulan .......................................................................................................... 9
B. Tujuan ................................................................................................................. 9

Daftar Pustaka .............................................................................................................. 10

iii
BAB I

PENDAHULUAN

A. Latar Belakang

Kehadiran teknologi digital dan internet telah mengubah lanskap dunia informasi secara
dramatis. Setiap hari, kita menciptakan data dalam jumlah yang tak terbayangkan melalui
berbagai aktivitas online, interaksi di media sosial, transaksi e-commerce, sensor di perangkat
IoT, dan berbagai sumber digital lainnya. Menurut laporan IBM, setiap hari kita menghasilkan
sekitar 2,5 quintillion byte data baru [1]. Fenomena ini kemudian dikenal sebagai "Big Data".

Big Data didefinisikan sebagai kumpulan data yang sangat besar, kompleks, dan beragam,
yang tidak dapat diolah menggunakan perangkat lunak atau sistem informasi tradisional [2].
Kehadiran Big Data membawa tantangan sekaligus peluang bagi organisasi. Di satu sisi,
volume data yang terus meningkat dapat menjadi beban dan kompleksitas yang sulit dikelola.
Namun di sisi lain, Big Data juga menawarkan potensi yang sangat besar untuk memperoleh
wawasan yang berharga, membuat keputusan yang lebih cerdas, dan menciptakan inovasi yang
transformatif.

Analisis data dalam konteks Big Data menjadi semakin penting dan relevan. Teknik-teknik
analisis tradisional seringkali tidak memadai untuk menangani data dalam skala dan
kompleksitas yang tinggi. Oleh karena itu, diperlukan pendekatan analisis data yang lebih
canggih, termasuk penggunaan teknik machine learning, data mining, dan visualisasi data yang
dapat menggali informasi dan pola tersembunyi dari kumpulan data besar.

Makalah ini akan mendalami peran analisis data dalam ekosistem Big Data, meninjau
karakteristik data besar, serta membahas berbagai teknik dan pendekatan yang dapat
dimanfaatkan untuk memperoleh wawasan yang berharga dan membuat keputusan yang lebih
baik. Dengan pemahaman yang mendalam tentang analisis data dalam konteks Big Data,
organisasi dapat memanfaatkan kekuatan data untuk mencapai keunggulan kompetitif dan
inovasi yang transformatif.

1
B. Rumusan Masalah

1. Apa pengertian big data?


2. Apa fungsi dan peran dari big data?
3. Apa saja metode analisis data dalam konteks big data?
4. Apa saja algoritma umum yang digunakan dalam big data?
5. Bagaimana tahap implementasi big data di Indonesia?

C. Manfaat

Makalah ini diharapkan dapat memberikan manfaat sebagai berikut:

1. Pemahaman tentang Pengertian Big Data!


2. Pemahaman tentang Fungsi dan Peran Big Data!
3. Pemaparan Metode Analisis Data dalam Konteks Big Data!
4. Penjelasan tentang Algoritma Umum dalam Big Data!
5. Gambaran Tahapan Implementasi di Indonesia!

2
BAB II
PEMBAHASAN
A. Defenisi Big Data
Big Data didefinisikan sebagai sebuah masalah domain dimana teknologi tradisional
seperti relasional database tidak mampu lagi untuk melayani. Dalam laporan yang dibuat oleh
McKinsey Global Institute (MGI), Big Data adalah data yang sulit untuk dikoleksi, disimpan,
dikelola maupun dianalisa dengan menggunakan sistem database biasa karena volumenya yang
terus berlipat. Tidak semua data bisa diakategorikan sebagai Big Data. Big Data memiliki 5
karateristik, yaitu :
 Volume
Merujuk pada jumlah data yang sangat besar
yang dihasilkan dari berbagai sumber seperti
media sosial, sensor, perangkat IoT,
transaksi online, log server, dan lainnya.
Data ini bisa mencapai petabyte atau bahkan
eksabyte.
 Velocity (Kecepatan)
Kecepatan di mana data dihasilkan dan
diproses. Dalam banyak kasus, data
dihasilkan dalam waktu nyata atau hampir
waktu nyata, yang memerlukan pemrosesan yang cepat dan efisien untuk mendapatkan
wawasan yang berharga.
 Variety (Variasi)
Merujuk pada berbagai jenis data yang dihasilkan. Data bisa berupa terstruktur (misalnya,
database relasional), semi-terstruktur (misalnya, XML, JSON), atau tidak terstruktur
(misalnya, teks, gambar, video).
 Veracity (Kebenaran)
Mengacu pada kualitas dan keandalan data. Data Big Data sering kali berisi noise dan
ketidakakuratan, sehingga penting untuk memiliki mekanisme untuk memverifikasi dan
membersihkan data.

3
 Value (Nilai): Potensi nilai yang dapat diperoleh dari data tersebut. Analisis Big Data dapat
mengungkapkan wawasan berharga yang dapat digunakan untuk pengambilan keputusan
yang lebih baik, inovasi, dan keunggulan kompetitif.

B. Fungsi Dan Peran Dari Big Data


Big Data memiliki beberapa peranan penting bagi perusahaan, yaitu :
a) Meningkatkan Sales
Untuk mengetahui dan menilai produk-produk seperti apa yang perlu di ciptakandan di
produksi oleh perusahaan agar konsumen menyukai dan membeli produk yang di buat
perusahaan, perusahaan memerlukan beberapa data. Biasanya data yang bisa di gunakan
untuk meningkat kan sales perusahaan, di antaranya apayang di sukai, siapa yang di sukai,
bagaiaman perasaan saya, berada dimana saya, bersama siapa saya, apa yang telah saya
beli, apa saja yang ingin saya beli, mimpiapa yang ingin saya miliki, dan hal-hal lainnya.
b) Costumer Relationship
Salah satu cara perusahaan untuk membina loyalitas para kostumer merekaterhadap
brand milik perusahaan, adalah dengan memberikan memberikan ucapanselamat ulang
tahun atau terkadang juga kita akan mengirimkan penawaran promo produk meskipun kita
sudah lama tidak menggunakan produk mereka. Ini bagiandari proses Customer
Relathionship Management (CRM). Hal ini bisamenyebabkan pembelian kembali oleh
kostumer terhadap brand dari perusahaan.
Data ini biasanya di tolak ukur dari kapan kita ulang tahun, artis favorit kita, barang
jenis kesukaan kita, atau hal-hal yang kita suka. Data ini dijadikan patokanoleh perusahaan
untuk membina hubungan yang dekat dengan konsumen brandmereka. Sehingga
konsumen bisa menjadi hero bagi brand perusahaan di antara brand-brand produk lainnya.
c) Employee Relation
Daya Manusia (SDM) adalah aset terbesar bagi perusahaan.Meningkatkan loyalitas
dari karyawan terhadap perusahaan adalah suatukeharusan bagi perusahaan saat ini.
Salah satu cara yang bisa dilakukan adalah dengan mengumpulkan data-datatingkat
kepuasan dan ketidak puasan dari karyawannya. Data-data tersebutkemudian akan
dianalisa menjadi sebuah nilai yang berharga bagi perusahaan,karena dengan begitu
perusahaan bisa meningkatkan kinerja dari karyawannyadenganprogram-pogramyang

4
disediakan oleh perusahaan. Hal ini biasanyamenjadi tugas dari Departemen SDM
(Sumber Daya Manusia ) untuk melakukan percancangan program yang memberikan
benefit bagi tingkat kepuasan kerjakaryawan dan meningkatnnya produktivitas. Pada
akhirnya peranan penting Big Data memberikan informasi bagi perusahaan untuk
melakukan inovasi dalam menjalan bisnis mereka. Hanya tinggal bagaimana perusahaan
untuk mengumpulkan dan mengolah Big Data.

C. Metode Analisis Data Dalam Konteks Big Data


 Pemrosesan Paralel dan Terdistribusi
 MapReduce
Metode pemrosesan data yang membagi tugas besar menjadi tugas-tugas kecil yang
dapat dikerjakan secara paralel. MapReduce terdiri dari dua tahap utama: Map (memetakan
data ke pasangan kunci-nilai) dan Reduce (menggabungkan hasil dari tahap Map).
 Apache Spark
Framework komputasi terdistribusi yang menyediakan antarmuka untuk pemrograman
seluruh kluster dengan implicit data parallelism dan fault-tolerance.
 Penyimpanan dan Manajemen Data
 Hadoop Distributed File System (HDFS)
Sistem penyimpanan terdistribusi yang dirancang untuk menyimpan data dalam jumlah
besar dan menyediakan akses data yang cepat.
 NoSQL Databases
Basis data yang tidak menggunakan tabel relasional tradisional. Contohnya termasuk
MongoDB, Cassandra, dan HBase, yang dirancang untuk menangani data yang tidak
terstruktur dan semi-terstruktur dalam skala besar.

 Stream Processing
 Apache Kafka

Platform streaming yang dapat menangani data real-time dari berbagai sumber.

 Apache Flink:

Framework untuk pemrosesan data yang menyediakan kemampuan untuk memproses


aliran data secara real-time.

5
D. Algoritma Umum Yang Digunakan Dalam Big Data
1. Machine Learning
 K-Means Clustering: Algoritma clustering yang membagi dataset ke dalam K kelompok
berdasarkan jarak euclidean.
 Decision Trees: Struktur pohon yang digunakan untuk pengambilan keputusan dan
prediksi berdasarkan fitur data.
 Random Forest: Algoritma ensemble learning yang membangun beberapa pohon
keputusan dan menggabungkannya untuk mendapatkan hasil yang lebih akurat dan stabil.
 Support Vector Machines (SVM): Algoritma klasifikasi yang mencari hyperplane
terbaik untuk memisahkan kelas-kelas dalam data.
 Neural Networks dan Deep Learning: Algoritma yang terdiri dari beberapa lapisan
neuron yang digunakan untuk mengenali pola kompleks dalam data, seperti
Convolutional Neural Networks (CNN) untuk pengolahan gambar dan Recurrent Neural
Networks (RNN) untuk data berurutan.

2. Analisis Graf:

 PageRank: Algoritma yang digunakan oleh Google untuk menentukan peringkat


halaman web berdasarkan struktur tautan antar halaman.
 Graph Traversal Algorithms: Algoritma seperti Breadth-First Search (BFS) dan Depth-
First Search (DFS) untuk menjelajahi graf.
 Community Detection: Algoritma untuk menemukan komunitas atau kelompok dalam
graf, seperti Louvain method dan Girvan-Newman algorithm.

3. Natural Language Processing (NLP):

 Latent Dirichlet Allocation (LDA): Algoritma untuk menemukan topik tersembunyi


dalam dokumen teks.
 Word2Vec: Teknik embedding kata yang digunakan untuk mewakili kata-kata dalam
bentuk vektor yang bermakna.

6
4. Time Series Analysis:

 ARIMA (AutoRegressive Integrated Moving Average): Model statistik untuk


menganalisis dan meramalkan data deret waktu.
 Prophet: Alat forecasting yang dikembangkan oleh Facebook yang menangani data deret
waktu dengan musiman dan tren.

5. Anomaly Detection:

 Isolation Forest: Algoritma yang mendeteksi anomali dengan mengisolasi pengamatan


menggunakan pohon keputusan.
 DBSCAN (Density-Based Spatial Clustering of Applications with Noise): Algoritma
clustering yang mendeteksi anomali sebagai poin yang tidak termasuk dalam kelompok
mana pun.

E. Tahap Implementasi Di Indonesia

Beragam bentuk informasi baru yang muncul secara akhir-akhir ini mendorong trend
Business Analytic baru yang berbeda dari pendekatan Analytic tradisional,yaitu:

1. Data Web dan Social Media seperti data log clickstream yang merekam perilaku konsumen
di Internet, ataupun interaksi konsumen dalammemproduksi konten web di media sosial
seperti Facebook, Twitter, LinkedIndan blog.
2. Data Machine-to-Machine seperti data sensor, metering, dan perangkat smartmicro-
devices lain yang dikenal sebagai bagian dari fenomena “Internet of Things”.
3. Big Transaction Data seperti klaim layanan kesehatan, transaksi konsumen diPoint-of-
Sales, log Call Data Record (CDR) di industri telekomunikasi, logtransaksi ritel layanan
finansial (transaksi ATM, kartu debit/kredit).
4. Human Generated data seperti catatan agen Call Centre, rekaman aduan pelanggan, email,
dokumen bisnis, data survey hingga catatan medis elektronik

Bentuk tipe informasi baru seperti ini membutuhkan tipe Analytic lebih lanjut berupa
analisa-analisa statistik dalam Data Mining ataupun Text Mining, atau yang biasa disebut

7
sebagai Predictive Analytic. Gabungan antara Big Data danPredictive Analytic sering
diringkas dalam istilah yang lebih popular: Big Data Analytic IBM meluncurkan hasil studi
tentang strategi pengadopsian Big Data Analytic yang dilakukan bersama dengan University
of Oxford dengan mensurvey 1061 perusahaan dari berbagai belahan dunia. Survey ini
menemukan bahwa 28 persen dari perusahaan tersebut sedang melakukan aktifitas piloting
ataupun implementasi big data. Studi tersebutmenggaris bawahi bahwa adopsi big data terdiri
atas 4 fase, sebagai berikut:

 “Educate”. Fase ini fokus pada pengumpulan pengetahuan dan observasi market
 “Explore”. Setelah menyelesaikan fase edukasi, perusahaan menyusunstrategi dan
roadmap berbasis kebutuhan dan tantangan bisnisnya
 “Engage”. Selama fase ketiga ini, bisnis melakukan pilot inisiatif big data untuk
memvalidasi value dan kebutuhan-kebutuhannya
 “Execute”. Perusahaan pada fase keempat ini telah menerapkan dua ataulebih inisiatif
big data dan akan melanjutkan denganinisiatifanalytics lanjutannya.

Langkah-langkah dalam merancang serta mengimplementasikan Big Data :

1. Identifikasi Strategis Kebutuhan Manajemen Big Data dalam Strategi Bisnis.


2. Penyusunan Strategi Teknologi Big Data Analytic: Cetak Biru Arsitektur Teknologi
(Hadoop/In-Memory Databases/Real-Time Analytic/MassiveParallel Processing Database
Appliance) & Evaluasi Pemilihan Produk.
3. Penyusuan Roadmap implementasi Big Data Analytic yang selaras dengankebutuhan
Strategi Bisnis.
4. Permodelan Big Data Governance yang meliputi aspekdata qualityassurance, information
lifecycle management, data privacy issue, master data integration & business process
integration.
5. Permodelan Data dalam sistem Big Data.
6. Manajemen Proyek & Prosedur Pengembangan Sistem Big Data Analytic.
7. Implementasi pengembangan sistem Big Data Analytic.

8
BAB III
PENUTUP
A. Kesimpulan
Kehadiran teknologi digital dan internet telah mengubah lanskap dunia informasi secara
dramatis. Fenomena ini telah menghasilkan jumlah data yang sangat besar setiap hari, yang
dikenal sebagai "Big Data". Big Data didefinisikan sebagai kumpulan data yang sangat besar,
kompleks, dan beragam, yang tidak dapat diolah menggunakan perangkat lunak atau sistem
informasi tradisional.
Big Data membawa tantangan sekaligus peluang bagi organisasi. Analisis data dalam
konteks Big Data menjadi semakin penting dan relevan, karena teknik-teknik analisis
tradisional seringkali tidak memadai. Diperlukan pendekatan analisis data yang lebih canggih,
termasuk penggunaan teknik machine learning, data mining, dan visualisasi data untuk
menggali informasi dan pola tersembunyi dari kumpulan data besar.
Dengan pemahaman yang mendalam tentang analisis data dalam konteks Big Data,
organisasi dapat memanfaatkan kekuatan data untuk mencapai keunggulan kompetitif dan
inovasi yang transformatif. Hal ini memungkinkan organisasi untuk membuat keputusan yang
lebih cerdas dan efektif, serta mengoptimalkan proses bisnis mereka.

B. Tujuan
Tujuan utama dari makalah ini adalah untuk meningkatkan pemahaman pembaca tentang
konsep Big Data dan karakteristiknya yang membedakannya dari data tradisional. Selain itu,
makalah ini juga bertujuan untuk menganalisis tantangan dan peluang yang dihadapi organisasi
dalam mengelola dan memanfaatkan Big Data. Lebih lanjut, makalah ini memaparkan
pentingnya analisis data dalam konteks Big Data, termasuk teknik-teknik yang dapat
digunakan, seperti machine learning, data mining, dan visualisasi data. Tujuan lainnya adalah
untuk menekankan manfaat dari pemahaman yang mendalam tentang analisis data dalam
konteks Big Data, dan bagaimana hal ini dapat membantu organisasi mencapai keunggulan
kompetitif melalui pengambilan keputusan yang lebih cerdas dan inovasi yang transformatif
dengan memanfaatkan potensi kekuatan data besar.

9
DAFTAR PUSTAKA
IBM. (n.d.). The Four V's of Big Data. Diakses pada 10 Juli 2024, dari
https://www.ibm.com/blogs/watson-health/the-four-vs-of-big-data/
Gartner. (n.d.). Gartner Glossary: Big Data. Diakses pada 10 Juli 2024, dari
https://www.gartner.com/en/information-technology/glossary/big-data
McAfee, A., & Brynjolfsson, E. (2012). Big Data: The Management Revolution. Harvard Business
Review, 90(10), 60–68
Labrinidis, A., & Jagadish, H. V. (2012). Challenges and opportunities with big data. Proceedings
of the VLDB Endowment, 5(12), 2032–2033.
Jin, X., Wah, B. W., Cheng, X., & Wang, Y. (2015). Significance and Challenges of Big Data
Research. Big Data Research, 2(2), 59–64.
Gandomi, A., & Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics.
International Journal of Information Management, 35(2), 137–144.
Chen, M., Mao, S., & Liu, Y. (2014). Big Data: A Survey. Mobile Networks and Applications,
19(2), 171–209.

10

Anda mungkin juga menyukai