Makalah BIG DATA Kelompok 3
Makalah BIG DATA Kelompok 3
Makalah BIG DATA Kelompok 3
BIG DATA
ANALISIS DATA DALAM BIG DATA
Dosen Pengampu : Muhammad Atnang, S. Kom., M. Kom
Penyusun :
Kelompok III
Muhammad Ashar (122.56202.024)
Akbar Saleh (122.56202.079)
Iskandar (122.56202.019)
Mita Surahmawanti (122.56202.023)
Zakiyah Konasarah (122.56202.052)
FAKULTAS TEKNIK
i
KATA PENGANTAR
Dunia digital saat ini telah mengalami ledakan data yang tak terbayangkan sebelumnya.
Setiap detik, kita menghasilkan data baru dalam jumlah yang sangat besar, mulai dari interaksi di
media sosial, transaksi online, sensor di perangkat IoT, dan berbagai aktivitas digital lainnya.
Fenomena ini dikenal sebagai "Big Data", yang membawa tantangan sekaligus peluang bagi
organisasi untuk mengambil keputusan yang lebih cerdas dan efektif.
Makalah ini bertujuan untuk mengeksplorasi pendekatan analisis data dalam ekosistem Big
Data. Sebagai topik yang semakin penting dan relevan, analisis data di era Big Data membutuhkan
pengetahuan, metodologi, dan alat yang berbeda dari pendekatan tradisional. Melalui makalah ini,
kami akan meninjau konsep-konsep kunci dalam Big Data, karakteristik data yang unik, serta
teknik-teknik analisis data yang dapat diterapkan untuk memperoleh wawasan yang berharga.
Lebih lanjut, makalah ini akan membahas bagaimana organisasi dapat memanfaatkan
kekuatan Big Data untuk mendapatkan keunggulan kompetitif, mengoptimalkan proses bisnis, dan
membuat keputusan yang lebih baik. Selain itu, kami juga akan menyoroti tantangan dan isu-isu
yang harus dipertimbangkan dalam implementasi analisis data di lingkungan Big Data.
Kami berharap makalah ini dapat memberikan pemahaman yang mendalam tentang peran
vital analisis data dalam memanfaatkan kekuatan Big Data, serta menjadi referensi bagi pembaca
yang tertarik untuk memperdalam topik ini lebih lanjut.
Penyusun,
ii
DAFTAR ISI
Sampul ............................................................................................................................ i
BAB I PENDAHULUAN
BAB II PEMBAHASAN
A. Kesimpulan .......................................................................................................... 9
B. Tujuan ................................................................................................................. 9
iii
BAB I
PENDAHULUAN
A. Latar Belakang
Kehadiran teknologi digital dan internet telah mengubah lanskap dunia informasi secara
dramatis. Setiap hari, kita menciptakan data dalam jumlah yang tak terbayangkan melalui
berbagai aktivitas online, interaksi di media sosial, transaksi e-commerce, sensor di perangkat
IoT, dan berbagai sumber digital lainnya. Menurut laporan IBM, setiap hari kita menghasilkan
sekitar 2,5 quintillion byte data baru [1]. Fenomena ini kemudian dikenal sebagai "Big Data".
Big Data didefinisikan sebagai kumpulan data yang sangat besar, kompleks, dan beragam,
yang tidak dapat diolah menggunakan perangkat lunak atau sistem informasi tradisional [2].
Kehadiran Big Data membawa tantangan sekaligus peluang bagi organisasi. Di satu sisi,
volume data yang terus meningkat dapat menjadi beban dan kompleksitas yang sulit dikelola.
Namun di sisi lain, Big Data juga menawarkan potensi yang sangat besar untuk memperoleh
wawasan yang berharga, membuat keputusan yang lebih cerdas, dan menciptakan inovasi yang
transformatif.
Analisis data dalam konteks Big Data menjadi semakin penting dan relevan. Teknik-teknik
analisis tradisional seringkali tidak memadai untuk menangani data dalam skala dan
kompleksitas yang tinggi. Oleh karena itu, diperlukan pendekatan analisis data yang lebih
canggih, termasuk penggunaan teknik machine learning, data mining, dan visualisasi data yang
dapat menggali informasi dan pola tersembunyi dari kumpulan data besar.
Makalah ini akan mendalami peran analisis data dalam ekosistem Big Data, meninjau
karakteristik data besar, serta membahas berbagai teknik dan pendekatan yang dapat
dimanfaatkan untuk memperoleh wawasan yang berharga dan membuat keputusan yang lebih
baik. Dengan pemahaman yang mendalam tentang analisis data dalam konteks Big Data,
organisasi dapat memanfaatkan kekuatan data untuk mencapai keunggulan kompetitif dan
inovasi yang transformatif.
1
B. Rumusan Masalah
C. Manfaat
2
BAB II
PEMBAHASAN
A. Defenisi Big Data
Big Data didefinisikan sebagai sebuah masalah domain dimana teknologi tradisional
seperti relasional database tidak mampu lagi untuk melayani. Dalam laporan yang dibuat oleh
McKinsey Global Institute (MGI), Big Data adalah data yang sulit untuk dikoleksi, disimpan,
dikelola maupun dianalisa dengan menggunakan sistem database biasa karena volumenya yang
terus berlipat. Tidak semua data bisa diakategorikan sebagai Big Data. Big Data memiliki 5
karateristik, yaitu :
Volume
Merujuk pada jumlah data yang sangat besar
yang dihasilkan dari berbagai sumber seperti
media sosial, sensor, perangkat IoT,
transaksi online, log server, dan lainnya.
Data ini bisa mencapai petabyte atau bahkan
eksabyte.
Velocity (Kecepatan)
Kecepatan di mana data dihasilkan dan
diproses. Dalam banyak kasus, data
dihasilkan dalam waktu nyata atau hampir
waktu nyata, yang memerlukan pemrosesan yang cepat dan efisien untuk mendapatkan
wawasan yang berharga.
Variety (Variasi)
Merujuk pada berbagai jenis data yang dihasilkan. Data bisa berupa terstruktur (misalnya,
database relasional), semi-terstruktur (misalnya, XML, JSON), atau tidak terstruktur
(misalnya, teks, gambar, video).
Veracity (Kebenaran)
Mengacu pada kualitas dan keandalan data. Data Big Data sering kali berisi noise dan
ketidakakuratan, sehingga penting untuk memiliki mekanisme untuk memverifikasi dan
membersihkan data.
3
Value (Nilai): Potensi nilai yang dapat diperoleh dari data tersebut. Analisis Big Data dapat
mengungkapkan wawasan berharga yang dapat digunakan untuk pengambilan keputusan
yang lebih baik, inovasi, dan keunggulan kompetitif.
4
disediakan oleh perusahaan. Hal ini biasanyamenjadi tugas dari Departemen SDM
(Sumber Daya Manusia ) untuk melakukan percancangan program yang memberikan
benefit bagi tingkat kepuasan kerjakaryawan dan meningkatnnya produktivitas. Pada
akhirnya peranan penting Big Data memberikan informasi bagi perusahaan untuk
melakukan inovasi dalam menjalan bisnis mereka. Hanya tinggal bagaimana perusahaan
untuk mengumpulkan dan mengolah Big Data.
Stream Processing
Apache Kafka
Platform streaming yang dapat menangani data real-time dari berbagai sumber.
Apache Flink:
5
D. Algoritma Umum Yang Digunakan Dalam Big Data
1. Machine Learning
K-Means Clustering: Algoritma clustering yang membagi dataset ke dalam K kelompok
berdasarkan jarak euclidean.
Decision Trees: Struktur pohon yang digunakan untuk pengambilan keputusan dan
prediksi berdasarkan fitur data.
Random Forest: Algoritma ensemble learning yang membangun beberapa pohon
keputusan dan menggabungkannya untuk mendapatkan hasil yang lebih akurat dan stabil.
Support Vector Machines (SVM): Algoritma klasifikasi yang mencari hyperplane
terbaik untuk memisahkan kelas-kelas dalam data.
Neural Networks dan Deep Learning: Algoritma yang terdiri dari beberapa lapisan
neuron yang digunakan untuk mengenali pola kompleks dalam data, seperti
Convolutional Neural Networks (CNN) untuk pengolahan gambar dan Recurrent Neural
Networks (RNN) untuk data berurutan.
2. Analisis Graf:
6
4. Time Series Analysis:
5. Anomaly Detection:
Beragam bentuk informasi baru yang muncul secara akhir-akhir ini mendorong trend
Business Analytic baru yang berbeda dari pendekatan Analytic tradisional,yaitu:
1. Data Web dan Social Media seperti data log clickstream yang merekam perilaku konsumen
di Internet, ataupun interaksi konsumen dalammemproduksi konten web di media sosial
seperti Facebook, Twitter, LinkedIndan blog.
2. Data Machine-to-Machine seperti data sensor, metering, dan perangkat smartmicro-
devices lain yang dikenal sebagai bagian dari fenomena “Internet of Things”.
3. Big Transaction Data seperti klaim layanan kesehatan, transaksi konsumen diPoint-of-
Sales, log Call Data Record (CDR) di industri telekomunikasi, logtransaksi ritel layanan
finansial (transaksi ATM, kartu debit/kredit).
4. Human Generated data seperti catatan agen Call Centre, rekaman aduan pelanggan, email,
dokumen bisnis, data survey hingga catatan medis elektronik
Bentuk tipe informasi baru seperti ini membutuhkan tipe Analytic lebih lanjut berupa
analisa-analisa statistik dalam Data Mining ataupun Text Mining, atau yang biasa disebut
7
sebagai Predictive Analytic. Gabungan antara Big Data danPredictive Analytic sering
diringkas dalam istilah yang lebih popular: Big Data Analytic IBM meluncurkan hasil studi
tentang strategi pengadopsian Big Data Analytic yang dilakukan bersama dengan University
of Oxford dengan mensurvey 1061 perusahaan dari berbagai belahan dunia. Survey ini
menemukan bahwa 28 persen dari perusahaan tersebut sedang melakukan aktifitas piloting
ataupun implementasi big data. Studi tersebutmenggaris bawahi bahwa adopsi big data terdiri
atas 4 fase, sebagai berikut:
“Educate”. Fase ini fokus pada pengumpulan pengetahuan dan observasi market
“Explore”. Setelah menyelesaikan fase edukasi, perusahaan menyusunstrategi dan
roadmap berbasis kebutuhan dan tantangan bisnisnya
“Engage”. Selama fase ketiga ini, bisnis melakukan pilot inisiatif big data untuk
memvalidasi value dan kebutuhan-kebutuhannya
“Execute”. Perusahaan pada fase keempat ini telah menerapkan dua ataulebih inisiatif
big data dan akan melanjutkan denganinisiatifanalytics lanjutannya.
8
BAB III
PENUTUP
A. Kesimpulan
Kehadiran teknologi digital dan internet telah mengubah lanskap dunia informasi secara
dramatis. Fenomena ini telah menghasilkan jumlah data yang sangat besar setiap hari, yang
dikenal sebagai "Big Data". Big Data didefinisikan sebagai kumpulan data yang sangat besar,
kompleks, dan beragam, yang tidak dapat diolah menggunakan perangkat lunak atau sistem
informasi tradisional.
Big Data membawa tantangan sekaligus peluang bagi organisasi. Analisis data dalam
konteks Big Data menjadi semakin penting dan relevan, karena teknik-teknik analisis
tradisional seringkali tidak memadai. Diperlukan pendekatan analisis data yang lebih canggih,
termasuk penggunaan teknik machine learning, data mining, dan visualisasi data untuk
menggali informasi dan pola tersembunyi dari kumpulan data besar.
Dengan pemahaman yang mendalam tentang analisis data dalam konteks Big Data,
organisasi dapat memanfaatkan kekuatan data untuk mencapai keunggulan kompetitif dan
inovasi yang transformatif. Hal ini memungkinkan organisasi untuk membuat keputusan yang
lebih cerdas dan efektif, serta mengoptimalkan proses bisnis mereka.
B. Tujuan
Tujuan utama dari makalah ini adalah untuk meningkatkan pemahaman pembaca tentang
konsep Big Data dan karakteristiknya yang membedakannya dari data tradisional. Selain itu,
makalah ini juga bertujuan untuk menganalisis tantangan dan peluang yang dihadapi organisasi
dalam mengelola dan memanfaatkan Big Data. Lebih lanjut, makalah ini memaparkan
pentingnya analisis data dalam konteks Big Data, termasuk teknik-teknik yang dapat
digunakan, seperti machine learning, data mining, dan visualisasi data. Tujuan lainnya adalah
untuk menekankan manfaat dari pemahaman yang mendalam tentang analisis data dalam
konteks Big Data, dan bagaimana hal ini dapat membantu organisasi mencapai keunggulan
kompetitif melalui pengambilan keputusan yang lebih cerdas dan inovasi yang transformatif
dengan memanfaatkan potensi kekuatan data besar.
9
DAFTAR PUSTAKA
IBM. (n.d.). The Four V's of Big Data. Diakses pada 10 Juli 2024, dari
https://www.ibm.com/blogs/watson-health/the-four-vs-of-big-data/
Gartner. (n.d.). Gartner Glossary: Big Data. Diakses pada 10 Juli 2024, dari
https://www.gartner.com/en/information-technology/glossary/big-data
McAfee, A., & Brynjolfsson, E. (2012). Big Data: The Management Revolution. Harvard Business
Review, 90(10), 60–68
Labrinidis, A., & Jagadish, H. V. (2012). Challenges and opportunities with big data. Proceedings
of the VLDB Endowment, 5(12), 2032–2033.
Jin, X., Wah, B. W., Cheng, X., & Wang, Y. (2015). Significance and Challenges of Big Data
Research. Big Data Research, 2(2), 59–64.
Gandomi, A., & Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics.
International Journal of Information Management, 35(2), 137–144.
Chen, M., Mao, S., & Liu, Y. (2014). Big Data: A Survey. Mobile Networks and Applications,
19(2), 171–209.
10