Welcome to Scribd!

100% found this document useful (2 votes)

3K views

Ccs334 - Big Data Analytics

Uploaded by

This document outlines the course objectives, units, outcomes, experiments, and requirements for CCS334 Big Data Analytics. The course aims to help students understand the usage of Hadoop related tools for big data analytics. The 5 units cover understanding big data, NoSQL data management, basics of Hadoop, MapReduce applications, and Hadoop related tools like HBase, Pig and Hive. The course outcomes are for students to describe big data use cases, explain NoSQL management, install and use Hadoop/HDFS, perform MapReduce analytics, and use tools like HBase, Cassandra, Pig and Hive for analytics. A list of 8 experiments and the software requirements of Cassandra, Hadoop, Java, Pig, Hive

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Ccs334 - Big Data Analytics

Uploaded by

silambarasan

100% found this document useful (2 votes)

3K views2 pages

Original Title

Ccs334 - Big Data Analytics (1)

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

100% found this document useful (2 votes)

3K views2 pages

Ccs334 - Big Data Analytics

Uploaded by

silambarasan

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

CCS334 BIG DATA ANALYTICS LTPC

2023
COURSE OBJECTIVES:

understand the usage of Hadoop related tools for Big Data Analytics

UNIT I UNDERSTANDING BIG DATA 5

Introduction to big data – convergence of key trends – unstructured data – industry examples of
big data – web analytics – big data applications– big data technologies – introduction to Hadoop
– open source technologies – cloud and big data – mobile business intelligence – Crowd
sourcing analytics – inter and trans firewall analytics.

UNIT II NOSQL DATA MANAGEMENT 7

Introduction to NoSQL – aggregate data models – key-value and document data models –
relationships – graph databases – schemaless databases – materialized views – distribution
models – master-slave replication – consistency - Cassandra – Cassandra data model –
Cassandra examples – Cassandra clients

UNIT IV MAP REDUCE APPLICATIONS 6

MapReduce workflows – unit tests with MRUnit – test data and local tests – anatomy of
MapReduce job run – classic Map-reduce – YARN – failures in classic Map-reduce and YARN –
job scheduling – shuffle and sort – task execution – MapReduce types – input formats – output
formats.

UNIT III BASICS OF HADOOP 6

Data format – analyzing data with Hadoop – scaling out – Hadoop streaming – Hadoop pipes –
design of Hadoop distributed file system (HDFS) – HDFS concepts – Java interface – data flow
– Hadoop I/O – data integrity – compression – serialization – Avro – file-based data structures -
Cassandra – Hadoop integration.

UNIT V HADOOP RELATED TOOLS 6

Hbase – data model and implementations – Hbase clients – Hbase examples – praxis.
Pig – Grunt – pig data model – Pig Latin – developing and testing Pig Latin scripts.
Hive – data types and file formats – HiveQL data definition – HiveQL data manipulation –
HiveQL queries.

30 PERIODS
COURSE OUTCOMES:

After the completion of this course, students will be able to:

CO1:Describe big data and use cases from selected business domains.
CO2:Explain NoSQL big data management.
CO3:Install, configure, and run Hadoop and HDFS.
CO4:Perform map-reduce analytics using Hadoop.
CO5:Use Hadoop-related tools such as HBase, Cassandra, Pig, and Hive for big data analytics.

LIST OF EXPERIMENTS: 30 PERIODS

1. Downloading and installing Hadoop; Understanding different Hadoop modes. Startup scripts,
Configuration files.
2. Hadoop Implementation of file management tasks, such as Adding files and directories,
retrieving files and Deleting files
3. Implement of Matrix Multiplication with Hadoop Map Reduce
4. Run a basic Word Count Map Reduce program to understand Map Reduce Paradigm.
5. Installation of Hive along with practice examples.
7. Installation of HBase, Installing thrift along with Practice examples
8. Practice importing and exporting data from various databases.

Software Requirements:
Cassandra, Hadoop, Java, Pig, Hive and HBase.

TOTAL:60 PERIODS
TEXT BOOKS:

1. Michael Minelli, Michelle Chambers, and AmbigaDhiraj, "Big Data, Big Analytics: Emerging
Business Intelligence and Analytic Trends for Today's Businesses", Wiley, 2013.
2. Eric Sammer, "Hadoop Operations", O'Reilley, 2012.
3. Sadalage, Pramod J. “NoSQL distilled”, 2013

REFERENCES:

1. E. Capriolo, D. Wampler, and J. Rutherglen, "Programming Hive", O'Reilley, 2012.

2. Lars George, "HBase: The Definitive Guide", O'Reilley, 2011.
3. Eben Hewitt, "Cassandra: The Definitive Guide", O'Reilley, 2010. 87
4. Alan Gates, "Programming Pig", O'Reilley, 2011.

Unit I - Part I Notes
Document33 pages
Unit I - Part I Notes
Manju Ancy John Immanuel
100% (6)
Ccs341 Data Warehousing
Document2 pages
Ccs341 Data Warehousing
arul mamce
60% (5)
cp5293 Big Data Analytics Question Bank
Document13 pages
cp5293 Big Data Analytics Question Bank
Sanguine Shereen
0% (1)
Module-1 Important Long Questions:: Subject: Internet of Things (Iot)
Document3 pages
Module-1 Important Long Questions:: Subject: Internet of Things (Iot)
Rajesh Panda
100% (3)
Ad3411 Data Science and Analytics Laboratory
Document24 pages
Ad3411 Data Science and Analytics Laboratory
Mohamed Shajid N
100% (7)
CSBS - AD3491 - FDSA - IA 1 - Answer Key
Document14 pages
CSBS - AD3491 - FDSA - IA 1 - Answer Key
R.Mohan Kumar
100% (10)
UNIT-3 Hadoop and MapReduce Programming
Document84 pages
UNIT-3 Hadoop and MapReduce Programming
Naru Naveen
100% (1)
Unit3 BD
Document104 pages
Unit3 BD
Hirdesh Sharma
100% (1)
Big Data Analytics Unit 1 MCQ
Document10 pages
Big Data Analytics Unit 1 MCQ
Karuna
90% (10)
Cp5293 Big Data Analytics Question Bank
Document13 pages
Cp5293 Big Data Analytics Question Bank
Sanguine Shereen
0% (1)
Ccs334 Big Data Analytics
Document2 pages
Ccs334 Big Data Analytics
ramyavanmathyg
No ratings yet
Big Data Analysis Lab Manual
Document39 pages
Big Data Analysis Lab Manual
ragulnagarajan896
No ratings yet
CP7019-Managing Big Data-Anna University - Question Paper
Document4 pages
CP7019-Managing Big Data-Anna University - Question Paper
bhuvangates
100% (3)
4 UNIT-4 Introduction To Hadoop
Document154 pages
4 UNIT-4 Introduction To Hadoop
PrakashRameshGadekar
No ratings yet
Unit 3-BDA
Document26 pages
Unit 3-BDA
Amritha
0% (1)
cp5293 Big Data Analytics Unit 5 PDF
Document28 pages
cp5293 Big Data Analytics Unit 5 PDF
Gnanendra Kotikam
No ratings yet
Unit 5 Notes
Document66 pages
Unit 5 Notes
Malathy S
100% (3)
Map Reduce Applications
Document94 pages
Map Reduce Applications
Hirdesh Sharma
No ratings yet
Ccs341 - Data Warehousing
Document2 pages
Ccs341 - Data Warehousing
silambarasan
100% (1)
CS8091 Important Questions BDA
Document1 page
CS8091 Important Questions BDA
vanitha
No ratings yet
Ccs 334
Document16 pages
Ccs 334
Amsaveni .amsaveni
No ratings yet
Question Bank-Big Data
Document1 page
Question Bank-Big Data
Hìtésh Rélwàñí
0% (3)
BDA Lab Manual AI&DS
Document60 pages
BDA Lab Manual AI&DS
Ridha
No ratings yet
A Convergence of Key Trends: Kept Large Amounts of Information Information On Tape
Document14 pages
A Convergence of Key Trends: Kept Large Amounts of Information Information On Tape
Pratiksha Deshmukh
No ratings yet
BD - Unit - III - MapReduce
Document31 pages
BD - Unit - III - MapReduce
Prem Kumar
No ratings yet
Unit5 BD
Document91 pages
Unit5 BD
Hirdesh Sharma
100% (2)
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
Document6 pages
Data Mining Question Bank Chapter-1 (Introduction To Data Warehouse and Data Mining) Expected Questions 1 Mark Questions
Manjunath A
No ratings yet
DSBDA ORAL Question Bank
Document6 pages
DSBDA ORAL Question Bank
SUnny
100% (1)
Question Bank For Int - Data Science
Document5 pages
Question Bank For Int - Data Science
Priyansh Polra
100% (1)
r18 - Big Data Analytics - Cse (DS)
Document1 page
r18 - Big Data Analytics - Cse (DS)
aarthi dev
0% (1)
Big Data Analytics Unit 2 MINING DATA STREAMS
Document22 pages
Big Data Analytics Unit 2 MINING DATA STREAMS
Rathi Priya
100% (2)
BDA Final Lab Manual
Document56 pages
BDA Final Lab Manual
Public Tola
100% (1)
Anatomy of Mapreduce Job Run: Some Slides Are Taken From Cmu PPT Presentation
Document73 pages
Anatomy of Mapreduce Job Run: Some Slides Are Taken From Cmu PPT Presentation
Rajesh Kumar Rakasula
No ratings yet
B.Tech - AIDS - Business Analytics-CCW331-Elective-III Year AIDS Students
Document4 pages
B.Tech - AIDS - Business Analytics-CCW331-Elective-III Year AIDS Students
srini durvesh
No ratings yet
ML OLD Question Paper
Document2 pages
ML OLD Question Paper
SH Gaming
40% (5)
Ocs353dsf Unit Wise Notes
Document121 pages
Ocs353dsf Unit Wise Notes
gowthamkmech1304
100% (2)
CCS341-Data Warehousing Notes-Unit I
Document30 pages
CCS341-Data Warehousing Notes-Unit I
NISHANTH M
No ratings yet
MCQ - Bda
Document3 pages
MCQ - Bda
ShanthiniSampath
33% (3)
Big Data Analytics: Seema Acharya Subhashini Chellappan
Document47 pages
Big Data Analytics: Seema Acharya Subhashini Chellappan
Raghavendra Danadavar - 2BA17CS051
100% (1)
B Tech AIDS
Document43 pages
B Tech AIDS
RAMESHKUMAR.S MCE-LECT/MECH
No ratings yet
CCS334 Big Data Analytics Important Question
Document1 page
CCS334 Big Data Analytics Important Question
vigneshleve03
No ratings yet
CCS335 QN Bank
Document6 pages
CCS335 QN Bank
Boomija IT
No ratings yet
CS3591 Computer Networks Unit-01 Notes
Document87 pages
CS3591 Computer Networks Unit-01 Notes
cse241085
No ratings yet
Ds4015 Big Data Analytics QB
Document155 pages
Ds4015 Big Data Analytics QB
BARATH
No ratings yet
AD3491 - FDSA - Unit I - Introduction - Part I
Document23 pages
AD3491 - FDSA - Unit I - Introduction - Part I
R.Mohan Kumar
100% (1)
Cp4251 Iot
Document61 pages
Cp4251 Iot
Poovizhi R - 2021
100% (5)
Ad3301 - Data Exploration and Visualization
Document2 pages
Ad3301 - Data Exploration and Visualization
silambarasan
100% (4)
CCT Mp4251 Unit1 To 5 Study Materials - Compressed
Document105 pages
CCT Mp4251 Unit1 To 5 Study Materials - Compressed
balajias.bala5242
No ratings yet
AD3491 FDSA Syllabus
Document2 pages
AD3491 FDSA Syllabus
SASIKUMAR B
No ratings yet
MC5502 Bigdata Unit 2 Notes
Document20 pages
MC5502 Bigdata Unit 2 Notes
Sreehul
100% (2)
AI - Unit I QB
Document1 page
AI - Unit I QB
Narendran Muthusamy
100% (1)
Question Paper Code:: (10×2 20 Marks)
Document2 pages
Question Paper Code:: (10×2 20 Marks)
Ponraj Park
No ratings yet
Unit-Iii 3.1 Regression Modelling
Document7 pages
Unit-Iii 3.1 Regression Modelling
Sankar Jaikissan
100% (1)
ME P4252-II Semester - MACHINE LEARNING
Document48 pages
ME P4252-II Semester - MACHINE LEARNING
Bibsy Adlin Kumari R
No ratings yet
CCS375 Web Technologies Lecture Notes 1
Document454 pages
CCS375 Web Technologies Lecture Notes 1
Sindhu
No ratings yet
Super Important Questions For BDA
Document26 pages
Super Important Questions For BDA
Akhila R
100% (1)
Big Data Analytics With Lab
Document3 pages
Big Data Analytics With Lab
Keerthana K
No ratings yet
Big Data Analytics Syllabus
Document3 pages
Big Data Analytics Syllabus
antush.fredina
No ratings yet
DATA ANALYTICS Lab
Document3 pages
DATA ANALYTICS Lab
Boopathi kumar
No ratings yet
Big Data - 2 Marks-1
Document1 page
Big Data - 2 Marks-1
TKK
No ratings yet
Pig Latin Users Guide
Document13 pages
Pig Latin Users Guide
mahdimax
No ratings yet
Cloudera Overview PDF
Document20 pages
Cloudera Overview PDF
jennykena
No ratings yet
Ess SDG
Document180 pages
Ess SDG
Huy Taxuan
No ratings yet
Data Analytics
Document6 pages
Data Analytics
someone soemwhere
No ratings yet
Unit 2 Notes BDA
Document10 pages
Unit 2 Notes BDA
vasusrivastava138
No ratings yet
Data Science - Glossary
Document12 pages
Data Science - Glossary
kripali sharma
100% (1)
Exam Cloudera CCA175 Title CCA Spark and Hadoop Developer Exam
Document72 pages
Exam Cloudera CCA175 Title CCA Spark and Hadoop Developer Exam
Anu Meldoddi
No ratings yet
Introduction Data Science Programming Handout Set 1A
Document53 pages
Introduction Data Science Programming Handout Set 1A
dinoda6464
No ratings yet
B2. Introduction To Big Data With Spark and Hadoop - Coursera
Document12 pages
B2. Introduction To Big Data With Spark and Hadoop - Coursera
Hafiszan
No ratings yet
Question Paper 21-22
Document97 pages
Question Paper 21-22
Kurikkal Madathil Bushra
No ratings yet
Opinions On Fraud Investigation
Document10 pages
Opinions On Fraud Investigation
burcakkaplan
No ratings yet
CS8091 Big Data Analytics MCQ
Document22 pages
CS8091 Big Data Analytics MCQ
Sowmiya mohan
100% (2)
Experiment No 1
Document13 pages
Experiment No 1
Aman Jain
No ratings yet
The State of The Art of Metadata Managements in Large-Scale Distributed File Systems Scalability Performance and Availability
Document20 pages
The State of The Art of Metadata Managements in Large-Scale Distributed File Systems Scalability Performance and Availability
关nicole
No ratings yet
Big Data With Hadoop - For Data Management, Processing and Storing
Document7 pages
Big Data With Hadoop - For Data Management, Processing and Storing
Yes
No ratings yet
Facebook Distributed System Case Study For Distributed System Inside Facebook Datacenters PDF
Document9 pages
Facebook Distributed System Case Study For Distributed System Inside Facebook Datacenters PDF
minichel
No ratings yet
Dinesh Khanal
Document6 pages
Dinesh Khanal
shubham
No ratings yet
AWS Amazon Interview Question and Answers
Document55 pages
AWS Amazon Interview Question and Answers
Dharmala Chandra Sekhar
0% (1)
Hadoop Plan
Document9 pages
Hadoop Plan
Siddarth Jha
No ratings yet
MBA-DATA ANALYTICS - Data Science and Business Analysis - Unit 5
Document44 pages
MBA-DATA ANALYTICS - Data Science and Business Analysis - Unit 5
Aamir Reza
No ratings yet
Module 1 PDF
Document49 pages
Module 1 PDF
Ajay
No ratings yet
Heterogeneous Log File Analyzer System Using Hadoop Mapreduce Framework
Document4 pages
Heterogeneous Log File Analyzer System Using Hadoop Mapreduce Framework
International Journal of Application or Innovation in Engineering & Management
No ratings yet
Exploiting Dynamic Resource Allocation For Efficient Parallel Data Processing in The Cloud
Document14 pages
Exploiting Dynamic Resource Allocation For Efficient Parallel Data Processing in The Cloud
ieeexploreprojects
No ratings yet
Pankaj
Document3 pages
Pankaj
jeffa123
No ratings yet
7th Sem 1
Document32 pages
7th Sem 1
Noor Islam
No ratings yet
Informatica Big Data For Developers
Document5 pages
Informatica Big Data For Developers
Shakeel Mulla
No ratings yet
h8310 Deploying Pentaho Data Integration Dia
Document29 pages
h8310 Deploying Pentaho Data Integration Dia
Arous Riadh
No ratings yet
Big Data Analytics (2017 Regulation) : Hadoop Distributed File System (HDFS)
Document7 pages
Big Data Analytics (2017 Regulation) : Hadoop Distributed File System (HDFS)
cskinit
No ratings yet
What Is Hadoop
Document162 pages
What Is Hadoop
Rahulsinghoooo
No ratings yet
ML Server
Document2,320 pages
ML Server
Varsha Mishra
No ratings yet