Welcome to Scribd!

0% found this document useful (0 votes)

56 views

COMP 5310: Principles of Data Science: Heart Disease UCI

Uploaded by

Umaira Sajjad

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

COMP 5310: Principles of Data Science: Heart Disease UCI

Uploaded by

Umaira Sajjad

0% found this document useful (0 votes)

56 views9 pages

Original Title

Presentation_PDS_mels6088_usaj8459.pptx

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

56 views9 pages

COMP 5310: Principles of Data Science: Heart Disease UCI

Uploaded by

Umaira Sajjad

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 9

Search inside document

COMP 5310: Principles of

Data Science

Heart Disease UCI

Presented by
Maha Sulaeman El-Shahawy
(Unikey : mels6088)

Umaira Uzma Sajjad

(Unikey : usaj8459)

The University of Sydney Page 1

Contents

Setup Model Evaluation

– Hypothesis – Classification Report
– Exploratory Data Analysis – ROC curve
– Generalization/Training
Approach curves
– Preprocessing Statistical Testing
– Hyperparameter Tuning – Between Models
– Modeling – Hypothesis Testing

The University of Sydney Page 2

Setup
Null Hypothesis (H0):
Heart disease cannot be predicted using the features
(demographics, health factors, medical results)
Exploratory Data Analysis

Table 2: Pearson Figure 1: Heart disease starts at a lower

Table 1: Heart Disease Data Set; 303 instances and 14 columns (13 features, 1 Target) Correlation and p-value age (late 30s) for men compared to
women (early 50s)

The University of Sydney Page 3

Approach
Preprocessing
– 6 missing values: SimpleImputer (mean of each feature)
– Normalisation: StandardScalar (by mean); Integer-Encoding
– PCA : > 90% variance at 10 components
Tuning
– Gridsearch ( PCA components >= 10, model parameters)
– Test and Training data (20 : 80)
– Cross validation of 10 folds

The University of Sydney Page 4

Approach
Modeling
– Pipelines
– Supervised classification algorithms

Table 2: Results of considered models. Times are taken on an Intel® core™ i7-4700 HQ @2.4 GHZ processor and 16 GB RAM

The University of Sydney Page 5

Model Evaluations

Classification Report Confusion Matrix

Figure 2: SVM Classification Report on test data

Figure 4: SVM confusion

matrix on test data

Figure 3: Naïve Bayes Classification Report on test data Figure 5: NB confusion matrix
on test data

The University of Sydney Page 6

Model Evaluations

Training Size vs Error Rates Complexity vs Error Rates

Figure 6: Learning curve of SVM
train sizes with accuracy using
bootstrap train/development data

Figure 7: Learning curve of NB

train sizes with accuracy using Figure 8: Validation curve of SVM complexity with
bootstrap train-development data accuracy using bootstrap train-development data

The University of Sydney Page 7

Statistical Testing (α = 0.01)

Between Models Hypothesis Testing

Hypothesis: the two algorithms Mann Whitley U-test
should have the same error rate – p-value = 0.035

Test p-value
McNemar’s test 1.00
Paired T-test 0.10

Result : p-value > α. Weak evidence against the null hypothesis

The University of Sydney Page 8
Thank you

The University of Sydney Page 9

Ebook PDF Introductory Statistics Using Spss 2Nd Edition Ebook PDF Full Chapter
Document61 pages
Ebook PDF Introductory Statistics Using Spss 2Nd Edition Ebook PDF Full Chapter
aaron.langan431
100% (34)
Question Bank - Machine Learning (Repaired)
Document78 pages
Question Bank - Machine Learning (Repaired)
Sarah Knight
No ratings yet
Shanin DOE - Six Sigma
Document7 pages
Shanin DOE - Six Sigma
Bennett Matthews
100% (1)
EUC1502 Module2 Machine Learning
Document32 pages
EUC1502 Module2 Machine Learning
Радомир Мутабџија
No ratings yet
DSA Module 3
Document30 pages
DSA Module 3
gaganad.21.beai
No ratings yet
Xchapter 1
Document31 pages
Xchapter 1
Adharsh Rajeev Dfc
No ratings yet
QEM-1004 Basic Statistics For Process Control
Document6 pages
QEM-1004 Basic Statistics For Process Control
akhil kv
No ratings yet
Chartered Data Scientists Curriculum 2023 - 2
Document4 pages
Chartered Data Scientists Curriculum 2023 - 2
faizeendb
No ratings yet
Heart Attack Prediction Using Machine Learning
Document10 pages
Heart Attack Prediction Using Machine Learning
suchetkapoor0
No ratings yet
Predictive Modelling Report
Document13 pages
Predictive Modelling Report
akshaypankar907
No ratings yet
Prediction of Diabetes Using Machine Learning Techniques
Document10 pages
Prediction of Diabetes Using Machine Learning Techniques
bjagan15062006
No ratings yet
1.icicv2020-103 PPT
Document19 pages
1.icicv2020-103 PPT
Manoj hv
No ratings yet
Breast Cancer Detection and Prediction: Created by
Document20 pages
Breast Cancer Detection and Prediction: Created by
Get Out
No ratings yet
Vasu Gupta, Sharan Srinivasan, Sneha Kudli, Prediction and Classification of Cardiac Arrhythmia
Document5 pages
Vasu Gupta, Sharan Srinivasan, Sneha Kudli, Prediction and Classification of Cardiac Arrhythmia
jose vega
No ratings yet
Course Outline Mphil 2018-19 Fall Course Title: Statistics For Research-I By: Prof. Vikash Raj Satyal, PHD (Email, Cell 9841-413453)
Document4 pages
Course Outline Mphil 2018-19 Fall Course Title: Statistics For Research-I By: Prof. Vikash Raj Satyal, PHD (Email, Cell 9841-413453)
whatever152207
No ratings yet
Medical Statistics from Scratch: An Introduction for Health Professionals
From Everand
Medical Statistics from Scratch: An Introduction for Health Professionals
David Bowers
No ratings yet
Aditya Predictive
Document12 pages
Aditya Predictive
adityasah895
No ratings yet
K Fold
Document25 pages
K Fold
Dhvanil
No ratings yet
Bias in Error Estimation When Using Cross-Validation For Model Selection." BMC Bioinformatics, 7 (1), 91
Document9 pages
Bias in Error Estimation When Using Cross-Validation For Model Selection." BMC Bioinformatics, 7 (1), 91
sterepavel
No ratings yet
25309-Article Text-29372-1-2-20230626
Document8 pages
25309-Article Text-29372-1-2-20230626
Munib Mesinovic
No ratings yet
Data Mining - Weka 3.6.0
Document5 pages
Data Mining - Weka 3.6.0
Navee Jayakody
No ratings yet
tmpDE5E TMP
Document10 pages
tmpDE5E TMP
Frontiers
No ratings yet
27 ShivangiSrivastava ML Lab
Document52 pages
27 ShivangiSrivastava ML Lab
Mukul Mahawar
No ratings yet
Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Khoa Học Tự Nhiên Khoa Công Nghệ Thông Tin Bộ Môn Công Nghệ Tri Thức
Document9 pages
Đại Học Quốc Gia Thành Phố Hồ Chí Minh Trường Đại Học Khoa Học Tự Nhiên Khoa Công Nghệ Thông Tin Bộ Môn Công Nghệ Tri Thức
Trần Đình Khang
No ratings yet
A Data-Centric Approach For Training Deep Neural
Document5 pages
A Data-Centric Approach For Training Deep Neural
sachinwickramasinghe97
No ratings yet
Classification Model Evaluation Metrics: Željko Đ. Vujović
Document8 pages
Classification Model Evaluation Metrics: Željko Đ. Vujović
sherlock holmes
No ratings yet
Incerteza de Medicao Com Uso de Rede Neural e Monte Carlo
Document17 pages
Incerteza de Medicao Com Uso de Rede Neural e Monte Carlo
0511018
No ratings yet
6 Different Ways To Compensate For Missing Values in A Dataset (Data Imputation With Examples) - by Will Badr - Towards Data Science
Document10 pages
6 Different Ways To Compensate For Missing Values in A Dataset (Data Imputation With Examples) - by Will Badr - Towards Data Science
zero
No ratings yet
Week7-Inferentionalstat - (Grup Differences)
Document32 pages
Week7-Inferentionalstat - (Grup Differences)
düşünennur
No ratings yet
AI Technical
Document7 pages
AI Technical
yehona7698
No ratings yet
Individual Project
Document6 pages
Individual Project
david.lindah
No ratings yet
Course-Syllabus Biz-Statistics Mar2024
Document6 pages
Course-Syllabus Biz-Statistics Mar2024
HunHan Luv
No ratings yet
A1388404476 - 64039 - 23 - 2023 - Machine Learning II
Document10 pages
A1388404476 - 64039 - 23 - 2023 - Machine Learning II
raj241299
No ratings yet
Chartered Data Scientists Curriculum 2020 PDF
Document4 pages
Chartered Data Scientists Curriculum 2020 PDF
Rohit Roy
No ratings yet
Chen Scoring Your Prediction On Unseen Data CVPRW 2023 Paper
Document10 pages
Chen Scoring Your Prediction On Unseen Data CVPRW 2023 Paper
Tony munene
No ratings yet
Calculating Confidence Intervals For Prediction Error in Microarray Classification Using Resampling
Document22 pages
Calculating Confidence Intervals For Prediction Error in Microarray Classification Using Resampling
Hannah Kümpel
No ratings yet
Cross-Validation: What Does It Estimate and How Well Does It Do It?
Document36 pages
Cross-Validation: What Does It Estimate and How Well Does It Do It?
Mariella Bogoni
No ratings yet
Guidelines For Modelling
Document8 pages
Guidelines For Modelling
Ellango Arasar
No ratings yet
3 - Measure
Document39 pages
3 - Measure
dhruvil shah
No ratings yet
IJERTpaper
Document6 pages
IJERTpaper
ravinder
No ratings yet
Pavani
Document4 pages
Pavani
polipallipavani54
No ratings yet
MaWinPaPaMayPhyoAung - First Seminar
Document21 pages
MaWinPaPaMayPhyoAung - First Seminar
Dr. Myat Mon Kyaw
No ratings yet
Applying A Random Projection Algorithm To Optimize Machine Learning Model For Breast Lesion Classification
Document12 pages
Applying A Random Projection Algorithm To Optimize Machine Learning Model For Breast Lesion Classification
padmajakamaraj
No ratings yet
Statistical Methods in Epidemiology
Document109 pages
Statistical Methods in Epidemiology
OLIVIER
No ratings yet
Effectiveness of Deep Learning Models For Covid-19 Detection
Document6 pages
Effectiveness of Deep Learning Models For Covid-19 Detection
Aparna Menon
No ratings yet
Data Science Program With SONAR Data
Document11 pages
Data Science Program With SONAR Data
Swapnil Saurav
No ratings yet
Business Statistics 2023-25
Document4 pages
Business Statistics 2023-25
akshaymatey007
No ratings yet
(IJCST-V12I3P13) :thachayani M, Chaitanya Sai Jangam, Kalyan T, SriManjunadh Maddukuri, Sangadi Manikanta
Document4 pages
(IJCST-V12I3P13) :thachayani M, Chaitanya Sai Jangam, Kalyan T, SriManjunadh Maddukuri, Sangadi Manikanta
editor1ijcst
No ratings yet
Resampling Methods
Document15 pages
Resampling Methods
Yojjhansen Omar Varela
No ratings yet
Unit Iii ML
Document13 pages
Unit Iii ML
a61242908
No ratings yet
Cross-Validation: What Does It Estimate and How Well Does It Do It?
Document43 pages
Cross-Validation: What Does It Estimate and How Well Does It Do It?
Lisandro Levstein
No ratings yet
Class Assignment On Decision Trees
Document6 pages
Class Assignment On Decision Trees
mohammed.ansari
No ratings yet
BIBA Enhancing Heart Disease Prediction With A Hybrid Model Combining Decision Tree, Logistic Regres
Document12 pages
BIBA Enhancing Heart Disease Prediction With A Hybrid Model Combining Decision Tree, Logistic Regres
Nura Muhammad
No ratings yet
Analysis of K-Fold Cross-Validation Over Hold-Out
Document6 pages
Analysis of K-Fold Cross-Validation Over Hold-Out
way
No ratings yet
Applications of Machine Learning Techniques To Predict Diagnostic Breast Cancer
Document11 pages
Applications of Machine Learning Techniques To Predict Diagnostic Breast Cancer
Akashi Dogey
No ratings yet
PGP-AIML Curriculum - Great Lakes
Document43 pages
PGP-AIML Curriculum - Great Lakes
Arnab
No ratings yet
Lecture 5 Evaluation_Classifer
Document61 pages
Lecture 5 Evaluation_Classifer
ujjawaltomar77
No ratings yet
Assessing Reliability and Challenges of Uncertainty Estimations For Medical Image Segmentation
Document9 pages
Assessing Reliability and Challenges of Uncertainty Estimations For Medical Image Segmentation
viveknsoren
No ratings yet
Model Cross Validation
Document11 pages
Model Cross Validation
aryf TJ
No ratings yet
Comparison of Artificial Neural Network and Bayesian Belief Network in Computer-Assisted Diagnosis Scheme For Mammography
Document5 pages
Comparison of Artificial Neural Network and Bayesian Belief Network in Computer-Assisted Diagnosis Scheme For Mammography
Uma Glorious
No ratings yet
Fairness and Machine Learning: Limitations and Opportunities
From Everand
Fairness and Machine Learning: Limitations and Opportunities
Solon Barocas
No ratings yet
Python: Advanced Predictive Analytics: Gain practical insights by exploiting data in your business to build advanced predictive modeling applications
From Everand
Python: Advanced Predictive Analytics: Gain practical insights by exploiting data in your business to build advanced predictive modeling applications
Kumar Ashish
No ratings yet
Clustering For Big Data Analytics
Document28 pages
Clustering For Big Data Analytics
hakona
No ratings yet
Placement Brochure of SPH SRM University
Document59 pages
Placement Brochure of SPH SRM University
Shobhit
No ratings yet
B.sc. Computer Science
Document60 pages
B.sc. Computer Science
ponns
0% (2)
Gradistat
Document29 pages
Gradistat
Anonymous 8mJaN6op
No ratings yet
96-Article Text-697-1-10-20210202
Document15 pages
96-Article Text-697-1-10-20210202
Satriyo Ramadhani
No ratings yet
Feature Engineering: Short Study: Indian Institute of Space Science and Technology, Department of Mathematics
Document6 pages
Feature Engineering: Short Study: Indian Institute of Space Science and Technology, Department of Mathematics
goci
No ratings yet
Infrastructure Construction and Management Syllabus PDF Format
Document52 pages
Infrastructure Construction and Management Syllabus PDF Format
harsha s
No ratings yet
Public Sector Reform in Central Asia and The Caucasus
Document12 pages
Public Sector Reform in Central Asia and The Caucasus
Manivannan M.B
No ratings yet
Agricolae PDF
Document118 pages
Agricolae PDF
EdwArt ApaMa
No ratings yet
Chapter6 Dig Random Proc
Document23 pages
Chapter6 Dig Random Proc
Uttaran Dutta
No ratings yet
Decision Making in Business Using Quantitative Methods
Document1 page
Decision Making in Business Using Quantitative Methods
Manoj Sharma
No ratings yet
Chapter 4: Displaying Quantitative Data
Document27 pages
Chapter 4: Displaying Quantitative Data
gagakaka
No ratings yet
Solution For in Class Assignment MCQ and 15-25 and 15-26
Document2 pages
Solution For in Class Assignment MCQ and 15-25 and 15-26
Sagita Rajagukguk
No ratings yet
Medical Statistics Exersice 1
Document6 pages
Medical Statistics Exersice 1
Нурпери Нуралиева
No ratings yet
BUS 308 Weeks 1
Document43 pages
BUS 308 Weeks 1
menefiem
No ratings yet
Created By: Kuya Jovert
Document34 pages
Created By: Kuya Jovert
Jeszie Llurag
100% (1)
Econometrics Books: Books On-Line Books / Notes
Document8 pages
Econometrics Books: Books On-Line Books / Notes
aftab20
100% (1)
Lipsey&Cullen - The Effectiveness of Correctional Rehabilitation
Document44 pages
Lipsey&Cullen - The Effectiveness of Correctional Rehabilitation
ishantimalsina
No ratings yet
Notched and Variable Width Box-Plots
Document16 pages
Notched and Variable Width Box-Plots
ASClabISB
No ratings yet
The Role of Entrepreneurship in Economic Development of Nigerian
Document11 pages
The Role of Entrepreneurship in Economic Development of Nigerian
AJHSSR Journal
No ratings yet
Credential Evaluation Report - World Education Services
Document4 pages
Credential Evaluation Report - World Education Services
olarewajuisraelolabode
No ratings yet
4.1 DISCRETE VARIABLE With KEY
Document27 pages
4.1 DISCRETE VARIABLE With KEY
asif Mehmood
No ratings yet
Time Series With EViews PDF
Document37 pages
Time Series With EViews PDF
ashishankur
No ratings yet
Fundamentals of Statistics I - Lecture Notes
Document77 pages
Fundamentals of Statistics I - Lecture Notes
Hakim Ali Khan
No ratings yet
Notification Janakpuri Super Speciality Hospital Nursing Officer Other Posts
Document27 pages
Notification Janakpuri Super Speciality Hospital Nursing Officer Other Posts
Monika
No ratings yet
Experiment 10
Document4 pages
Experiment 10
Ananya Kumari
No ratings yet
2 - Kumar Et Al. (2014) (JSDC)
Document11 pages
2 - Kumar Et Al. (2014) (JSDC)
Dr. Ajay K. Singh
No ratings yet
Formulas
Document8 pages
Formulas
ramboram10
No ratings yet