Detection of Outliers: Iglewicz and Hoaglin

Uploaded by

This document discusses the detection and identification of outliers in data. It defines an outlier as an observation that deviates markedly from other observations. Outliers need to be identified for two main reasons: 1) outliers may indicate bad or incorrect data, and 2) outliers could be scientifically interesting observations rather than errors. The document outlines three issues related to outliers: labeling potential outliers, accommodating outliers in statistical analyses, and formally identifying outliers. It focuses on labeling and identifying outliers. Additionally, it notes that outliers should be identified assuming an approximately normal distribution, and normal probability plots, box plots, and histograms can help check this assumption and identify potential outliers.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Detection of Outliers: Iglewicz and Hoaglin

Uploaded by

Joseph Tang

0% found this document useful (0 votes)

102 views2 pages

Original Description:

Stats

Original Title

Comparative3

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

102 views2 pages

Detection of Outliers: Iglewicz and Hoaglin

Uploaded by

Joseph Tang

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

1.3.5.17.

Detection of Outliers
Introduction An outlier is an observation that appears to deviate markedly
from other observations in the sample.

Identification of potential outliers is important for the

following reasons.

1. An outlier may indicate bad data. For example, the

data may have been coded incorrectly or an
experiment may not have been run correctly. If it can
be determined that an outlying point is in fact
erroneous, then the outlying value should be deleted
from the analysis (or corrected if possible).
2. In some cases, it may not be possible to determine if
an outlying point is bad data. Outliers may be due to
random variation or may indicate something
scientifically interesting. In any event, we typically
do not want to simply delete the outlying observation.
However, if the data contains significant outliers, we
may need to consider the use of robust statistical
techniques.

Labeling, Iglewicz and Hoaglin distinguish the three following issues

Accomodation, with regards to outliers.
Identification
1. outlier labeling - flag potential outliers for further
investigation (i.e., are the potential outliers erroneous
data, indicative of an inappropriate distributional
model, and so on).
2. outlier accomodation - use robust statistical
techniques that will not be unduly affected by
outliers. That is, if we cannot determine that potential
outliers are erroneous observations, do we need
modify our statistical analysis to more appropriately
account for these observations?
3. outlier identification - formally test whether
observations are outliers.

This section focuses on the labeling and identification issues.

Normality Identifying an observation as an outlier depends on the

Assumption underlying distribution of the data. In this section, we limit
the discussion to univariate data sets that are assumed to
follow an approximately normal distribution. If the normality
assumption for the data being tested is not valid, then a
determination that there is an outlier may in fact be due to the
non-normality of the data rather than the prescence of an
outlier.

For this reason, it is recommended that you generate

a normal probability plot of the data before applying an
outlier test. Although you can also perform formal tests for
normality, the prescence of one or more outliers may cause
the tests to reject normality when it is in fact a reasonable
assumption for applying the outlier test.

In addition to checking the normality assumption, the lower

and upper tails of the normal probability plot can be a useful
graphical technique for identifying potential outliers. In
particular, the plot can help determine whether we need to
check for a single outlier or whether we need to check for
multiple outliers.

The box plot and the histogram can also be useful graphical
tools in checking the normality assumption and in identifying
potential outliers.

Non-Normality and Outliers1
Document17 pages
Non-Normality and Outliers1
api-159547603
No ratings yet
How To Calculate Outliers
Document7 pages
How To Calculate Outliers
Celina Borillo
No ratings yet
Descriptive Statistics
Document28 pages
Descriptive Statistics
Kaushal Pandey
No ratings yet
Outlier Detection
Document9 pages
Outlier Detection
writetoaris
No ratings yet
Handling Outliers
Document6 pages
Handling Outliers
Muhammad Saood Choudhary
No ratings yet
A Review of Statistical Outlier Methods
Document8 pages
A Review of Statistical Outlier Methods
jljimenez1969
No ratings yet
Anomaly Detection and Outlier Analysis
Document25 pages
Anomaly Detection and Outlier Analysis
mksingh1311
No ratings yet
1outlier - Wikipedia
Document47 pages
1outlier - Wikipedia
jlesalvador
No ratings yet
Jones
Document8 pages
Jones
Marko Crivaro
No ratings yet
Outlier: Occurrence and Causes
Document6 pages
Outlier: Occurrence and Causes
Tangguh Wicaksono
No ratings yet
Data Mining:: Concepts and Techniques
Document13 pages
Data Mining:: Concepts and Techniques
Hasibur Rahman Porag
No ratings yet
Chapter 6 7 Anomaly Fraud Detection Advanced Datamining Application
Document10 pages
Chapter 6 7 Anomaly Fraud Detection Advanced Datamining Application
Niranjan Kumar Das
No ratings yet
12 Outlier
Document55 pages
12 Outlier
Nivedita Bhore
No ratings yet
Anomaly Detection
Document49 pages
Anomaly Detection
Amita Soni
No ratings yet
Outliers
Document4 pages
Outliers
Raina Jessamine Gang
No ratings yet
Unit 5 Exploratory Data Analysis (EDA)
Document41 pages
Unit 5 Exploratory Data Analysis (EDA)
Shamie Singh
100% (1)
Outlier Detection
Document45 pages
Outlier Detection
Vanilla Sky
No ratings yet
Outliers PDF
Document5 pages
Outliers PDF
Rutwik Gandhe
No ratings yet
2009 Data Cleaning
Document8 pages
2009 Data Cleaning
Glory of Billy's Empire Jorton Knight
No ratings yet
Outlier Analysis in Data Mining
Document5 pages
Outlier Analysis in Data Mining
Diksha Gupta
No ratings yet
Data Minning Unit 4-1
Document10 pages
Data Minning Unit 4-1
yadavchilki
No ratings yet
Outlier
Document9 pages
Outlier
keisha555
No ratings yet
Formal Methods of Countering Deception and Misperception in Intelligence Analysis
Document29 pages
Formal Methods of Countering Deception and Misperception in Intelligence Analysis
jupode
No ratings yet
Data Cleaning
Document4 pages
Data Cleaning
namrathameedinti
No ratings yet
On Outliers, Statistical Risks, and A Resampling Approach Towards Statistical Inference
Document14 pages
On Outliers, Statistical Risks, and A Resampling Approach Towards Statistical Inference
Gerda Schlinger
No ratings yet
1preparing Data
Document6 pages
1preparing Data
Ukky
No ratings yet
Missing Data and Multi Imputation
Document5 pages
Missing Data and Multi Imputation
Ju Chang
No ratings yet
CMS 810 Assignment
Document3 pages
CMS 810 Assignment
akinyotudamilola
No ratings yet
Missing and Outlier
Document20 pages
Missing and Outlier
STYX
No ratings yet
Bio Stat Problems 2
Document15 pages
Bio Stat Problems 2
hellocolorpuff
No ratings yet
Answer For Adv Biostatistics
Document26 pages
Answer For Adv Biostatistics
Wakjira Fekadu
No ratings yet
Outliers Intrusion Detection: Anomaly Detection, Also Referred To As Outlier Detection
Document1 page
Outliers Intrusion Detection: Anomaly Detection, Also Referred To As Outlier Detection
123shweta
No ratings yet
Statistical Test Methods For Hypothesis Testing
Document6 pages
Statistical Test Methods For Hypothesis Testing
Vasant bhoknal
No ratings yet
Outliers CW
Document6 pages
Outliers CW
arnoldkomunda
No ratings yet
DataScience Interview Questions
Document66 pages
DataScience Interview Questions
ravi Kiran
100% (1)
Data Science Interview Questions: Answer Here
Document54 pages
Data Science Interview Questions: Answer Here
neeraj12121
No ratings yet
Data Science Interview Questions 1599708768
Document54 pages
Data Science Interview Questions 1599708768
aalto falto
No ratings yet
12 Outlier
Document18 pages
12 Outlier
khang1011121314
No ratings yet
Be A 65 Ads Exp 7
Document7 pages
Be A 65 Ads Exp 7
Ritika dwivedi
No ratings yet
Safari - Feb 29, 2024 at 8:02 AM
Document1 page
Safari - Feb 29, 2024 at 8:02 AM
Vienna Tulauan
No ratings yet
Anomaly Detection in Partical Physics
Document179 pages
Anomaly Detection in Partical Physics
Yannick
No ratings yet
Outlier Detection Techniques
Document56 pages
Outlier Detection Techniques
tony2222
100% (1)
Handling Missing Data
Document23 pages
Handling Missing Data
ssakhare2001
No ratings yet
Statistics in Data Science Interview Questions
Document2 pages
Statistics in Data Science Interview Questions
parbati8984
No ratings yet
DATA ANALYSIS
Document27 pages
DATA ANALYSIS
j.fajardo.350164
No ratings yet
Assignment 1
Document4 pages
Assignment 1
ng boon jane
No ratings yet
Data Mining: Outlier Analysis - Presentation Transcript
Document1 page
Data Mining: Outlier Analysis - Presentation Transcript
annamyem
No ratings yet
BA UNIT-3 - Part 1
Document4 pages
BA UNIT-3 - Part 1
Arunim Yadav
No ratings yet
Chapter 4 Part 2
Document12 pages
Chapter 4 Part 2
Raj
No ratings yet
Unit 5
Document70 pages
Unit 5
Shashwat Mishra
No ratings yet
Midtemr-Data - Mining-Nguyen Tuan Hung - K194141723
Document3 pages
Midtemr-Data - Mining-Nguyen Tuan Hung - K194141723
Tuan Hung
No ratings yet
Data Preprocessing and Cleaning
Document6 pages
Data Preprocessing and Cleaning
dzedziphilly
No ratings yet
5 Ways To Find Outliers in Your Data - Statistics by Jim
Document35 pages
5 Ways To Find Outliers in Your Data - Statistics by Jim
Arindam Chakraborty
No ratings yet
Evaluating Research
Document3 pages
Evaluating Research
Cwen Jazlyn Sumalinog
No ratings yet
Anomoly Detection - Ensemble - Classifiers
Document68 pages
Anomoly Detection - Ensemble - Classifiers
33. Pushkal OJha
No ratings yet
Data Mining:: Concepts and Techniques
Document44 pages
Data Mining:: Concepts and Techniques
Gunik Maliwal
No ratings yet
ASSIGHNMENT No 1
Document11 pages
ASSIGHNMENT No 1
Siddharth Kakani
No ratings yet
1 s2.0 S0957417420300774 Main
Document8 pages
1 s2.0 S0957417420300774 Main
m.ramaki
No ratings yet
ABC of Clinical Reasoning
From Everand
ABC of Clinical Reasoning
Nicola Cooper
No ratings yet
Statistics: Practical Concept of Statistics for Data Scientists
From Everand
Statistics: Practical Concept of Statistics for Data Scientists
John Slavio
No ratings yet
Job Title: Advanced Automation Engineer
Document2 pages
Job Title: Advanced Automation Engineer
Joseph Tang
No ratings yet
Pastor Scotts Israel Trip 2023
Document4 pages
Pastor Scotts Israel Trip 2023
Joseph Tang
No ratings yet
Coulters Candy
Document1 page
Coulters Candy
Joseph Tang
No ratings yet
Quantitative Techniques: Confirmatory Statistics
Document3 pages
Quantitative Techniques: Confirmatory Statistics
Joseph Tang
No ratings yet
Probability Plot Correlation Coefficient Plot
Document2 pages
Probability Plot Correlation Coefficient Plot
Joseph Tang
No ratings yet
How Can I Tell If A Model Fits My Data?: Is Not Enough!
Document2 pages
How Can I Tell If A Model Fits My Data?: Is Not Enough!
Joseph Tang
No ratings yet
What Is Design of Experiments (DOE) ?: Systematic Approach To Data Collection
Document1 page
What Is Design of Experiments (DOE) ?: Systematic Approach To Data Collection
Joseph Tang
No ratings yet
SCM5B38: Strain Gage Input Modules, Narrow Bandwidth
Document2 pages
SCM5B38: Strain Gage Input Modules, Narrow Bandwidth
Joseph Tang
No ratings yet
Short
Document1 page
Short
Joseph Tang
No ratings yet
Short
Document1 page
Short
Joseph Tang
No ratings yet
Short
Document1 page
Short
Joseph Tang
No ratings yet
Basics of Research Paper Writing and Publishing
Document18 pages
Basics of Research Paper Writing and Publishing
Ali Hussain Kazim
100% (2)
Youth Part. Urban Agriculture
Document31 pages
Youth Part. Urban Agriculture
Shera Lopez
No ratings yet
Caribbean Studies IA
Document39 pages
Caribbean Studies IA
jaheimwilliams1990
No ratings yet
Science: Biology, Chemistry and Physics
Document17 pages
Science: Biology, Chemistry and Physics
Welly Boss Hwi
No ratings yet
Identity, Gee
Document28 pages
Identity, Gee
anon_421547066
No ratings yet
Self Check 2.1
Document2 pages
Self Check 2.1
Emelson Vertucio
No ratings yet
DELOITTE DI CIO CIO Insider Maximizing The Impact of Tech Investments in The New Normal
Document20 pages
DELOITTE DI CIO CIO Insider Maximizing The Impact of Tech Investments in The New Normal
Luis Paulo Senra Huber
No ratings yet
Eden Env. Epid Exam-2
Document9 pages
Eden Env. Epid Exam-2
kalasa royd
100% (5)
Evaluating Sources: Lesson
Document4 pages
Evaluating Sources: Lesson
ROSE ANN SAGUROT
No ratings yet
341-Forest Cover Type Prediction
Document5 pages
341-Forest Cover Type Prediction
Hyped Splatoon
No ratings yet
s3 Eapp Summarize and Execute
Document17 pages
s3 Eapp Summarize and Execute
Mariel Ferrer
No ratings yet
Hybrid Cars Final Report
Document36 pages
Hybrid Cars Final Report
Sambeet Mohapatra
No ratings yet
Za Šta Se Koristi Analiza Ebar
Document2 pages
Za Šta Se Koristi Analiza Ebar
Maksim Plebejac
No ratings yet
Writing A Review Article: A Graduate Level Writing Class: Omotola O. Ogunsolu, Jamie C. Wang, and Kenneth Hanson
Document7 pages
Writing A Review Article: A Graduate Level Writing Class: Omotola O. Ogunsolu, Jamie C. Wang, and Kenneth Hanson
Mariuxi León Molina
No ratings yet
10Mpm-151 Applied Probability and Statistics
Document4 pages
10Mpm-151 Applied Probability and Statistics
Dandally Roopa
No ratings yet
Media Messages Surrounding Missing Women and Girls The Missing White Woman Syndrome and Other Factors That Influence Newsworthiness
Document23 pages
Media Messages Surrounding Missing Women and Girls The Missing White Woman Syndrome and Other Factors That Influence Newsworthiness
silviahuesos
No ratings yet
Advanced Technology Integration in Food
Document7 pages
Advanced Technology Integration in Food
PRO Tradesman
No ratings yet
HMW 2
Document5 pages
HMW 2
enes üstün
No ratings yet
DSSDI Case Study v1.0
Document15 pages
DSSDI Case Study v1.0
diptilundia
No ratings yet
Chap 010
Document47 pages
Chap 010
kd9h9tby57
No ratings yet
Essays On Decision Making
Document6 pages
Essays On Decision Making
afabilalf
100% (2)
Manajemen Aset Daerah Kota Pekanbaru (Studi Kasus Mobil Dinas) Oleh: Nike Ima Elia Limbong Pembimbing: Dr. Febri Yuliani, S.Sos, M.Si
Document14 pages
Manajemen Aset Daerah Kota Pekanbaru (Studi Kasus Mobil Dinas) Oleh: Nike Ima Elia Limbong Pembimbing: Dr. Febri Yuliani, S.Sos, M.Si
Wiby Lay
No ratings yet
2021 - Claim, Evidence and Reasoning in The Science Classroom
Document75 pages
2021 - Claim, Evidence and Reasoning in The Science Classroom
2023leestai
No ratings yet
Fs 402 Portfolio: Participation and Teaching Internship
Document119 pages
Fs 402 Portfolio: Participation and Teaching Internship
PALCULIO JARED PRINCE
No ratings yet
BRM - L4,5 - Linear Regression
Document113 pages
BRM - L4,5 - Linear Regression
NusratJahanHeaba
No ratings yet
Introduction To Business Analytics: Alka Vaidya Nibm
Document41 pages
Introduction To Business Analytics: Alka Vaidya Nibm
Prabhat Singh
100% (1)
13 Resident Mammals v. Sec. Reyes
Document4 pages
13 Resident Mammals v. Sec. Reyes
Al Jay Mejos
100% (2)
Evaluation of AstraZeneca PLC Company Essay
Document9 pages
Evaluation of AstraZeneca PLC Company Essay
Devika Jagroop
No ratings yet
Week 2: CEF & OLS: Dan Yavorsky
Document41 pages
Week 2: CEF & OLS: Dan Yavorsky
Malik Mahad
No ratings yet
Effective Practices For Developing Reading Comprehension: January 2002
Document39 pages
Effective Practices For Developing Reading Comprehension: January 2002
Abigail Mabborang
No ratings yet