VeBieuDo-21.08.21 - Ngo Thi Thang Nga
VeBieuDo-21.08.21 - Ngo Thi Thang Nga
VeBieuDo-21.08.21 - Ngo Thi Thang Nga
21/08/2021
head(iris)
##
## setosa versicolor virginica
## 50 50 50
attach(iris)
table(Species)
## Species
## setosa versicolor virginica
## 50 50 50
par(mfrow=c(1,2))
barplot(table(Species))
pie(table(Species))
Vẽ biểu đồ histogram
names(iris)
hist(Sepal.Length)
hist(Sepal.Length[Species=='setosa'])
hist(Sepal.Length[Species=='versicolor'])
hist(Sepal.Length[Species=='virginica'])
#Vẽ
biểu đồ hộp
boxplot(Sepal.Length)
boxplot(Sepal.Length~Species)
Biểu đồ tán xạ
plot(Sepal.Length)
plot(Sepal.Length,Sepal.Width)
plot(Sepal.Length[Species=='setosa'],Sepal.Width[Species=='setosa'])
Dữ liệu đặc biệt kiểu .table
library(datasets)
Titanic
Titanic.df=as.data.frame(Titanic)
Titanic.df
attach(Titanic.df)
sum(Freq[Class=="1st"])
## [1] 325
sum(Freq[Class=="1st"&Survived=='Yes'])
## [1] 203
2. Mô phỏng dữ liệu
Phân phối nhị thức
set.seed(19)
x<- rbinom(100, 20, 0.5)
hist(x,xlim=c(0,20))
# Phân
phối Poisson
x <- rpois(100, lambda=15)
hist(x)
# Phân
phối mũ
x<- rexp(150, 0.1)
par(mfrow=c(1,2))
hist(x)
curve(dexp(x,10))
#Phân
phối Chi bình phương
curve(dchisq(x, 1), xlim=c(0,10), ylim=c(0,0.6), col="red", lwd=3)
curve(dchisq(x, 2), add=T, col="green", lwd=3)
curve(dchisq(x, 3), add=T, col="blue", lwd=3)
curve(dchisq(x, 5), add=T, col="orange", lwd=3)
abline(h=0, lty=3)
legend(par("usr")[2], par("usr")[4],
xjust=1,
c("df=1", "df=2", "df=3", "df=5"), lwd=3, lty=1,
col=c("red", "green", "blue", "orange"))
# Phân
phối Student
curve(dt(x, 1), xlim=c(-3,3), ylim=c(0,0.4), col="red", lwd=3)
curve(dt(x, 2), add=T, col="blue", lwd=3)
curve(dt(x, 5), add=T, col="green", lwd=3)
curve(dt(x, 10), add=T, col="orange", lwd=3)
curve(dnorm(x), add=T, lwd=4, lty=3)
title(main="Student T distributions")
legend(par("usr")[2], par("usr")[4],xjust=0.9,
c("df=1", "df=2", "df=5", "df=10", "Std.norm."),
lwd=c(2,2,2,2,2),
lty=c(1,1,1,1,3),
col=c("red", "blue", "green", "orange", par("fg")))
#Phân
phối Fisher
curve(df(x,1,1), xlim=c(0,2), ylim=c(0,0.8), lwd=3)
curve(df(x,3,1), add=T)
curve(df(x,6,1), add=T, lwd=3)
curve(df(x,3,3), add=T, col="red")
curve(df(x,6,3), add=T, col="red", lwd=3)
curve(df(x,3,6), add=T, col="blue")
curve(df(x,6,6), add=T, col="blue", lwd=3)
title(main="Fisher F distributions")
legend(par("usr")[2], par("usr")[4],
xjust=1,
c("df=1,1", "df=3,1", "df=6,1", "df=3,3", "df=6,3",
"df=3,6", "df=6,6"),
lwd=c(1,1,3,1,3,1,3),
lty=c(2,1,1,1,1,1,1),
col=c(par("fg"), par("fg"), par("fg"), "red", "blue", "blue"))
#Dùng
biểu đồ Q-Q plot so sánh sự tương đồng giữa các phân phối
#hai phân phối chuẩn
x=rnorm(1000,12,1)
y=rnorm(1000,12,1)
qqplot(x,y)
#PP
chuẩn, PP đều
x=runif(1000,12,111)
y=rnorm(1000,12,1)
qqplot(x,y)
qqnorm(x)
qqnorm(y)