R Tema1

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 27

R Orientado a Objetos

Lenguaje R
R es un potente lenguaje orientado a objetos y destinado al análisis estadístico y la
representación de datos.
R, también conocido como ”GNU S”, es un entorno y un lenguaje para el cálculo
estadístico y la generación de gráficos. R implementa un dialecto del premiado
lenguaje S, desarrollado en los Laboratorios Bell por el profesor John M.Chambers y
su equipo en la Universidad de Stanford.

fue inicialmente diseñado por Robert Gentleman


y Ross Ihaka, miembros del Departamento de
Estadístíca de la Universidad de Auckland, en
Nueva Zelanda.
Lenguaje R
• Es libre. Se distribuye bajo licencia GNU - GPL,
lo cual significa que lo puedes utilizar y
¡mejorar!
• Es multiplataforma, hay versiones para Linux,
Windows, Mac, iPhone… ¡web!
• Se puede analizar en R cualquier tipo de datos.
• Es muy potente.
• Su capacidad gráfica difícilmente es superada
por otro paquete estadístico.
R en Rcommander
R y Rstudio
Instalación de R y Rstudio
La instalación es diferente para cada sistema operativo.
Para descargar R, lo haremos desde CRAN, un conjunto
de servidores espejo distribuidos a lo largo del mundo y
usado para distribuir R y paquetes R. https://cran.r-
project.org/

RStudio es un entorno integrado de desarrollo, o IDE,


para facilitarnos la tarea de programación.
http://www.rstudio.com/download.
Interface de Rstudio
Interface de Rstudio: Consola
Escribir dato en el prompt > CTRL + L limpiar consola
Ejem:
“estudiante” + ENTER
45 + Enter

R como calculadora
1+2 #suma
20*3 #multiplicacion
50/9 #division
9-5 #resta
10%%3 #modulo
10%/%3 #coeficiente
9^3 #potencia
¿Qué son los datos?
Un dato, es un valor que pertenece a un tipo de dato y que por lo regular debe
estar contenida en una variable.
Una variable es una propiedad o característica de un individuo que puede variar
su valor y que contiene un dato: color de ojos, estado civil, estura, edad.
Carlos Matematicas Ciencias Espanol Historia EdFisica
Una colección de variables 6.3 6.4 8.2 9 7.2
permiten describir un individuo Maria 6.8 7.2 8.7 9 7
Andres 6 6 7.8 8.9 7.3
(entidad, objeto, registro, caso, Lucia 7 6.5 9.2 8.6 8
una observación) Ines 7.6 9.2 8 8 7.5
Ana 7.8 9.6 7.7 8 6.5
El conjunto de observaciones Jose 7.9 9.7 7.5 8 6
puede ser una tabla o una base de Pedro 7.5 9.4 7.3 7 7
Luis 5 6.5 6.5 7 9
datos, que es necesario para hacer Sonia 6 6 6.5 5.5 8.7
análisis de datos. Carlos 6.3 6.4 8.2 9 7.2
Los datos y sus tipos
R maneja 6 tipos de datos básicos:
• character (cadenas de caracteres)
• Numeric / double (números reales)
• integer (números enteros)
• complex (números complejos)
• logical (lógicos o booleanos, que sólo toman los valores True o False)
• factor (categórico)

Utilizar documento de script .R


Variables en R
Una variable es una propiedad o característica de un individuo que puede variar
su valor y que contiene un dato.
En R hay tres formas de asignar una variable.
Variable = valor
Variable -> valor
Variable <- valor

Tres formatos para escribir variables


CamelCase ejem: PoblacionEstudiantes
Snake_case ejem: Poblacion_Estudiantes
Point.case ejem: Poblacion.Estudiantes
Variables en R
Para imprimir en consola:
PoblacionEstudiantes Tecla Enter
Comandos:
print(variable) Tecla Enter # comentario

ls() lista las variables almacenadas


Imprimir en Documento script rm(variable) borra variable
Colocar cursor al final de la lineal a imprimir, rm(variable1, variable2) borrar variables
rm(ls()) borrar todas las variables
seleccionar líneas a imprimir (Botón RUN) dir() listar documentos de directorio
typeof(variable) verificar tipo de variable

Colocar cursor al final de la lineal a imprimir,


seleccionar líneas a imprimir (ctrl + enter)
Practica de Variables en R
Crear variables

Comandos:
nom<-"danny" # comentario
ape <- "murillo" ls() lista las variables almacenadas
es <- 1.80 rm(variable) borra variable
rm(variable1, variable2) borrar variables
ind<-2.50 dir() listar documentos de directorio
typeof(variable) verificar tipo de variable
N1<-80 data() datasets intalados en R
N2<-90
Bo1<- TRUE
Bo2 <- T
OPERADORES

EJEMPLO OPERADORES :
ind>es
N1>N2
Bo1==Bo2
Bo2!=ind
Estructuras de datos en R
Las colecciones o conjunto de datos en R se organizan por su dimensión (1, 2, o
varias dimensiones) y si son homogéneas (todos los objetos deben ser del mismo
tipo) o heterogéneas ( el contenido puede ser de diferentes tipos).
A continuación mostramos los cinco tipos de datos más usados en el análisis
de datos:

Homogénea Heterogénea
1 Vector atómico Lista
2 Matriz Data frame
n Array
Estructuras de datos en R : VECTOR
El tipo más básico de estructura de dato en R es el vector. El vector es una
estructura compuesta de un número de elementos finitos, homogéneos y donde
dicha estructura tiene un tamaño fijo.

El uso de la función c() para crear vector atómico, que corresponde a la


sigla de combinar:
c(4,2,-8)
!"#$%&'()* #+',(-./,(0./1
num<-1:10 #numero del 1 al 10 num<-1:10*3
#números del 1 al 10 multiplicado por 3
num<- 2"3+4,('51((6(7827%("9"#$%(3:"(4;'5(
num<- 2"3+',('5,(<= >(41((62?@$?AB%(B"(4("A(4
Ejemplo: VECTOR
matematicas <- c(45,70,85,100,1000) #crear vector
#seleccionar posición 5
matematicas[5]
#seleccionar posición del 3 al 5
matematicas[3:5]
#seleccionar todos los valores, menos el que esta en la posición 2
matematicas[-2]
#sumar dos valores de un vector
matematicas[1] + matematicas[2]
#restar dos valores de un vector
matematicas[3] - matematicas[4]
#multiplicar dos valores de un vector
matematicas[3] * matematicas[5]
#multiplicar todos los valores de un vector por 2
matematicas * 2
COERCION
COERCIÓN
La coerción es una característica de los lenguajes de programación que permite, implícita o explícitamente,
convertir un elemento de un tipo de datos en otro, sin tener en cuenta la comprobación de tipos.
v <- c(1, 2, 3, 4, 5) Coerción Implícita
typeof(v)
class(v)
Tipo Comprobación Coerción (explicita)
array `is.array()` `as.array()`
character `is.character()` `as.character()`
complex `is.complex()` `as.complex()`
double `is.double()` `as.double()`
factor `is.factor()` `as.factor()`
integer `is.integer()` `as.integer()`
list `is.list()` `as.list()`
logical `is.logical()` `as.logical()`
matrix `is.matrix()` `as.matrix()`
NA `is.na()` `as.na()`
NaN `is.nan()` `as.nan()`
NULL ` is.null()` `as.null()`
numeric `is.numeric()` `as.numeric()`
vector `is.vector()` `as.vector()`
RCONCEPTOS Y FUNCIONES
Funciones en R
FUNCIONES DE ESTADISTICAS (mediana, media, moda)
Ejemplo:
#crear vector
data <- c(-58,46,28,69,22,18,18,42,62,78,18,210)
#conocer tamaño de un vector
length(data)

# sumar datos de un
vector sum(data)
#calculo de la media
sum(data) / length(data)

#funciones estadísticas
#calculo de la media
mean(data)
FUNCIONES DE ESTADISTICAS
Ejemplo:
#calculo de la mediana
median(data)

#calculo de la moda
#valor que mas se repite
datamoda<- table(data)

#ordenar vector para colocar el valor con más frecuencia al


inicio datamodaSort <- sort(datamoda, decreasing = TRUE)

#moda valor de mayor frecuencia , posición 1 del vector


ordenado moda <- datamodaSort[1]

También podría gustarte