R Tema1
R Tema1
R Tema1
Lenguaje R
R es un potente lenguaje orientado a objetos y destinado al análisis estadístico y la
representación de datos.
R, también conocido como ”GNU S”, es un entorno y un lenguaje para el cálculo
estadístico y la generación de gráficos. R implementa un dialecto del premiado
lenguaje S, desarrollado en los Laboratorios Bell por el profesor John M.Chambers y
su equipo en la Universidad de Stanford.
R como calculadora
1+2 #suma
20*3 #multiplicacion
50/9 #division
9-5 #resta
10%%3 #modulo
10%/%3 #coeficiente
9^3 #potencia
¿Qué son los datos?
Un dato, es un valor que pertenece a un tipo de dato y que por lo regular debe
estar contenida en una variable.
Una variable es una propiedad o característica de un individuo que puede variar
su valor y que contiene un dato: color de ojos, estado civil, estura, edad.
Carlos Matematicas Ciencias Espanol Historia EdFisica
Una colección de variables 6.3 6.4 8.2 9 7.2
permiten describir un individuo Maria 6.8 7.2 8.7 9 7
Andres 6 6 7.8 8.9 7.3
(entidad, objeto, registro, caso, Lucia 7 6.5 9.2 8.6 8
una observación) Ines 7.6 9.2 8 8 7.5
Ana 7.8 9.6 7.7 8 6.5
El conjunto de observaciones Jose 7.9 9.7 7.5 8 6
puede ser una tabla o una base de Pedro 7.5 9.4 7.3 7 7
Luis 5 6.5 6.5 7 9
datos, que es necesario para hacer Sonia 6 6 6.5 5.5 8.7
análisis de datos. Carlos 6.3 6.4 8.2 9 7.2
Los datos y sus tipos
R maneja 6 tipos de datos básicos:
• character (cadenas de caracteres)
• Numeric / double (números reales)
• integer (números enteros)
• complex (números complejos)
• logical (lógicos o booleanos, que sólo toman los valores True o False)
• factor (categórico)
Comandos:
nom<-"danny" # comentario
ape <- "murillo" ls() lista las variables almacenadas
es <- 1.80 rm(variable) borra variable
rm(variable1, variable2) borrar variables
ind<-2.50 dir() listar documentos de directorio
typeof(variable) verificar tipo de variable
N1<-80 data() datasets intalados en R
N2<-90
Bo1<- TRUE
Bo2 <- T
OPERADORES
EJEMPLO OPERADORES :
ind>es
N1>N2
Bo1==Bo2
Bo2!=ind
Estructuras de datos en R
Las colecciones o conjunto de datos en R se organizan por su dimensión (1, 2, o
varias dimensiones) y si son homogéneas (todos los objetos deben ser del mismo
tipo) o heterogéneas ( el contenido puede ser de diferentes tipos).
A continuación mostramos los cinco tipos de datos más usados en el análisis
de datos:
Homogénea Heterogénea
1 Vector atómico Lista
2 Matriz Data frame
n Array
Estructuras de datos en R : VECTOR
El tipo más básico de estructura de dato en R es el vector. El vector es una
estructura compuesta de un número de elementos finitos, homogéneos y donde
dicha estructura tiene un tamaño fijo.
# sumar datos de un
vector sum(data)
#calculo de la media
sum(data) / length(data)
#funciones estadísticas
#calculo de la media
mean(data)
FUNCIONES DE ESTADISTICAS
Ejemplo:
#calculo de la mediana
median(data)
#calculo de la moda
#valor que mas se repite
datamoda<- table(data)