Parcial N2
Parcial N2
Parcial N2
Funciones
Nos devuelve informacion sobre el DataFrame incluidos sus
info() índices y columnas,
valores no nulos y uso de memoria
devuelve una serie con un resumen descriptivo que incluye el
describe() número de datos, su suma, el mínimo, el máximo, la media, la
desviación típica y los cuartile
Devuelve las primeras filas del DataFrame df. Por defecto,
head()
devuelve las primeras 5.
Devuelve un DataFrame con los elementos de
iloc[filas,columnas] las filas de la lista filas y las columnas de la lista columnas. Si
o df[[]] queremos que muestre todas las
columnas podemos poner : en su lugar
Condición que devuelve True si el valor de la columna es
is.null()
nulo o None.
between(a,b) Elige los elementos que se encuentren en el rango [a,b].
sum() Suma todos los valores de la columna seleccionada.
groupby() Agrupa las filas según una condición en el paréntesis.
mean() Se calcula el promedio
drop() Recibe el índice de la fila que se desea eliminar.
Devuelve cuantas veces aparece cada valor único para una
value_counts()
columna específica.
by = [columnas], ascending = [T or F] booleanos donde
sort_values(by,
indicamos si queremos que el ordenamiento
ascending)
de la lista anterior sea ascendente o no.
Transformar los valores de columna entera, le pasamos un
map() diccionario con
elementos del tipo {valor_viejo: valor_nuevo}.
Recibe primero el valor viejo y después el valor nuevo realizará
replace(a,b) el
reemplazo.
Para filtrar los elementos de nuestra tabla lo que hacemos es poner una condición
adentro de los corchetes. Por ejemplo, podemos seleccionar solamente las filas que
tengan número de visitas mayores que 3. df[df['visits'] > 3]
Si queremos cambiar el valor de celdas específicas usamos el = como si fuera una
variable normal. Cambiemos la edad en la fila 'f' a 1.5. df.loc['f', 'age'] = 1.5
Bibliotecas MatPloitlib
Plot = grafico 2D
Matplotlib es la biblioteca de Python más usada para crear gráficos en 2D. Provee una forma
rápida de graficar datos en varios formatos de alta calidad que pueden ser compartidos y/o
publicados.
Pyplot proporciona una interfaz a la biblioteca de matplotlib. Pyplot está diseñada siguiendo el
estilo de Matlab y la mayoría de los comandos para graficar en
pyplot tienen análogos en Matlab con argumentos similares. # Crea una figura nueva, de 8x6
En Matplotlib los gráficos tienen una configuración por omisión pulgadas, con 80 puntos por pulgada.
Se usa para cambiar el tamaño de la
plt.figure(figsize=(10, 6), dpi=80) imagen
plt.plot(X, C, color="blue", linewidth=2.5, linestyle="-")
ax = plt.gca()
ax.yaxis.set_ticks_position('left')
ax.spines['left'].set_position(('data',0))
plt.show()
Al definir un valor para las marcas en los ejes podemos proveer un texto en la segunda lista de
argumentos para usar como etiqueta
El contorno es el conjunto de líneas que delimitan el área de graficación y que unen todas las
marcas en los ejes. Podemos ubicarlas en cualquier posición y, hasta ahora, han estado en el
extremo de cada eje.