Parcial N2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

Pandas= es una biblioteca de Python. Programa que hizo otra persona y publicó.

 Se utiliza para el análisis y la manipulación de datos en bruto.


 Es una herramienta que sirve para limpiar, transformar y analizar datos de una manera
rápida y eficiente.

DataFrame= estructura de datos principal en Pandas.

 Es una tabla de datos bidimensional que se compone de filas y columnas (hoja de


cálculo de Excel).
 Son útiles para almacenar y manipular grandes cantidades de datos
 Proporcionan una gran cantidad de funcionalidades.

Funciones
Nos devuelve informacion sobre el DataFrame incluidos sus
info() índices y columnas,
valores no nulos y uso de memoria
devuelve una serie con un resumen descriptivo que incluye el
describe() número de datos, su suma, el mínimo, el máximo, la media, la
desviación típica y los cuartile
Devuelve las primeras filas del DataFrame df. Por defecto,
head()
devuelve las primeras 5.
Devuelve un DataFrame con los elementos de
iloc[filas,columnas] las filas de la lista filas y las columnas de la lista columnas. Si
o df[[]] queremos que muestre todas las
columnas podemos poner : en su lugar
Condición que devuelve True si el valor de la columna es
is.null()
nulo o None.
between(a,b) Elige los elementos que se encuentren en el rango [a,b].
sum() Suma todos los valores de la columna seleccionada.
groupby() Agrupa las filas según una condición en el paréntesis.
mean() Se calcula el promedio
drop() Recibe el índice de la fila que se desea eliminar.
Devuelve cuantas veces aparece cada valor único para una
value_counts()
columna específica.
by = [columnas], ascending = [T or F] booleanos donde
sort_values(by,
indicamos si queremos que el ordenamiento
ascending)
de la lista anterior sea ascendente o no.
Transformar los valores de columna entera, le pasamos un
map() diccionario con
elementos del tipo {valor_viejo: valor_nuevo}.
Recibe primero el valor viejo y después el valor nuevo realizará
replace(a,b) el
reemplazo.
Para filtrar los elementos de nuestra tabla lo que hacemos es poner una condición
adentro de los corchetes. Por ejemplo, podemos seleccionar solamente las filas que
tengan número de visitas mayores que 3. df[df['visits'] > 3]
Si queremos cambiar el valor de celdas específicas usamos el = como si fuera una
variable normal. Cambiemos la edad en la fila 'f' a 1.5. df.loc['f', 'age'] = 1.5
Bibliotecas MatPloitlib

Plot = grafico 2D

Matplotlib es la biblioteca de Python más usada para crear gráficos en 2D. Provee una forma
rápida de graficar datos en varios formatos de alta calidad que pueden ser compartidos y/o
publicados.

Pyplot proporciona una interfaz a la biblioteca de matplotlib. Pyplot está diseñada siguiendo el
estilo de Matlab y la mayoría de los comandos para graficar en
pyplot tienen análogos en Matlab con argumentos similares. # Crea una figura nueva, de 8x6
En Matplotlib los gráficos tienen una configuración por omisión pulgadas, con 80 puntos por pulgada.
Se usa para cambiar el tamaño de la
plt.figure(figsize=(10, 6), dpi=80) imagen
plt.plot(X, C, color="blue", linewidth=2.5, linestyle="-")

plt.plot(X, S, color="red", linewidth=2.5, linestyle="-") Cambio color y ancho de los trazos


plt.xlim(X.min() * 1.1, X.max() * 1.1)

plt.ylim(C.min() * 1.1, C.max() * 1.1)

plt.xticks([-np.pi, -np.pi/2, 0, np.pi/2, np.pi]) Que aparece en los ejes


plt.yticks([-1, 0, +1])

plt.xticks([-np.pi, -np.pi/2, 0, np.pi/2, np.pi],

[r'$-\pi$', r'$-\pi/2$', r'$0$', r'$+\pi/2$', r'$+\pi$']) Segundos argumentos en LaTex de


los ejes
plt.yticks([-1, 0, +1],

[r'$-1$', r'$0$', r'$+1$'])

ax = plt.gca()

ax.spines['right'].set_color('none') Vamos a esconder dos de ellas


ax.spines['top'].set_color('none') dándoles color none y vamos a
mover la de abajo y la de la
ax.xaxis.set_ticks_position('bottom') izquierda a la posición 0 del
ax.spines['bottom'].set_position(('data',0)) espacio de coordenadas.

ax.yaxis.set_ticks_position('left')

ax.spines['left'].set_position(('data',0))

plt.show()
Al definir un valor para las marcas en los ejes podemos proveer un texto en la segunda lista de
argumentos para usar como etiqueta

El contorno es el conjunto de líneas que delimitan el área de graficación y que unen todas las
marcas en los ejes. Podemos ubicarlas en cualquier posición y, hasta ahora, han estado en el
extremo de cada eje.

Vamos a marcar algunos puntos interesantes usando el comando annotate.

Si aumentamos la cantidad de puntos entonces nuestra linea va a ser más suave


Para hacer un gráfico de barras se usa bar. Esta función primero recibe un arreglo con
las etiquetas de las barras que se van a mostrar y después otro arreglo con la altura de
cada una de estas barras. peso = [340, 115, 200, 200, 270] ingredientes = ['chocolate',
'manteca', 'azúcar', 'huevo', 'harina'] plt.bar(ingredientes, peso)

También podría gustarte