Tarea 002 - BigQuery

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

ASIGNATURA : Sistemas de Información Gerencial

ALUMNO : CHAVARRIAL LEIVA, PERCY RAUL

1. ¿Qué es bigQuery?

Resumen: Almacenar y consultar conjuntos de datos grandes puede consumir una


gran cantidad de tiempo y dinero cuando no se cuenta con el hardware y la
infraestructura adecuados. Google BigQuery es un almacén de datos para empresas
que resuelve este problema, ya que permite realizar consultas de SQL de alta
velocidad mediante el poder de procesamiento de la infraestructura de Google.

Dentro de la categoría Big Data, Google Cloud Platform ofrece el servicio


llamado BigQuery, el cual es un almacén de datos para empresas que,
además, fue desarrollado para la consulta interactiva de grandes conjuntos de
información.

Google BigQuery permite ejecutar búsquedas con Structured Query Language


(SQL) contra un amplio volumen de datos en alta velocidad, con estudios en
tiempo real y resultados en segundos.

Este almacén es completamente administrado, sin servidores, con gran


escalabilidad y con escala de petabytes.

Además, BigQuery tiene integración con diversas herramientas, tales como:

 ETL (Informatica y Talend);


 BI (Tableau, MicroStrategy, Looker y Data Studio);
 Cloud Storage (almacenamiento de objetos);
 Cloud Bigtable (bases de datos transaccionales);
 Hojas de cálculo en Drive para procesar fuentes de datos externas sin
duplicar datos;
 Google Marketing Platform;
 Google Ads;
 además, transmite información desde YouTube, aplicaciones Saas de socios,
Teradata y Amazon S3.

Dicho de otra forma, prácticamente cualquier sitio del que puedes extraer
información relevante, puede conectarse con BigQuery.

Hay 3 usos clave de BigQuery que pueden beneficiarnos mucho:

1) Almacenar y analizar información

Como mencionamos anteriormente, BigQuery sirve para acoplar y consultar


conjuntos masivos de datos, los cuales tienen un almacenamiento lógico
administrado en columnas. Estos se analizan por lotes y en transmisión, a
partir del almacenamiento de datos y hojas de cálculo.
De esta forma, se logra configurar el almacén en segundos y consultar la
información en tiempo real, facilitando así su análisis y permitiendo a las
compañías tomar decisiones de una forma más rápida y precisa.
2) Integrar, crear informes y paneles

Google BigQuery permite crear informes, transferir datos de transmisión,


visualizar estadísticas y paneles rápidamente con BI Engine. También
ejecuta consultas de SQL a gran velocidad, por lo que cualquier persona
con conocimientos básicos de SQL puede crear informes y paneles con
facilidad.
Además, la integración con los datos es más sencilla y rápida, ya que
proporciona controladores Open DataBase Connectivity (ODBC) y Java™
Database Connectivity (JDBC).

En pocas palabras, esta herramienta es ideal para encontrar patrones y


áreas de oportunidad del negocio.

3) Compartir información de forma segura

BigQuery cumple con todos los principios del Escudo de Privacidad, por lo
que es más que posible compartir información importante (como consultas,
datos, informes y hojas de cálculo) de manera segura dentro de tu empresa
y fuera de ella.

Aunado a lo anterior, proporciona una copia de seguridad automática que


permite la recuperación de información ante alguna desgracia, haciendo
que sea más sencillo mantener una base sólida, segura y administrable.

Para finalizar, al contar con el hardware y la infraestructura adecuada, es


posible reducir una cantidad de tiempo y dinero considerable a la hora de
almacenar y consultar grandes conjuntos de datos.

De esta forma, con una herramienta sin servidores se logra disminuir la


inactividad, ya que administra las tareas de mantenimiento continuo, realiza
actualizaciones, supervisiones, registros de auditoría, alertas y más.

2. ¿Qué es un Petabytes?

Un Petabyte  es una unidad de almacenamiento de información cuyo símbolo


es PB, y equivale a 1.024 Terabytes (en realidad 1.125.899.906.842.624
bytes). Se utiliza sobre todo en soluciones distribuidas de almacenaje y dentro
de soluciones de empresa importantes. Se trata de una unidad más grande que
el gigabyte o el terabyte, pero más pequeña que unidades como el exabyte,
el zettabyte o el yottabyte.

Al descomponer esta unidad de información, descubrimos que aquéllas a las


cuales estamos acostumbrados en el presente parecen insignificantes: el
Petabyte está formado por 1.024 Terabytes, el cual, a su vez, equivale a 1.024
Gigabytes y así se debe continuar hasta llegar al byte, pasando por el
Megabyte y el Kilobyte. Es importante notar que, si bien el prefijo kilo es el
mismo que se usa para representar unidades decimales (como el kilómetro), el
múltiplo de las unidades de información no es 1000, sino 1024, ya que no son
decimales, sino binarias.

El uso de cada unidad de información depende del contexto. Por ejemplo,


cuando la cantidad de información de un sistema dado es tan grande que es
impracticable cuantificarla a través de unidades como bytes o Kilobytes, se
suele recurrir a Petabytes, algo que resulta poco práctico a la hora de
mencionar el peso de los archivos digitales contenidos en un ordenador para
uso personal.

Los Petabytes, por lo tanto, se usan para nombrar caudales muy grandes de
información. El tráfico de los sitios web más populares del mundo, los datos
procesados por buscadores como Google o las trasferencias que se concretan
en las redes de los principales proveedores de Internet pueden estimarse en
Petabytes ya que representan cifras altísimas. Si alguien quisiera nombrar los
datos que procesa Google en un mes mediante cantidades de kilobytes, por
ejemplo, tendría que apelar a una cantidad tan elevada de ceros que su
notación sería muy difícil de entender.

3. ¿Cuántas filas maneja Excel?


Excel maneja 1.048.576 filas por 16.384 columnas

4. ¿Tiene relación Excel con BigQuery?

BigQuery ofrece un conector que te permite realizar consultas


en BigQuery desde Excel. Esto puede ser útil si usas Excel con frecuencia
para administrar tus datos. El conector accede a BigQuery, realiza una
consulta específica, y descarga y propaga esos datos en Excel.

5. ¿Qué es un Backup?

Un backup no es sino una copia de seguridad a mayor o menor escala.


Puede ser una versión reciente de la información contenida en todos los
equipos de nuestra compañía, o puede tratarse de servidores completos con
ingentes cantidades de datos.
Gracias a las copias de seguridad, conseguimos tener un plan de acción en
caso de que se produzca un problema con los sistemas de la empresa. Así, en
caso de que perdamos parte o toda la información, un servicio o ciertos
sistemas que permiten operar, podremos recuperarnos rápidamente. Con esto
reducimos el tiempo de respuesta ante la incidencia, y tendremos capacidad
de maniobra en cualquier circunstancia adversa.
Los backups permiten, por tanto, que en la compañía tengamos la tranquilidad
de saber que la información siempre se guarda en una copia. Puede tratarse de
una copia creada de forma automática cada cierto tiempo, o de un
procedimiento que llevemos a cabo de forma manual. En todo caso, el objetivo
es el mismo: mejorar la seguridad de la empresa y reducir al mínimo el tiempo
de reacción frente a un problema.

6. ¿Qué es Google cloudstorage?

El Google Cloud Storage (traducido como Almacenamiento en la Nube de


Google) es un servicio de almacenamiento de archivos en línea RESTful para
almacenar y acceder a datos en la infraestructura de Google cloud Platform. El
servicio combina el rendimiento y la escalabilidad de la nube de Google con
capacidades avanzadas de seguridad y uso compartido. Es una Infraestructura
como Servicio (IaaS), comparable al servicio de almacenamiento en línea
de Amazon S3. Al contrario de Google Drive y según las diferentes
especificaciones de servicio, Google Cloud Storage parece ser más adecuado
para las empresas

7. ¿Cuánto demora en la búsqueda de información Bigquery en cantidad por


segundo?

Aproximadamente 6GB por segundo.

(Información tomada de un ejemplo de consulta en el video del siguiente link:


https://www.youtube.com/watch?v=kud8YDvBKHE)

También podría gustarte