File 1
File 1
File 1
Pré-requisito
Os textos indicados neste material didático, bem como em outros pontos da disciplina, são
em inglês, uma vez que há pouco conteúdo em língua portuguesa que atenda ao crivo de seleção de
informações consideradas pelos autores desta disciplina como basilares para a introdução à Ciência
de Dados. Sem dúvida, há na web um sem-número de textos nos seus diferentes contextos e
aplicações, no entanto, este curso presta-se ao serviço de contemplar os conteúdos mais atuais e
mais robustos voltados à Ciência de Dados, e a exploração desses materiais, em língua inglesa, não
é só necessária como também garantia de se buscar na fonte, sem traduções intermediárias.
SUMÁRIO
MÓDULO I – O QUE É CIÊNCIA DE DADOS? ......................................................................................... 7
CONLUSÃO ........................................................................................................................................... 35
BIBLIOGRAFIA ...................................................................................................................................... 36
PROFESSOR-AUTOR ............................................................................................................................. 38
MÓDULO I – O QUE É CIÊNCIA DE DADOS?
Este é o nosso primeiro passo para conhecer a Ciência de Dados. Aqui, vamos definir vários
conceitos que são necessários para entender os próximos módulos de estudo, seja por meio deste
conjunto de bibliografias recomendadas ou pelo acesso às webaulas desta disciplina. Mostraremos
alguns exemplos que motivam o porquê de a Ciência de Dados ser uma área de grande importância
nos últimos anos. Além disso, aprenderemos sobre as habilidades que precisamos desenvolver e
reforçar para nos considerarmos bons cientistas de dados.
A general introduction to data analytics (MOREIRA et al., 2018) Seções 1.1, 1.2 e 1.3
Estas seções descrevem o conceito de Big Data, que é inicialmente definido por três “Vs”:
volume, variedade e velocidade. Da mesma forma, é feita uma relação entre Big Data e Data Science.
Quando um conjunto de dados é considerado Big Data?
The government-academia complex and big data religion
(Disponível em: <https://www.forbes.com/sites/gilpress/2014/09/09/the-government-
academia-complex-and-big-data-religion/#254394262a10>)
Este artigo descreve ideias dos momentos em que o Big Data pode ser bom e quando não
pode. Há uma ênfase no que é a religião de Big Data, na qual há seguidores apaixonados que
acreditam pertencer a um novo movimento científico que não precisa fazer perguntas, mas apenas
coletar dados e deixá-los falar por eles mesmos.
Data science for business (PROVOST; FAWCETT, 2013): Capítulo 1, Seção Data science,
engineering, and data-driven decision making (p. 3-7)
Esta seção descreve a relação entre Ciência de Dados e tomada de decisão com base em dados
e argumenta que o objetivo final da Ciência de Dados é melhorar a tomada de decisão, uma vez
que esta é geralmente a principal meta das empresas.
Principles of data science (OZDEMIR, 2016) Capítulo 1, Seções What is data science? e The
data science Venn diagram
A primeira seção é uma breve introdução do que é Ciência de Dados e de algumas terminologias
que serão usadas. A segunda seção apresenta as habilidades que os cientistas de dados devem. Em
resumo, o diagrama descrito no texto nos mostra que a Ciência de Dados é composta de três áreas
importantes: matemática/estatística, computação e conhecimento do domínio.