1desafio Do Curso - Coursera

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 10

3/15/23, 3:22 PM Desafio do curso | Coursera

1. Cenário 1, perguntas 1-7 1 / 1 ponto

Como parte da equipe de Ciência de dados da Gourmet Analytics, você usa


Data Analytics para aconselhar empresas do setor de alimentos. Suas funções
envolvem limpar, organizar e visualizar dados para chegar a insights que
beneficiarão seus clientes. Como membro de uma equipe colaborativa,
compartilhar suas análises com outras pessoas é uma parte importante do seu
trabalho.

Seu cliente atual é Chocolate and Tea, uma rede de cafeterias em ascensão.

O restaurante combina um extenso menu de chás finos com barras de


chocolate de diversos lugares do mundo. Sua seleção variada inclui de tudo,
desde chocolate ao leite com banana, chocolate branco com tangerina e
chocolate amargo com pistache e figo. A lista enciclopédica de barras de
chocolate é a base do apelo da marca Chocolate and Tea. As vendas de barras
de chocolate são o principal gerador de receita.

Chocolate and Tea tem como objetivo servir barras de chocolate altamente
avaliadas pela crítica profissional. A empresa também costuma modificara
continuamente o cardápio para garantir que seja um reflexo da diversidade
global da produção de chocolate. A equipe de gerenciamento atualiza
regularmente a lista de barras de chocolate para alinhá-la às classificações
mais recentes e garantir que a lista contenha barras de vários países.

Os membros solicitaram a coleta e análise de dados sobre as classificações de


chocolate mais recentes. Em particular, eles gostariam de saber quais países
produzem as barras de chocolate super amargo mais bem avaliadas (uma alta
porcentagem de cacau). Com esses dados em mãos, eles poderão criar seu
próximo menu de barras de chocolate.

Sua equipe recebeu um conjunto de dados que apresenta as classificações


mais recentes de milhares de chocolates de todo o mundo. Clique aqui para
acessar o conjunto de dados. Considerando os dados e a natureza do trabalho
https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 1/10
3/15/23, 3:22 PM Desafio do curso | Coursera

que você fará para seu cliente, sua equipe concorda em usar R para este
projeto.

Você cria um pequeno documento sobre os benefícios atrelados ao uso de


R para o projeto e o compartilha com sua equipe. Você escreve que os
benefícios incluem a capacidade de R de processar rapidamente uma alta
quantidade de dados, além de reproduzir e compartilhar facilmente uma
análise. Qual é o outro benefício do uso de R para o projeto?

Limpar dados automaticamente

Definir um problema e fazer as perguntas certas

Escolher um tópico para análise de dados

Criar visualizações de alta qualidade

Correto
Outro benefício de usar R para o projeto é a sua capacidade de criar
visualizações de dados de alta qualidade.

2. Continuação do cenário 1 1 / 1 ponto

Antes de começar a trabalhar com seus dados, é necessário importar e salvá-


los como um data frame. Para começar, você abre seu espaço de trabalho em
RStudio e carrega a biblioteca de tidyverse. Em seguida, carregue um arquivo
.csv contendo os dados para RStudio e armazene-o em uma pasta de projeto
denominada flavors_of_cacao.csv.

Você usa a função read_csv() para importar os dados do arquivo .csv.


Suponha que o nome do data frame seja bars_df e que o arquivo .csv esteja
no diretório de trabalho. Qual bloco de código permite que você crie o data
frame?

bars_df %>% read_csv("flavors_of_cacao.csv")

read_csv("flavors_of_cacao.csv") + bars_df

bars_df <- read_csv("flavors_of_cacao.csv")

bars_df + read_csv("flavors_of_cacao.csv")

Correto
O bloco de código bars_df <- read_csv("flavors_of_cacao.csv") permite criar
o data frame. Neste bloco de código:

bars_df é o nome do data frame que armazenará os dados.

<- é o operador de atribuição para atribuir valores ao data frame.

read_csv() é a função que importará os dados para o data frame.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 2/10
3/15/23, 3:22 PM Desafio do curso | Coursera

"flavors_of_cacao.csv" é o nome do arquivo que a função read.csv() recebe


como argumento.

3. Continuação do cenário 1 1 / 1 ponto

Agora que você criou um data frame, deseja saber mais sobre como os dados
são organizados. O data frame contém centenas de linhas e muitas colunas.

Suponha que o nome do seu data frame seja flavors_df. Qual bloco de
código permite revisar a estrutura do data frame?

summarize(flavors_df)

select(flavors_df)

str(flavors_df)

filter(flavors_df)

Correto
Você escreve o bloco de código str(flavors_df). Neste bloco de código:

str() é a função que retornará a organização da estrutura do data frame e


fornecerá informações de alto nível, como os nomes das colunas e o tipo
de dados contidos nessas colunas.

flavors_df é o nome do data frame que a função str() recebe como


argumento.

4. Continuação do cenário 1 1 / 1 ponto

Em seguida, você começa a limpar seus dados. Ao verificar os títulos das


colunas no seu data frame, você percebe que a primeira coluna é denominada
Company...Maker.if.known. (Observação: O ponto após known faz parte do
nome da variável.) Por uma questão de clareza e consistência, você decide
renomear esta coluna como Brand(sem ponto no final).

Suponha que a primeira parte do seu bloco de código seja:

flavors_df %>%

Qual bloco de código você adiciona para alterar o nome da coluna?

rename(Company...Maker.if.known. = Brand)

rename(Brand = Company...Maker.if.known.)

rename(Brand, Company...Maker.if.known.)

rename(Company...Maker.if.known. , Brand)
https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 3/10
3/15/23, 3:22 PM Desafio do curso | Coursera

Correto
Você escreve o bloco de código rename(Brand =
Company...Maker.if.known.).

Neste bloco de código:

rename() é a função que irá alterar o nome da sua coluna.

Dentro dos parênteses da função, escreva o novo nome (Brand), seguido de


um sinal de igual, para então incluir o nome que deseja alterar
(Company...Maker.if.known. ).

5.Depois de visualizar e limpar seus dados, você determina quais variáveis são mais relevantes para sua 0 / 1 ponto
análise. Seu foco principal está em Rating, Cocoa.Percent e Bean.Type. Você decide usar a função
select() para criar um novo data frame com apenas essas três variáveis.

Suponha que a primeira parte do seu código seja:

trimmed_flavors_df <- flavors_df %>%

Adicione o bloco de código que permite selecionar as três variáveis.

1  

Executar

Redefinir

Qual tipo de grão aparece na linha 6 do seu tibble?

Beniano

Forastero

Trinitario

Criollo

Incorreto
Reveja o vídeo sobre limpeza de dados em R para relembrar seu
conhecimento.

6.Em seguida, selecione as estatísticas básicas que podem ajudar sua equipe a entender melhor o 1 / 1 ponto
sistema de classificação em seus dados.

Suponha que a primeira parte do seu código seja:

trimmed_flavors_df %>%

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 4/10
3/15/23, 3:22 PM Desafio do curso | Coursera

Você deseja usar as funções resume() e sd() para encontrar o desvio padrão da classificação para
seus dados. Adicione o bloco de código que permite encontrar o desvio padrão para a variável
Rating.

1  

Executar

Redefinir

Qual é o desvio padrão da classificação?

0,4780624

0,3720475

0,4458434

0,2951794

Correto
Você adiciona o bloco de código summarize(sd(Rating)) para encontrar o
desvio padrão para a variável Rating. O código correto é
trimmed_flavors_df %>% summarize(sd(Rating)). Neste bloco de código:

A função resume() permite exibir estatísticas resumidas. Você pode usar a


função resume() em combinação com outras funções, como mean(), max()
e min() para calcular estatísticas específicas.

Nesse caso, use sd() para calcular a estatística de desvio padrão para a
variável Rating.

O desvio padrão da classificação é 0,4780624.

7.Depois de concluir sua análise do sistema de classificação, você determina que qualquer classificação 0 / 1 ponto
maior ou igual a 3,75 pontos pode ser considerada uma classificação alta. Também está ciente de que a
Chocolate and Tea classifica como super amargo o chocolate de uma barra cuja porcentagem de cacau
é maior ou igual a 80%. Você decide criar um novo data frame para descobrir quais barras de chocolate
atendem a essas duas condições.

Suponha que a primeira parte do seu código seja:

best_trimmed_flavors_df <- trimmed_flavors_df %>%

Você deseja aplicar a função filter() às variáveis Cocoa.PercenteRating. Adicione o bloco de código
que permite filtrar o novo data frame para barras de chocolate que contenham pelo menos 80%
de cacau e uma classificação de pelo menos 3,75 pontos.

1  

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 5/10
3/15/23, 3:22 PM Desafio do curso | Coursera
Executar

Redefinir

Quantas linhas seu tibble inclui?

20

22

12

Incorreto
Reveja o vídeo sobre organização de dados em R para relembrar seu
conhecimento.

8.Agora que você limpou e organizou seus dados, está pronto para criar visualizações de dados úteis. Sua 1 / 1 ponto
equipe atribui a você a tarefa de criar uma série de visualizações com base nas solicitações da equipe
de gerenciamento da Chocolate and Tea. Você decide usar ggplot2 para criar seus elementos visuais.

Suponha que sua primeira linha de código seja:

ggplot(data = best_trimmed_flavors_df) +

Você deseja usar a função geom_bar() para criar um gráfico de barras. Adicione o bloco de código
que permite criar um gráfico de barras com a variável Company no eixo X.

1  

Executar

Redefinir

Quantas barras seu gráfico de barras exibe?

10

Correto
Você adiciona o bloco de código geom_bar(mapping = aes(x = Company))
para criar um gráfico de barras com a variável Company no eixo X. O código
correto é ggplot(data = best_trimmed_flavors_df) + geom_bar(mapping =
aes(x = Company)). Neste bloco de código:

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 6/10
3/15/23, 3:22 PM Desafio do curso | Coursera

geom_bar() é a função geom que usa barras para criar um gráfico de


barras.

Dentro dos parênteses da função aes(), o código x = Company mapeia a


estética x para a variável Company.

A empresa aparecerá no eixo X do gráfico.

Por padrão, R colocará uma contagem da variável Company no eixo Y.

Seu gráfico de barras exibe 8 barras.

9.Seu gráfico de barras revela os locais que produzem as barras de chocolate mais bem avaliadas. Para 0 / 1 ponto
ter uma ideia melhor da classificação específica de cada local, você gostaria de destacar cada barra.

Suponha que você esteja trabalhando com o bloco de código:

ggplot(data = best_trimmed_flavors_df) +

geom_bar(mapping = aes(x = Company.Location))

Adicione um bloco de código à segunda linha de código para mapear o elemento estético color
para a variável Rating.

NOTA: os três pontos (...) indicam onde adicionar o bloco de código.

1 geom_bar(mapping = aes(x = Company.Location, ...))

Executar

Redefinir

De acordo com seu gráfico de barras, quais são as duas localizações da empresa que produzem as
barras de chocolate mais bem avaliadas?

Amsterdã e EUA

Escócia e França

Canadá e França

Canadá e EUA

Incorreto
Reveja o vídeo sobre estética para relembrar seu conhecimento.

10. Continuação do cenário 2 1 / 1 ponto

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 7/10
3/15/23, 3:22 PM Desafio do curso | Coursera

Um colega de equipe cria um novo gráfico com base nos dados sobre barras de
chocolate. O colega de equipe solicita que você faça algumas revisões em seu
código.

Suponha que seu colega de equipe compartilhe o bloco de código a seguir:

ggplot(data = best_trimmed_flavors_df) +

geom_bar(mapping = aes(x = Rating)) +

Qual bloco de código você adiciona à terceira linha para criar facetas de
contorno da variável Rating?

facet_wrap(Rating~)

facet_wrap(Rating)

facet(~Rating)

facet_wrap(~Rating)

Correto
Você escreve o bloco de código facet_wrap(~Rating). Neste bloco de
código:

facet_wrap() é a função que permite criar facetas de contorno de uma


variável.

Dentro dos parênteses da função facet_wrap(), digite um til (~) seguido do


nome da variável (Rating).

11. Continuação do cenário 2 1 / 1 ponto

Sua equipe criou algumas visualizações básicas para explorar diferentes


aspectos dos dados de barras de chocolate. Você se ofereceu para adicionar
títulos aos gráficos. Você começa com um gráfico de dispersão.

Suponha que a primeira parte do seu bloco de código seja:

ggplot(data = trimmed_flavors_df) +

geom_point(mapping = aes(x = Cocoa.Percent, y = Rating)) +

Qual bloco de código você adiciona à terceira linha para adicionar o título
Suggested Chocolate ao seu gráfico?

labs(Suggested Chocolate)

labs(title = “Suggested Chocolate”)

labs(Suggested Chocolate = title)

labs <- "Suggested Chocolate"


https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 8/10
3/15/23, 3:22 PM Desafio do curso | Coursera

Correto
Você escreve o bloco de código labs(title = “Suggested Chocolate”). Neste
bloco de código:

labs() é a função que permite adicionar um título ao seu gráfico.

Nos parênteses da função labs(), escreva a palavra título, seguida de um


sinal de igual e o texto específico do título entre aspas (“Suggested
Chocolate”).

12. Continuação do cenário 2 1 / 1 ponto

Em seguida, crie um novo gráfico de dispersão para explorar a relação entre


diferentes variáveis. Você deseja salvar seu gráfico para poder acessá-lo mais
tarde. Além disso, está ciente de que a função ggsave() tem como padrão salvar
o último gráfico exibido em RStudio, e está pronto para escrever o código a fim
de salvar seu gráfico de dispersão.

Suponha que suas duas primeiras linhas de código sejam:

ggplot(data = trimmed_flavors_df) +

geom_point(mapping = aes(x = Cocoa.Percent, y = Rating)) +

Qual bloco de código você adiciona à terceira linha para salvar seu gráfico
como um arquivo jpeg com chocolate definido como o nome do arquivo?

ggsave(“chocolate.jpeg”)

ggsave(chocolate.jpeg)

ggsave(“chocolate.png”)

ggsave(“jpeg.chocolate”)

Correto
Você adiciona o bloco de código ggsave(“chocolate.jpeg”) para salvar seu
gráfico como um arquivo jpeg com “chocolate” definido como o nome do
arquivo. Neste bloco de código:

Dentro dos parênteses da função ggsave(), digite uma aspa seguida do


nome do arquivo (chocolate), um ponto final, o tipo de formato do arquivo
(jpeg) e uma aspa de fechamento.

13. Continuação do cenário 2 1 / 1 ponto

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 9/10
3/15/23, 3:22 PM Desafio do curso | Coursera

Como etapa final do processo de análise, você cria um relatório para


documentar e compartilhar seu trabalho. Antes de compartilhar seu trabalho
com os membros do gerenciamento da Chocolate and Tea, você se reunirá com
sua equipe e obterá feedback. Sua equipe deseja que a documentação inclua
todo o seu código e exiba todas as suas visualizações.

Preencha a lacuna: Você deseja registrar e compartilhar cada etapa de sua


análise, possibilitar que seus colegas de equipe executem seu código e
exibir suas visualizações. Você decide criar _____ para documentar seu
trabalho.

um banco de dados

uma planilha

um data frame

um notebook de R Markdown

Correto
Feedback: Você usa um notebook de R Markdown para documentar seu
trabalho. O notebook permite registrar e compartilhar cada etapa de sua
análise, possibilita que seus colegas de equipe executem seu código e
exiba suas visualizações.

https://www.coursera.org/learn/analise-de-dados-com-programacao-em-r/exam/M6WGG/desafio-do-curso/attempt?redirectToCover=true 10/10

Você também pode gostar