Análise de Dados
Análise de Dados
Análise de Dados
variabilidade dos dados. Ela significa até que ponto é provável que os dados
numéricos variem sobre um valor médio. Em outras palavras, a dispersão ajuda a
entender a distribuição dos dados. Determine o desvio-padrão e a variância do
conjunto de valores:
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2].
Alternativas:
Alternativas:
Sejam x1, x2, ..., xn e y1, y2, ..., yn. os valores observados de X e Y,
respectivamente. Denomina-se coeficiente de correlação (amostral) entre X e Y o
número dado por:
Em que:
r = o coeficiente de correlação.
Vamos supor que seja necessário substituir os valores nulos pelas médias dos
valores. Qual opção a seguir indica o método para substituir os valores pela média?
Alternativas:
Alternativas:
Alternativas:
I – II – III – V.
II – V.
I – II – IV.
II – IV.
Apenas V.checkCORRETO
Resolução comentada:
I é falsa – A mais básica de todas as variáveis aleatórias discretas é a Bernoulli.
Diz-se que X tem uma distribuição de Bernoulli se X = 1 ocorrer com probabilidade π
e X = 0.
II é falsa – A Binomial segue X1, X2,…, Xn como variáveis aleatórias Bernoulli
independentes e identicamente distribuídas (iid).
III é falsa – Distribuição Poisson E(X) = V (X) =λ.
IV é falsa – Distribuição binomial é do tipo discreta.
V é verdadeira – A distribuição exponencial é utilizada para análise de
sobrevivência.
Alternativas:
Alternativas:
13.
12.
14.5.
10.39.checkCORRETO
11.40.
Resolução comentada:
Alternativas:
V – V – F – V.
F – F – F – V.
V – V – V – F.
V – F – F – F.
F – V – F – V.checkCORRETO
Resolução comentada:
F – Na análise de dados, existem métodos estatísticos e matemáticos capazes de
transformar dados em informações.
V – Os atributos da população podem ser descritos por meio do parâmetro.
F – A análise de dados fornece suporte para todos os setores da empresa, por
exemplo, para o setor financeiro, reduz os custos e aumenta os lucros.
V – Os gráficos são uma forma simples para transmitir os feedback das análises dos
dados.
São verdadeiras:
Alternativas:
II – IV.
Apenas a II.checkCORRETO
I – II – III – IV.
I – IV.
II – III.
Resolução comentada:
I. Falsa – A correlação não deve ser confundida com causalidade, pois, caso duas
variáveis estejam correlacionadas, isso não implica que uma variável cause as
alterações em outra.
II. Verdadeira – A correlação apenas avalia os relacionamentos entre variáveis.
III. Falsa – A correlação não avalia todos os fatores que levam aos relacionamentos
entre variáveis.
IV. Falsa – O motivo de um evento ocorrer junto com outro não significa que um
cause o outro.
Alternativas:
II – IV.checkCORRETO
I – IV.
Apenas a I.
I – II – III.
I – II – III.
Resolução comentada:
I. Pandas: biblioteca fundamental para análise de dados. NumPy: biblioteca usada
para realizar cálculos matemáticos. Matplotlib: biblioteca para visualização de
dados.
II. data.fillna(data.mean(0)).
III. data.drop('E', inplace=True, axis=1).
IV. data.dropna(): remove do banco todos os valores com NaN.