Aula Quim1 2019

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 470

Disciplina: Quimiometria I

Edenir Rodrigues Pereira Filho


[email protected] ou [email protected]

Ementa:
- Cálculos básicos em química:
Mínimos quadrados, autovetores e autovalores,
- Estatística básica (média, mediana, desvio padrão, testes t
pareado e não pareado, histogramas, entre outros assuntos),
- Uso de planilhas eletrônicas em química (Microsoft Excel),
- Uso do programa Octave e Matlab
- Planejamento Fatorial: Completo e fracionário,
- Proposição de modelos de regressão com planejamento fatorial
(Composto central, Doehlert, Box-Behnken) e planejamento de
misturas,
- Apresentação de exemplos voltados para a produção de
biocombustíveis
- Planejamento fatorial com múltiplas respostas (Desejabilidade e
Derringer Suich)
- Process in Analytical Technology (PAT)
1
Parte introdutória

2
Tratamento dos Erros Aleatórios
 Problema:
Determinar a concentração de ácido acético em uma
amostra de vinagre.
Legislação : mínimo de 4% de ácido acético
Como fazer? Titulação ácido-base

Resultado das Titulações

Lote A = 3,80 Lote B = 4,20%


Devo aprovar o lote B e rejeitar o lote A ?

Se o erro associado A 3,50 a 4,10%


é de ± 0,30% B 3,90 a 4,50%
3
Estatística de Amostragem –
propagação de erros

s  s s
2
g
2
an
2
am
Variância Variância do Variância da
Global procedimento amostragem
analítico

Vamos pensar um pouco - Qual é a variância global para


as seguintes situações?

a) s an  5% e s am  10%
b) s an  1% e s am  10%

4
Sequência Analítica

- Amostragem
- Moagem / homogeneização
(10 min – 2 h)
- Amostra representativa
- Pesagem (3 - 5 min)
- Digestão (30 min a 48 h)
- Diluição (3 – 5 min)
- Medida (2 – 10 min)
5
Fonte de erros em análises químicas

Anal. Methods, 2013, 5, 2914–2915.


Preparo de Amostra

- O melhor preparo de amostra é não ter


que prepará-la (Determinação direta
de Cd em urina por GFAAS)

7
Tipos de Erros
1. Erro Grosseiro

Na titulação da amostra de
vinagre, a viragem não
ocorreu.

O analista esqueceu de
adicionar o indicador !!!!!!!

Outliers Resultados
anômalos
A estatística não se
ocupa desses erros
8
Tipos de Erros
2. Erro Sistemático (determinado)

Faz com que a média de um conjunto de dados seja diferente


do valor aceito. Afeta a exatidão dos resultados.
Ex: na titulação do ácido acético, troca do indicador
fenolftaleína pelo indicador vermelho de metila.

Viragem do vermelho de metila: abaixo de pH 7

Ponto final da
titulação ocorre antes Vinagre parecerá ter
que todo o ácido concentração menor
acético tenha sido que a real
neutralizado

Afetam os resultados sempre na mesma


direção: para mais ou para menos 9
Erros Sistemáticos
TIPOS DE ERROS SISTEMÁTICOS
1. Erros Instrumentais • Uso de equipamentos
volumétricos em temperatura
Causas: imperfeições nos
diferente da de calibração
instrumentos de medida
e instabilidades no seu • Contaminantes nas
suprimento de energia paredes internas dos
fracos

• Distorções na parede
dos frascos devido ao
calor durante a secagem

Forma de eliminação

Calibração
10
Erros Sistemáticos
TIPOS DE ERROS SISTEMÁTICOS
2. Erros de Método
Causa: comportamento Exemplo
físico-químico não ideal
Excesso de
dos sistemas.
reagente
requerido para
• Lentidão de algumas que o
reações indicador
mude de cor
• Possível ocorrência
de reações paralelas
Erros de mais
• Instabilidade de difícil detecção.
algumas espécies Por isso são os
• Não especificidade mais graves dos
erros sistemáticos
de alguns reagentes
11
Erros Sistemáticos
TIPOS DE ERROS SISTEMÁTICOS
Erros de Método - Detecção

1. Análise de materiais de
referência certificados
Avaliar se a diferença é
devido ao erro aleatório ou
uma tendência no método.
Uso de teste estatístico.

2. Análise em paralelo com 3. Através de determinações


método analítico em branco
independente
Deve diferir-se do método 4. Variação do tamanho da
usado o máximo possível. Uso amostra
de teste estatístico.
12
Erros Sistemáticos
TIPOS DE ERROS SISTEMÁTICOS
3. Erros Pessoais
Causa: resultam das
limitações pessoais do
analista • Avaliação da
posição de um
ponteiro ou
• Erros resultantes de
menisco entre as
julgamentos pessoais divisões de duas
escalas
• Avaliação da cor de
uma solução no
ponto final da Erro de pré-julgamento
titulação Tendência a determinar as
leituras na direção da melhora
da precisão ou a um valor
preterido
13
Erros Sistemáticos
EFEITOS SOBRE OS RESULTADOS

1. Erros Constantes • Tornam-se mais perigosos


a medida que o tamanho
Não dependem do
da amostra diminui
tamanho da amostra

Minimização: utilização de amostras maiores o possível

2. Erros Proporcionais • Aumentam ou


Dependem do tamanho diminuem com o
da amostra tamanho da
amostra tomada

Causa comum: presença de interferentes na amostra


14
Controle estatístico do processo
130
Tendências

120
Pb (mg/Kg)

110

100

90

80
0 10 20 30 40 50 60
Medida
15
Tipos de Erros
3. Erro Aleatório (indeterminado)
 Erros sistemáticos eliminados
 Experimento feito com atenção e disciplina

PROCESSO SOB CONTROLE


Novas análises de duas amostras de vinagre do mesmo lote

3,91% 4,01%
Resultados bem parecidos,
Nem tudo estava realmente
mas não idênticos
controlado

16
Tipos de Erros
3. Erro Aleatório (indeterminado)

Causam o maior ou menor espalhamento simétrico dos dados


em torno de um valor central. Em geral, o erro aleatório de
uma medida é refletido por sua precisão.

“Toda medida está sempre afetada por erros.


É impossível realizar uma análise química totalmente
livre de erros ou incertezas.”

17
Erros aleatórios:

1 – Os valores obtidos flutuam, porém tendem a se


concentrar em torno de um certo valor intermediário.

2 – A flutuação em torno do valor central ocorre ao acaso.

18
Exatidão: Está relacionada com o seu erro
absoluto, isto é, com a proximidade do valor
medido em relação ao valor verdadeiro da
grandeza.
Precisão:Está relacionado com a
concordância das medidas entre si.
Medidas precisas e
exatas
Medidas precisas e
inexatas
Medidas imprecisas
e inexatas

Valor verdadeiro

19
Algarismos significativos: Expressa o valor de
determinada grandeza medida
experimentalmente.
Exemplo: Amostra com massa = 10,1519g
-Balança com precisão de 0,1g = 10,1g (3 alg.
Sig.)
-Balança com precisão de 0,0001g =
10,1519g (6 alg. Sig.)
Os zeros a esquerda não são levados em
conta.
Exemplo: 0,013 (2 alg. Sig.)
Cálculos:
2,2 + 0,1145 = 2,3145
Resultado final = 2,3
Regra: considerar o valor com menor número
de alg. Sig.

20
Algarismos significativos: são importantes
quando se fazem operações com valores de
diferentes grandezas medidas com
instrumentos de precisões diferentes.
Arredondamento de números:
- Quando o algarismo seguinte ao último
número a ser mantido é menor que 5, todos
os algarismos indesejáveis devem ser
descartados, e o último número é mantido
intacto.

21
Exemplo:
arredondarpara 2 a.s.
2,14  2,1
arredondarpara 3 a.s.
4,372  4,37
- Quando o algarismo seguinte ao último
número a ser mantido é maior que 5, ou 5
seguido de outros dígitos, o último número é
aumentado de 1, e os algarismos indesejáveis
são descartados.
Exemplo:
arredondarpara 4 a.s.
7,5647  7,565
arredondarpara 2 a.s.
3,5501  3,6
22
- Quando o algarismo seguinte ao último
número a ser mantido é um 5 ou um 5
seguido de zeros, há duas possibilidades:
1) se o último algarismo a ser mantido for
ímpar, ele é aumentado de 1, e o 5
indesejável (e eventuais zeros) é descartado;
2) se o último algarismo a ser mantido for par
(zero é considerado par), ele é mantido
inalterado, e o

23
5 indesejável (e eventuais zeros) é
descartado.
Exemplos:
arredondarpara 2 a.s.
3, 2 50  3, 2
par mantido
arredondarpara 3 a.s.
7,6 3 5  7,6 4
ímpar aumenta
arredondarpara 3 a.s.
8,1 0 5  8,1 0
par mantido

24
Adição e subtração:

12,47  7  19
não tem dígitosà direita expresso de modo similar

1,627  23,1  4,06  106,91  135,7


menor precisão

90  2,14  88
nenhumacasa decimal nenhumacasa decimal

25
Multiplicação e divisão:

6,3 2,14  13,482  13


2a.s. 2a.s.

6,3 2,14  2,943925  2,9


2a.s. 2a.s.

26
Estatística básica

27
Revisão – Estatística básica
Concentrações de Cd (mg/Kg) em lodo de esgoto de uma estação de tratamento
1 3,95 36 4,83 71 4,11 106 3,54 141 3,22 176 5,60
2 3,93 37 4,51 72 4,56 107 3,68 142 2,99 177 5,21
3 3,98 38 4,63 73 4,23 108 3,82 143 3,24 178 5,41
4 3,56 39 4,69 74 4,07 109 4,07 144 3,22 179 5,23
5 3,75 40 4,65 75 5,64 110 4,28 145 4,40 180 4,84
6 3,93 41 4,90 76 6,27 111 3,54 146 4,30 181 4,62
7 3,20 42 4,94 77 5,62 112 3,67 147 4,72 182 4,09
8 3,70 43 4,10 78 5,87 113 3,93 148 4,57 183 4,74
9 3,21 44 4,17 79 5,80 114 4,09 149 4,62 184 4,31
10 3,28 45 4,54 80 5,83 115 3,29 150 4,51 185 4,25
11 3,60 46 4,29 81 3,61 116 3,53 151 4,67 186 6,16
12 3,91 47 4,47 82 3,57 117 3,66 152 4,50 187 6,08
13 4,07 48 4,56 83 3,96 118 4,00 153 5,38 188 6,25
14 3,68 49 4,20 84 3,32 119 3,20 154 4,31 189 6,27
15 4,06 50 4,48 85 3,89 120 3,62 155 4,26 190 3,98
16 4,35 51 4,54 86 3,79 121 3,71 156 4,58 191 3,75
17 4,25 52 4,78 87 4,56 122 4,16 157 4,32 192 3,92
18 3,16 53 4,81 88 4,68 123 4,30 158 4,58 193 3,79
19 3,24 54 4,46 89 4,46 124 3,95 159 4,77 194 4,11
20 4,02 55 4,57 90 4,80 125 4,26 160 4,26 195 3,66
21 4,22 56 4,44 91 4,71 126 3,72 161 4,47 196 4,92
22 4,16 57 4,37 92 4,76 127 3,68 162 4,64 197 4,93
23 3,24 58 4,04 93 4,05 128 3,19 163 5,10 198 4,61
24 3,26 59 3,82 94 4,08 129 3,24 164 5,14 199 5,20
25 3,26 60 4,08 95 4,10 130 4,19 165 4,61 200 4,84
26 2,86 61 4,14 96 4,44 131 4,40 166 4,76 201 4,73
27 2,94 62 4,28 97 4,44 132 3,70 167 4,55 202 4,41
28 2,82 63 5,22 98 4,31 133 3,24 168 4,48 203 4,32
29 3,78 64 5,30 99 5,37 134 3,30 169 4,41 204 4,48
30 4,21 65 5,33 100 5,95 135 2,97 170 3,83 205 5,02
31 2,98 66 5,02 101 5,64 136 2,97 171 4,25 206 4,66
32 3,24 67 5,32 102 5,76 137 3,90 172 4,42 207 4,52
33 3,23 68 5,16 103 5,94 138 4,20 173 4,23 208 6,21
34 4,24 69 4,58 104 6,05 139 3,62 174 5,23
35 4,32 70 4,60 105 3,21 140 3,76 175 5,31
28
Descrição desta população
Intervalos Início Fim Freqüência %
1 2,82 3,25 22 10,6
2 3,25 3,68 18 8,7
3 3,68 4,11 42 20,2
4 4,11 4,55 54 26,0
5 4,55 4,98 38 18,3
6 4,98 5,41 16 7,7
7 5,41 5,84 8 3,8
8 5,84 6,27 10 4,8
Total 208 100

29
Freqüência

0
10
20
30
40
50
2,82 60

1
3,25

2
3,68

3
4,11

4
4,55

Intervalos
5
4,98
Histograma

5,41
7

5,84
8

6,27
30
Média e Variância Amostral

Média

x i Variância
x i 1
amostral
N
N

2
 (x i
2
 x)
V(x)  s  i 1
N 1
31
Média = 4,32 mg/kg

Variância = 0,57 (mg/kg)2

Desvio
Padrão
N
Desvio Padrão =
 (x i
2
 x)
0,76 mg/kg
s i 1
N 1
32
Graus de liberdade
Média = 4,32 mg/kg (208 graus de liberdade)
Valores totalmente independentes

Variância e desvio padrão = 0,57 (mg/kg)2 e


0,76 mg/kg (207 graus de liberdade)

 d   (x
i i
i  x)   xi   x   xi  Nx
i i i

33
Entendendo os Graus de
liberdade (exemplo)
São
independentes

d d^2
1 1,00 -1,00 1,00
2 2,00 0,00 0,00
3 3,00 1,00 1,00
Não são
Média 2,00 independentes (a
Soma d 0,00 soma é conhecida
e igual a 0)
Soma d^2 2,00
DP 0,82
34
Freqüência

0
10
20
30
40
50
60
2,82

1
3,25

2
xs
3,68

3
4,11

4
x

4,55

Intervalos
5
4,98
6

5,41
xs

5,84
8

6,27
35
Distribuição normal
Distribuição Média populacional: 
contínua (ou Variância populacional: 2
Gaussiana)
x N(, 2)
( x )2
1 x distribui-se de
f ( x)dx  e 2 2
dx
 2 acordo com ...

f(x): função de
probabilidade da
variável x

36
Distribuição normal
padronizada
Média populacional:  = 0
Variância populacional: 2 = 1

x N(0, 1)

-3 -2 - 0 + +2 +3 37


Área (dx): Probabilidade de ocorrência de um
valor da variável aleatória num intervalo dx
em torno da média.
μ σ

P(μ  σ  x  μ  σ)   f(x)dx  0 ,6826


μ σ

Isto é, 68,26%
 1,96
P(  1,96  x    1,96 )   f(x)dx  0,95
 1,96

Isto é, 95%
  3
68,26%
P(  3  x    3 )  
 
3
f(x)dx  0,9973

Isto é, 99,73%

-3 -2 - 0 + +2 +338


O nosso exemplo segue uma distribuição normal?
Amarelo
Concentrações de Cd (mg/Kg) em lodo de esgoto de uma estação de tratamento
1
2
3,95
3,93
36
37
4,83
4,51
71
72
4,11
4,56
106
107
3,54
3,68
141
142
3,22
2,99
176
177
5,60
5,21 Entre
3 3,98 38 4,63 73 4,23 108 3,82 143 3,24 178 5,41

xs
4 3,56 39 4,69 74 4,07 109 4,07 144 3,22 179 5,23
5 3,75 40 4,65 75 5,64 110 4,28 145 4,40 180 4,84
6 3,93 41 4,90 76 6,27 111 3,54 146 4,30 181 4,62
7 3,20 42 4,94 77 5,62 112 3,67 147 4,72 182 4,09
8 3,70 43 4,10 78 5,87 113 3,93 148 4,57 183 4,74
9 3,21 44 4,17 79 5,80 114 4,09 149 4,62 184 4,31
10
11
3,28
3,60
45
46
4,54
4,29
80
81
5,83
3,61
115
116
3,29
3,53
150
151
4,51
4,67
185
186
4,25
6,16 145 valores
(69,7%)
12 3,91 47 4,47 82 3,57 117 3,66 152 4,50 187 6,08
13 4,07 48 4,56 83 3,96 118 4,00 153 5,38 188 6,25
14 3,68 49 4,20 84 3,32 119 3,20 154 4,31 189 6,27
15 4,06 50 4,48 85 3,89 120 3,62 155 4,26 190 3,98
16 4,35 51 4,54 86 3,79 121 3,71 156 4,58 191 3,75
17 4,25 52 4,78 87 4,56 122 4,16 157 4,32 192 3,92
18 3,16 53 4,81 88 4,68 123 4,30 158 4,58 193 3,79
19 3,24 54 4,46 89 4,46 124 3,95 159 4,77 194 4,11
20 4,02 55 4,57 90 4,80 125 4,26 160 4,26 195 3,66

Amarelo + Verde
21 4,22 56 4,44 91 4,71 126 3,72 161 4,47 196 4,92
22 4,16 57 4,37 92 4,76 127 3,68 162 4,64 197 4,93
23 3,24 58 4,04 93 4,05 128 3,19 163 5,10 198 4,61
24 3,26 59 3,82 94 4,08 129 3,24 164 5,14 199 5,20
25 3,26 60 4,08 95 4,10 130 4,19 165 4,61 200 4,84
26
27
2,86
2,94
61
62
4,14
4,28
96
97
4,44
4,44
131
132
4,40
3,70
166
167
4,76
4,55
201
202
4,73
4,41 Entre
28 2,82 63 5,22 98 4,31 133 3,24 168 4,48 203 4,32
29 3,78 64 5,30 99 5,37 134 3,30 169 4,41 204 4,48

x  1,96 s
30 4,21 65 5,33 100 5,95 135 2,97 170 3,83 205 5,02
31 2,98 66 5,02 101 5,64 136 2,97 171 4,25 206 4,66
32 3,24 67 5,32 102 5,76 137 3,90 172 4,42 207 4,52
33 3,23 68 5,16 103 5,94 138 4,20 173 4,23 208 6,21
34 4,24 69 4,58 104 6,05 139 3,62 174 5,23
35 4,32 70 4,60 105 3,21 140 3,76 175 5,31

197 valores
(94,7%)

39
Distribuição
normal
padronizada (z)

Padronização

x    z

x
z

Não precisamos calcular
integrais.

40
Exemplo de utilização da tabela z: Qual é a
probabilidade de encontrar uma concentração de Cd
entre 5,38 e 6,25 mg/kg?
x
z
5,38  4,32
 6,25  4,32
z  1,40 z  2,55
0,76 0,76

41
Probabilidade para
encontrar valores de Cd
entre 5,38 e 6,25 mg/kg
= 8,08 – 0,54 = 7,54%

-3 -2 -1 0 +1 +2 +3
z
Z = 2,55
(área = 0,54)
Z = 1,40
(área =8,08)

42
Concentrações de Cd (mg/Kg) em lodo de esgoto de uma estação de tratamento
1 3,95 36 4,83 71 4,11 106 3,54 141 3,22 176 5,60
2 3,93 37 4,51 72 4,56 107 3,68 142 2,99 177 5,21
3 3,98 38 4,63 73 4,23 108 3,82 143 3,24 178 5,41
4 3,56 39 4,69 74 4,07 109 4,07 144 3,22 179 5,23
5 3,75 40 4,65 75 5,64 110 4,28 145 4,40 180 4,84
6 3,93 41 4,90 76 6,27 111 3,54 146 4,30 181 4,62
7 3,20 42 4,94 77 5,62 112 3,67 147 4,72 182 4,09
8 3,70 43 4,10 78 5,87 113 3,93 148 4,57 183 4,74
9 3,21 44 4,17 79 5,80 114 4,09 149 4,62 184 4,31
10 3,28 45 4,54 80 5,83 115 3,29 150 4,51 185 4,25
11 3,60 46 4,29 81 3,61 116 3,53 151 4,67 186 6,16
12 3,91 47 4,47 82 3,57 117 3,66 152 4,50 187 6,08
13 4,07 48 4,56 83 3,96 118 4,00 153 5,38 188 6,25
14 3,68 49 4,20 84 3,32 119 3,20 154 4,31 189 6,27
15 4,06 50 4,48 85 3,89 120 3,62 155 4,26 190 3,98
16 4,35 51 4,54 86 3,79 121 3,71 156 4,58 191 3,75
17 4,25 52 4,78 87 4,56 122 4,16 157 4,32 192 3,92
18 3,16 53 4,81 88 4,68 123 4,30 158 4,58 193 3,79
19 3,24 54 4,46 89 4,46 124 3,95 159 4,77 194 4,11
20 4,02 55 4,57 90 4,80 125 4,26 160 4,26 195 3,66
21 4,22 56 4,44 91 4,71 126 3,72 161 4,47 196 4,92
22 4,16 57 4,37 92 4,76 127 3,68 162 4,64 197 4,93
23 3,24 58 4,04 93 4,05 128 3,19 163 5,10 198 4,61
24 3,26 59 3,82 94 4,08 129 3,24 164 5,14 199 5,20
25 3,26 60 4,08 95 4,10 130 4,19 165 4,61 200 4,84
26 2,86 61 4,14 96 4,44 131 4,40 166 4,76 201 4,73
27 2,94 62 4,28 97 4,44 132 3,70 167 4,55 202 4,41
28 2,82 63 5,22 98 4,31 133 3,24 168 4,48 203 4,32
29 3,78 64 5,30 99 5,37 134 3,30 169 4,41 204 4,48
30 4,21 65 5,33 100 5,95 135 2,97 170 3,83 205 5,02
31 2,98 66 5,02 101 5,64 136 2,97 171 4,25 206 4,66
32 3,24 67 5,32 102 5,76 137 3,90 172 4,42 207 4,52
33 3,23 68 5,16 103 5,94 138 4,20 173 4,23 208 6,21
34 4,24 69 4,58 104 6,05 139 3,62 174 5,23
35 4,32 70 4,60 105 3,21 140 3,76 175 5,31

17 resultados em 208
=8,17%
43
Exercícios
1 - Qual é a probabilidade de encontrar uma
concentração de Cd entre 4,33 e 5,33 mg/kg?

2 – Qual é a probabilidade de encontrar uma


concentração de Cd entre 3,56 e 5,08 mg/kg?

44
Intervalo de confiança para a média
xi  z    xi  z
Exemplo: Qual é a concentração de Cd média
(populacional - ) com 95% de confiança? Imagine
que apenas uma determinação tenha sido efetuada
(por exemplo, a primeira da tabela = 3,95).

3,95 1,96  0,76    3,95  1,96  0,76


3,95 1,96  0,76    3,95  1,96  0,76
2,46    5,44
Nossa concentração média de Cd está entre Nossa média é
2,46 e 5,44 mg/kg (com 95% de confiança) 4,32 mg/kg
45
Testes t

46
Amostragem aleatória em
populações normais

Médias amostras x se distribuem normalmente, com


a mesma média , mas com variância igual a 2/N.

x
A variável aleatória t, definida por t
s
N
segue a distribuição t com N-1 graus de liberdade

s s
x  t N 1     x  t N 1 
N N
47
48
Exemplo: Qual é a concentração de Cd média
(populacional - ) com 95% de confiança? Imagine
que apenas as duas primeiras determinações
tenham sido efetuadas (3,95 e 3,93).

0,0141 0,0141
3,94  12,70621     3,94  12,70621 
2 2

3,81    4,07

49
Exercícios
1 - Qual é a concentração de Cd média
(populacional - ) com 95% de confiança para:

a) as 5 primeiras determinações?
b) as seguintes determinações: 3,95, 3,93, 3,98,
3,56, 3,75, 4,24, 4,32, 4,83, 4,51 e 4,63?
c) as seguintes determinações: 3,95, 3,93, 3,98,
3,56, 3,75, 4,24, 4,32, 4,83, 4,51, 4,63, 3,82,
4,08, 4,14, 4,28, 5,22, 3,96, 3,32, 3,89, 3,79 e
4,56?

50
N = 20

N = 10

N=5

N=2

3,60 3,70 3,80 3,90 4,00 4,10 4,20 4,30 4,40 4,50

4,32
51
Testes para rejeição
de valores

52
Teste Q – Rejeição de valores

Teste para detecção de valores


anômalos (outliers)
xsuspeito  xmaisperto
Qcalculado 
faixa
x1 x2 x3 x4 xmais perto xsuspeito

Faixa (maior – menor)


Dados em ordem crescente

Se Qcalculado > Qtabelado , rejeitar xsuspeito


53
Tabela Q
(N) Q90% Q95% Q99%
2 - - -
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740 * Para N
superior a 10,
7 0,507 0,568 0,680 a abordagem
8 0,468 0,526 0,634 é diferente
9 0,437 0,493 0,598
10* 0,412 0,466 0,568

Fonte: D. B. Rorabacher, Anal. Chem., 1991, 63, 139.


54
Exercício
1 – Os conjuntos de dados abaixo apresentam
concentrações de Mn (% m/m) e Ni (% m/m) de
ligas de aço. Aplique o teste Q nestes conjuntos de
dados para identificar possíveis amostras anômalas.
Medidas Conjunto 1 Conjunto 2
(Mn) (Ni)
1 0,52 9,6
2 0,56 17
3 0,49 13
4 0,54 11
5 0,55 12
6 0,50 11
7 0,53 11
8 0,54 12
9 0,52 10
10 0,52 11
55
Teste Q para rejeição de valores: este teste
rejeita valores críticos com um nível de
confiança de 90%.
Procedimento:
-Coloque os dados em ordem crescente;
-Calcule a diferença entre o maior e o menor
valor (faixa);
-Calcule a diferença (em módulo) entre o
menor valor e o resultado mais próximo;
-Dividir esta diferença em módulo pela faixa.
-Se Q>Q90%, o menor valor é rejeitado;
-Se o menor valor for rejeitado, determine a
nova faixa para os valores remanescentes e
teste o maior valor
-Repita este processo até que o menor e o
maior valor sejam aceitos.

56
Teste de Grubbs
Valor questionável
Média

7 8 9 10 11 12
Valores medidos

valor questionáv el  x
Gcalculado 
sd
Recomendado pela International Standards e pela
American Society for Testing and Materials

57
(N) G95%
4 1,463
5 1,674
6 1,822
7 1,938
8 2,032
9 2,110
10 2,176
11 2,234
12 2,285
15 2,409
20 2,557

58
Validação de um
procedimento
analítico

59
O método Atende a
Validação de
analítico é finalidade?
um método
aceitável? Legislação?

 Especificidade do método
 Linearidade
 Exatidão
 Precisão
 Faixa
 Limite de detecção
 Limite de quantificação
 Robustez
60
 Especificidade do método: é a
capacidade de um método analítico em
distinguir o analito de todo o resto que
possa estar presente na amostra.

 Linearidade: mede o quanto uma curva


de calibração segue uma linha reta,
mostrando que a resposta é
proporcional à quantidade de analito.

61
 Precisão: é a reprodutibilidade de um
resultado, normalmente expressa por
meio de um desvio padrão.

 Faixa: é o intervalo de concentração no


qual a linearidade, a exatidão e a
precisão são aceitáveis.

62
 Limite de detecção: é a menor quantidade de
analito “significativamente diferente” de um
branco.

 Limite de quantificação: é a menor quantidade


que pode ser medida com exatidão razoável.

 Robustez: é a capacidade de um método


analítico não ser afetado por pequenas
variações deliberadamente feitas, nos
parâmetros de operação. Podemos usar
planejamento fatorial!
63
 Exatidão: define a “proximidade do valor
verdadeiro”. Como avaliar?

64
 Avaliação de um material de referência-
padrão (material certificado de
referência).

 Matriz similar àquela da amostra desconhecida

 Teste t não pareado (unpaired)

65
 Comparar resultados provenientes de dois
ou mais métodos analíticos diferentes

 Mesma amostra

 Teste t pareado (paired) para a mesma amostra (teste F)

 Amostras diferentes

 Teste t pareado para amostras diferentes


66
 Analisar um branco (a matriz tem de ser a
mesma da amostras desconhecida) que foi
propositadamente contaminado por uma
quantidade conhecida de analito. Difícil de
obter.

 Níveis de concentração na faixa de 0,5 a 1,5 vez o


valor esperado da concentração da amostra.

67
 Analisar uma amostra que foi
propositadamente contaminada por uma
quantidade conhecida de analito. Viável de
preparar.

 Calcular faixas de recuperações

68
Avaliação numérica da
exatidão

69
Teste t – Não pareado
Aplicado quando um valor aceitável é conhecido
(Exemplo clássico: testes com amostras
certificadas).

x
t
s
N
s s
x  t N 1     x  t N 1 
N N
70
Exemplo
A tabela abaixo mostra as concentrações obtidas de
10 determinações de Pb (réplicas autênticas) em
uma amostras certificada de lodo de esgoto (BCR
144R). A concentração de Pb certificada é 106  4.
Existe diferença significativa ao nível de confiança
de 95% entre os valores obtidos e o valor
certificado?

Medidas Pb (mg/kg)
1 112
2 92
3 94
4 99
5 113
6 100
7 100
8 92
9 98
10 116
71
Abordagem 1

tcalculado = 1,590
102  106 ttabelado com 9 graus de
t  1,590 liberdade = 2,262
9
tcalculado < ttabelado = Não há
10 diferença ao nível de
confiança de 95%

Abordagem 2
9 9
102  (2,262  )    102  (2,262  )
10 10
95,3    108
O intervalo contêm o valor certificado
( = 106), logo não há diferença (ao
nível de confiança de 95%)
72
Opção para comparação

smedido  N  incertezaSRM

CSRM  incertezaSRM  Cmedida  CSRM  incertezaSRM

73
Abordagem 3

9  10  4
27  4

Critérios não atingidos

106  4  102  106  4


102  102  110

74
Exercício
1 – A tabela abaixo mostra as concentrações de Cd e Zn
(todas em mg/kg) em uma amostra certificada de fígado
bovino (SEM 1577b). As concentrações certificadas são
12716 (Zn) e 0,500,03 mg/kg (Cd). Aplique um teste Q
(90%) aos resultados para possível detecção de amostras
anômalas e verifique ser os resultados obtidos são diferentes
(ao nível de confiança de 95%) dos valores certificados.
Medidas Zn Cd
1 118 0,53
2 116 0,54
3 119 0,52
4 120 0,49
5 122 0,49
6 127 0,47
7 114 0,55
8 138 0,44
9 122 0,49
10 127 0,44
75
Teste t – pareado
Aplicado na comparação de métodos sendo um
deles o método oficial e o outro o método a ser
testado.

Fase 1 Amostras iguais Fase 2 Amostras diferentes

Verificar se os
método possuem
Aplicar o teste t
desvios padrões
diretamente
comparáveis
(teste F)

76
Teste t – pareado para amostras iguais
Exemplo
A tabela abaixo mostra as concentrações de Fe
(g/kg) em amostras de medicamentos provenientes
de um mesmo lote.
Experimentos da Fe Fe
mesma amostra (mineralização) (extração)
1 31 32
2 31 31
3 32 31
4 32 31
5 31
6 32
7 31
8 32
9 31
10 32
77
Fe Fe
(miner)
xi1  x1 ( xi1  x1 ) 2 (extração)
xi 2  x2 ( xi 2  x2 ) 2
31 -0,50 0,25 32 0,75 0,56
31 0,25 0,25 31 0,56 0,06
32 -0,50 0,25 31 -0,25 0,06
32 0,25 0,25 31 0,06 0,06
31 0,50 0,25
32 0,25 0,25
31 0,50 0,25
32 0,25 0,25
31 -0,50 0,25
32 0,25 0,25
x  31,5   2,50 x  31,3   0,75
n  10 n4
soma _ quadrado1 2,50
Observação: o
 10  1 
g.l.1 0,27
F  1,11 valor de F é
soma _ quadrado2 0,75 0,25 sempre maior ou
g.l.2 4 1 igual a 1
78
75
79
Fcalculado  1,11 Ftabelado (9,3,95%)  8,81

Fcalculado  Ftabelado

Os dados podem ser


Os dois métodos
combinados para obter
possuem desvios
um desvio padrão
padrões comparáveis
global
80
sp 
 i1 1  i 2 2
( x  x ) 2
 ( x  x ) 2

N1  N 2  2

2,50  0,75
sp   0,52
10  4  2

x1  x2 N1  N 2
t 
sp N1  N 2

31,5  31,3 10  4 O t calculado é menor que


t   0,812 o t tabelado. Não diferença
0,52 10  4 estatística ao nível de
confiança de 95% entre os
dois métodos
ttabelado (12,95%)  2,179
81
Teste t – pareado para múltiplas
amostras
Exemplo
A tabela abaixo mostra as concentrações de Fe
(g/kg) em amostras de medicamentos. As amostras
foram preparadas utilizando uma mineralização com
ácidos concentrados (método comumente utilizado)
e um método proposto utilizando extração com
ácidos diluídos. Verifique se existe uma diferença
significativa ao nível de confiança de 95% entre os
dois métodos.

Amostras Fe Fe
(mineralização) (extração)
1 12 12
2 32 32
3 19 18

82
Amostras Fe Fe Di
(mineralização) (extração)
Di  D ( Di  D ) 2
1 12 12 0 -0,333 0,111
2 32 32 0 -0,333 0,111
3 19 18 1 0,667 0,444

1   0,667
D  0,333

sd 
 i
( D  D ) 2
sd 
0,667
 0,577
N 1 2

D 0,333
t N t 3  1,000
sd 0,577
t calculado (1,000) é menor que o t tabelado
(4,303) com 2 graus de liberdade. Não há diferença
entre os valores 83
Exercício
1 – As tabelas abaixo mostram concentrações de Cd (mg/kg)
em amostras de lodo de esgoto. Estes dados foram obtidos
via extração com ácidos diluídos e mineralização com ácidos
concentrados. Verifique se há diferença (ao nível de 95%)
entre os valores obtidos via extração e mineralização.

Amostras Cd Cd
(mineralização) (extração)
1 5,02 4,06
2 5,13 4,17
3 5,36 4,45
4 5,89 4,81

Amostras Cd Cd
(mineralização) (extração)
1 4,87 4,91
2 4,45 4,81
3 4,56 4,62
4 4,76 5,11
84
Definindo o tamanho da amostra
s
  t N 1 
N
Quantas amostras eu preciso analisar para ter um
erro menor ou igual a 0,20 mg/kg?

s s
  t N 1  t N 1   0,20
N N

s 2
N  (t N 1  )
0,20

85
As seguintes determinações: 3,95, 3,93, 3,98, 3,56,
3,75, 4,24, 4,32, 4,83, 4,51 e 4,63 foram
efetuadas.

x  4,17
sd  0,41

0,41 2
N  (2,262  )
0,20

Deve-se analisar pelo


N  22 menos 22 amostras
86
Planejamento fatorial

87
Facebook.com/planEdenir

Youtube

Caderno de questões
Apoio
• PPGQ/UFSCar (www.ppgq.ufscar.br)
• GAIA (www.gaia.ufscar.br)
• Departamento de Química (www.dq.ufscar.br)
Programas livres: 33 vídeos
Edenir Rodrigues Pereira Filho facebook.com/planEdenir no Youtube

Template
Regression2 superfície

www.ufscar.br www.editora.ufscar.br www.ppgq.ufscar.br www.dq.ufscar.br www.gaia.ufscar.br

www.ufscar.br www.editora.ufscar.br www.ppgq.ufscar.br www.dq.ufscar.br www.gaia.ufscar.br


Planejamento fatorial completo
Edenir Rodrigues Pereira Filho Planejamento fatorial fracionário
Superfície de resposta e gráfico de contorno
Cálculo e visualização de efeitos e contrastes
Programas livres: Avaliação de múltiplas respostas: Desejabilidade
facebook.com/planEdenir Modelos de regressão: Composto central, Doehlert e Box-Behnken

Programas livres: 33 vídeos


Edenir Rodrigues Pereira Filho facebook.com/planEdenir
no Youtube

Regression2 Template
superfície

www.ufscar.br www.editora.ufscar.br www.ppgq.ufscar.br www.dq.ufscar.br www.gaia.ufscar.br

Edenir Rodrigues Pereira Filho

Programas livres: facebook.com/planEdenir


www.ufscar.br www.editora.ufscar.br www.ppgq.ufscar.br www.dq.ufscar.br www.gaia.ufscar.br
2n-k 2n

b  ( XT X)-1 XT Y
Y - Y-
Planejamento Planejamento
fatorial Primeiro Ajuste fino Modelos de
fatorial regressão:
fracionário passo
completo Composto central;
Doehlert;
Número de Número de variáveis Box-Behnken
variáveis (n)  5 Triagem (n) de 2 a 4

85
O que é possível fazer com o livro?
• Planejamento fatorial completo;
• Planejamento fatorial fracionário;
• Cálculo e visualização de efeitos e contrastes; O que é importante?
• Modelos de Regressão: composto central, Doehlert e Box-Behnken;
• Superfície de resposta e gráfico de contorno;
• Avaliação de múltiplas respostas: Desejabilidade.

86
Programas computacionais utilizados no livro
• Microsoft Excel;
• Programa livre (Octave) (Ver instruções de instalação);

Instruções:
https://www.dropbox.com/s/dlbdpyexxi8epyq/Instalacao_Octave.pdf?
dl=0

Octave:
https://www.dropbox.com/s/wibhjyw4tg0md41/Octave-3.2.4_i686-pc-
mingw32_gcc-4.4.0_setup.exe?dl=0

GuiOctave:
https://www.dropbox.com/s/au7031ace7k1oo6/GUIOctave%201.0.14
.exe?dl=0

• Rotina computacional livre (Regression2);

https://www.dropbox.com/s/mh0tjukwtt7qsoj/regression2.m?dl=0

• Visualização de superfície de resposta no Excel (Template


Surface) (Faça o download);

https://www.dropbox.com/s/c3032v1wgnny5oa/template_superf%C3
%ADcie.xls?dl=0 87
Existem versões mais novas
do Octave. Veja:

http://www.octave.org

92
Como fazer?
• Adquira o livro;
• Estude;
• Veja os vídeos no Youtube (Canal: Edenir Pereira Filho,
https://www.youtube.com/channel/UCnFGae0tQxDe2FFyiQB8C3A/feed )
• Bom divertimento!

88
Onde comprar?
• Editora da UFSCar, EdUFSCar
(www.editora.ufscar.br)
• Loja física da EdUFSCar no Campus São Carlos
da UFSCar (50% de desconto para estudantes)

89
Dúvidas?
[email protected]
• Disciplinas Quimiometria I e II do Programa de
pós-graduação em Química da UFSCar
(oferecidas todo primeiro semestre do ano).

90
Apoio
• PPGQ/UFSCar (www.ppgq.ufscar.br)
• GAIA (www.gaia.ufscar.br)
• Departamento de Química (www.dq.ufscar.br)

91
Introdução e
contextualização

97
Reflexões iniciais
Trecho do prefácio do livro do Prof. Bruns
(1996)

Já presenciei isso!!!
98
Por que utilizar
Planejamento Fatorial?
Sistemas em estudo

Variáveis investigadas

Sinergismo Antagonismo
(1 + 1 = 3) (1 + 1 = 0,5)

Economia de tempo, esforços e dinheiro,


sistematizar o trabalho e melhora a
comunicação entre os profissionais
99
Modelos

Mecanísticos: Leis da física...

Empíricos: Modelos locais


(é o que faremos nesta disciplina)

100
Planejar
Projetar experimentos para fornecer
exatamente o que queremos

1a etapa: Pensar (pensar muito!!!)

Qual (s) variável


Que informações (s) influencia (m)
queremos? as informações que
queremos?

101
2a etapa: Executar o planejamento

3a etapa: Validar o modelo


Detalhes:
Fatalmente
Não precisa ser um
precisará de um
estatístico
computador

102
Método Tradicional: uma variável de
cada vez
Senso Comum

 Fixamos um dos fatores (fator A)


 Varia-se outro fator (Fator B) até “descobrir”
qual nível oferece maior resposta.
 Fixamos o Fator B no nível ótimo.
 Variamos o Fator A até obtenção do valor
máximo.

Fim do experimento!
Hora do cafezinho!
103
Estratégia Change-One-Separate-factor-
at-a-Time (COST)

Problemas com essa metodologia

Não percebe interações entre duas variáveis


Não distingue variações aleatórias de efeitos
concretos
Não prevê o que acontece para um
experimento não testado.
Não temos idéia prévia de quantos
experimentos serão necessários para atingir
o objetivo.

104
Estratégia Change-One-Separate-factor-at-a-
Time (COST)

máximo real
30
40
50
60

Otimização do fator B
máximo aparente

Otimização do fator A

Metodologia pseudo-convergente105
Abordagem “Alternativa”
BOM SENSO!

VARIAR TODOS OS FATORES AO


MESMO TEMPO!

PLANEJAMENTO EXPERIMENTAL:
termo geral para designar o
conjunto de técnicas estatísticas
utilizadas para a
experimentação sistemática.

106
Benefícios do Planejamento
Experimental

 PRATICIDADE: uso eficiente do tempo e


dos recursos

 ROBUSTEZ: experimentos planejados


produzem modelos muito mais precisos

 CONFIABILIDADE: auxilia no encontro


de modelos que refletem a realidade
química
107
Estágios do Planejamento Experimental

1. Familiarização (hora das perguntas!)

 Quais são os objetivos ?

 Identifique os fatores, tipos (quantitativos e


qualitativos) e faixa de trabalho

O que é possível experimentalmente,


financeiramente e ambientalmente ?

108
Estágios do Planejamento Experimental
2. Triagem (muitos fatores)

Proporcionam modelos simples do sistema


Identificar quais fatores são importantes
Se estamos trabalhando na região correta (faixa)
O que fazer em seguida.

“20% dos dados (fatores) são responsáveis por


80% da informação” (princípio de Pareto)

3. Encontrando a região “ótima” de trabalho -


Modelagem de Superfície de Resposta (poucos
fatores)
109
Estágios do Planejamento Experimental
(visão geral)

2n-k 2n

b  ( X T X)-1 X T Y
Y - Y-
Planejamento Planejamento
fatorial Primeiro Ajuste fino Modelos de
fatorial regressão:
fracionário passo
completo Composto central;
Doehlert;
Número de Número de variáveis Box-Behnken
variáveis (n)  5 Triagem (n) de 2 a 4

110
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

111
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

112
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

113
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

114
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

115
PROCEDIMENTO PARA REALIZAÇÃO E
INTERPRETAÇÃO DE UM PLANEJAMENTO FATORIAL

116
Primeiro passo: Triagem

Planejamento Planejamento
fatorial ou fatorial
completo fracionário

Número de Número de
variáveis entre 2 e 4 variáveis  5

Quantidade de experimentos: tipicamente de 4 a 16


Antes da realização dos experimentos o conhecimento
sobre os fatores que influenciam o sistema é baixo

117
Planejamento
fatorial completo

118
Vamos fazer um
planejamento e
utilizar o Excel

119
Fazendo um
planejamento e
utilizando o Excel

120
O experimento com os MM’s

Variáveis:
Colher (1 ou 2 colheradas),
Tamanho do recipiente (pequeno e grande)
Operador (homem e mulher)
Cor da colher (branca e laranja)

Resposta:
Somatória dos chocolates
vermelhos (R),
verde (G) e
azul (B)
121
Níveis

Variáveis Baixo Alto

Quantidade de colheradas Uma Duas


Resposta (objetivo):
Recipiente Pequeno Grande coletar a maior
quantidade de
chocolates
Operador Homem Mulher
vermelhos, verdes e
azuis
Cor da colher Branca Laranja

122
Os Experimentos
Exp Colher Recipiente Operador Cor da colher RGB
1 1 Pequeno Homem Branca 5
2 2 Pequeno Homem Branca 12
3 1 Grande Homem Branca 24
4 2 Grande Homem Branca 61
5 1 Pequeno Mulher Branca 10
6 2 Pequeno Mulher Branca 19
7 1 Grande Mulher Branca 28
8 2 Grande Mulher Branca 61
9 1 Pequeno Homem Laranja 7
10 2 Pequeno Homem Laranja 11
11 1 Grande Homem Laranja 34
12 2 Grande Homem Laranja 54
13 1 Pequeno Mulher Laranja 8
14 2 Pequeno Mulher Laranja 14
15 1 Grande Mulher Laranja 28
16 2 Grande Mulher Laranja 61
123
Os Experimentos codificados
Exp Colher Recipiente Operador Cor da colher RGB
1 -1 -1 -1 -1 5
2 1 -1 -1 -1 12
3 -1 1 -1 -1 24
4 1 1 -1 -1 61
5 -1 -1 1 -1 10
6 1 -1 1 -1 19
7 -1 1 1 -1 28
8 1 1 1 -1 61
9 -1 -1 -1 1 7
10 1 -1 -1 1 11
11 -1 1 -1 1 34
12 1 1 -1 1 54
13 -1 -1 1 1 8
14 1 -1 1 1 14
15 -1 1 1 1 28
16 1 1 1 1 61
124
Vídeo explicativo no
Youtube

http://youtu.be/pXBIK97q3qg

125
Entendimento das informações
Quatro Variáveis (Recipiente,
4 Colher, Cor da colher e Operador)

2 Dois níveis (-1 e +1)

Total de 16 experimentos

Possíveis efeitos: 15 + a média


126
Os efeitos
Colher Recipiente Operador Cor da
colher
1 2 3 4

Principais Secundários Terciários Quaternários


(4 efeitos) (1 efeito)
(4 efeitos) (6 efeitos)
1 12 123 1234
2 13 124
14 134
3
23 234
4
24
34

127
Cálculo dos efeitos
Exp Colher RGB
1 -1 5 Efeito da Colher = y+ - y-
2 1 12
3 -1 24
4 1 61
12+61+19+61+11+54+14+61
5 -1 10 Efeito da
6 1 19 Colher = -
8
7 -1 28
8 1 61
5+24+10+28+7+34+8+28
9 -1 7
10 1 11 8
11 -1 34
12 1 54
Efeito da
13 -1 8
Colher
= 37 – 18 = 19
14 1 14
15 -1 28
Efeito positivo !!!
16 1 61
128
Visualização do efeito da variável 1

Experimento

Experimento
Chocolates

Chocolates
coletados

coletados
1 5 2 12
3 24 4 61
5 10 6 19
7 28 8 61
9 7 10 11
11 34 12 54
13 8 14 14
15 28 16 61

Escala codificada -1 Quantidade 1


Valor real 1 de colheradas 2
Média 18 37
Efeito 37 – 18 = 19
129
Cálculo dos efeitos
Efeito do Recipiente = y+ - y-
Efeito do [( 1  24)  ( 1  61)  ( 1  28)  ( 1  61)  ( 1  34)  ( 1  54)  ( 1  28)  ( 1  61)]
=
Recipiente 8 8 8 8 8 8 8 8

1 1 1 1 1 1 1 1
[(  5)  ( 12)  ( 10)  ( 19)  (  7)  ( 11)  (  8)  ( 14)]
8 8 8 8 8 8 8 8
Exp Recipiente RGB
1 -1 5
2 -1 12
Efeito do
Recipiente 44– 11 = 33
3 1 24
=
4 1 61
... ... ...
Efeito positivo !!!
13 -1 8
14 -1 14
15 1 28
16 1 61
130
Visualização do efeito da variável 2

Escala codificada
Valor real
Média
Efeito

3 4 7 8 11 12 15 16 Experimento
44 Grande 1
24 61 28 61 34 54 28 61 Chocolates
coletados
Volume do
recipiente

44 – 11 = 33

1 2 5 6 9 10 13 14 Experimento
11 Pequeno -1
5 12 10 19 7 11 8 14 Chocolates
coletados

131
Vídeo explicativo no
Youtube

http://youtu.be/8UHjmn0ievA

132
Visualização dos efeitos

efeito  y  y
efeito  37  18  19

44
33 3 -0.4 12 2 -3 -1 1 -1 1 -1 2 1 2
40

y  37

30

20
y  18

10
-1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1
Colher Recipiente Operador Cor da colher (12) (13) (14) (23) (24) (34) (123) (124) (134) (234) (1234)
(1) (2) (3) (4)

133
Visualização do efeito da interação
das variáveis 1 e 2

-1 1 11
Grande
24, 28, 61, 61,
34, 28 54, 61 Média nível
alto ( Y)
Volume do
recipiente

33 – 21 = 12
Média nível
baixo ( Y- )
5, 10, 12, 19,
7, 8 11, 14
Pequeno
-1 -1 Quantidade 1 -1
1 de colheradas 2

134
Visualização do efeito da interação
das variáveis 1, 2 e 3
-1 1 1 1 1 1
28, 28 61, 61

-1 1 -1 1 1 -1 Y  28
Grande 61, 54
24, 34
Y  27
Volume do
recipiente

10, 8 19, 14
-1 -1 1 1 -1 1

Pequeno 5, 7 12, 11
-1 -1 -1 1 -1 -1
Efeito = 28 – 27 = 1
Quantidade
1 2
de colheradas
135
Visualização do efeito da interação
das variáveis 1, 2, 3 e 4
Nível baixo Nível alto
Média = 26 Média = 28
-1 1 1 1 1 1 1 -1 -1 1 1 -1 1 1 1 1
28 61 28 61

-1 1 -1 -1 1 1 -1 1 -1 1 -1 1 1 1 -1 -1
Grande 54 Grande
24 34 61
Volume do

Volume do
recipiente

recipiente
-1 -1 1 -1 10 14 1 -1 1 1 -1 -1 1 1 8 19 1 -1 1 -1

Pequeno 7 12 5 11
Pequeno
-1 -1 -1 1 1 -1 -1 -1 -1 -1 -1 -1 1 -1 -1 1
Quantidade Quantidade
1 2 1 2
de colheradas de colheradas

Efeito = 28 – 26 = 2

136
Frequência Visualização dos efeitos

23 24 13
34 123 134
124 234 1234

14 4 3 Interação colher
e recipiente (12) Colher (1) Recipiente (2)

-5 0 5 10 15 20 25 30
Efeitos

137
Visualização dos efeitos
% de cada
ID Efeito Efeito2
Efeito Somatória dos
14 -3 9 Efeitos ao
23 -1 1
quadrado: =1630
34 -1 1
% de cada Efeito:
124 -1 1
4 0 0 Efeito 2 (por exemplo) =
123 1 1 (1089/1630)x100 = 67%
±2%
234 1 1
24 1 1
13 2 4
134 2 4
1234 2 4
3 3 9

12 12 144 9
1 19 361 22 98%
2 33 1089 67
138
Vídeo explicativo no
Youtube

http://youtu.be/m4b8AayadS8

139
Visualização dos efeitos
ID Efeito ID Efeito

1 19 14 -3

2 23 -1
33
3 34 -1
3

Ordem crescente
Ordenados pela

4 124 -1
0
identificação

12 4 0
12
123 1
13 2
234 1
14 -3
24 1
23 -1
13 2
24 1
134 2
34 -1
1234 2
123 1
3 3
124 -1
12 12
134 2
234 1 19
1
1234 2 2 33
140
Visualização dos efeitos
ID Efeitos Região de probabilidade Ponto Central Z
cumulativa (%)
Início Fim
14 -3 0,000 0,067 0,033 -1,83
23 -1 0,067 0,133 0,100 -1,28
34 -1 0,133 0,200 0,167 -0,97
124 -1 0,200 0,267 0,233 -0,73
4 0 0,267 0,333 0,300 -0,52
123 1 0,333 0,400 0,367 -0,34
234 1 0,400 0,467 0,433 -0,17
24 1 0,467 0,533 0,500 0,00
13 2 0,533 0,600 0,567 0,17
134 2 0,600 0,667 0,633 0,34
1234 2 0,667 0,733 0,700 0,52
3 3 0,733 0,800 0,767 0,73
12 12 0,800 0,867 0,833 0,97
1 19 0,867 0,933 0,900 1,28
2 33 0,933 1,000 0,967 1,83
141
Visualização dos efeitos com
gráficos de probabilidade normal

0,0
8
-0,17 0,17
7
-0,34 0,34
-0,52 0,52

6 -0,73 0,73

5
-0,97 0,97

-1,28 1,28
3

2
Z=-1,83 -1,83
1

0
0,033

0,167

0,567

0,833

0,967
0,1

0,3

0,7
0,43

0,9
0,233

0,367

0,633

0,767
0,5

142
143
Visualização dos efeitos
Gráficos normais
2
95

1
12
3
70 1234
Probabilidade (%)

134
13
24
40 234
123
4
124
34
10 23

14

1
-5 0 5 10 15 20 25 30 35 40
Efeito
144
Visualização dos efeitos
Gráficos normais
2
2

1
1 12
3
1234
134
13
0 24
z

234
123
4
124
-1 34
23

14
-2
-5 0 5 10 15 20 25 30 35 40
Efeito 145
Visualização dos efeitos
O que é realmente importante
2
2

1
1 12 Variáveis
3
1234
importantes
134
13
0 24
z

234
123
4 Variáveis
124
34
insignificantes
-1
(apenas ruído
23
experimental)
14
-2
-5 0 5 10 15 20 25 30 35 40
Efeito 146
Vídeos explicativos no
Youtube

http://youtu.be/6G4yC3Dpg00

http://youtu.be/gvk8tLoWqZE

147
Resumo
 Cálculo do efeito: Y+ - Y-
 Visualização dos efeitos com
gráficos de probabilidade

 Eliminação da variáveis menos


importantes (triagem)

148
Entendimento das informações
Duas Variáveis (Recipiente e
2 Colher)
2 Dois níveis (-1 e +1)

Nosso planejamento 24 “virou”


um 22 com 4 réplicas

149
Re-arranjo dos dados
Exp Colher Recipiente Operador Cor da colher RGB
1 -1 -1 -1 -1 5
2 1 -1 -1 -1 12
3 -1 1 -1 -1 24
4 1 1 -1 -1 61
5 -1 -1 1 -1 10
6 1 -1 1 -1 19
7 -1 1 1 -1 28
8 1 1 1 -1 61
9 -1 -1 -1 1 7
10 1 -1 -1 1 11
11 -1 1 -1 1 34
12 1 1 -1 1 54
13 -1 -1 1 1 8
14 1 -1 1 1 14
15 -1 1 1 1 28
16 1 1 1 1 61
150
Re-arranjo dos dados
Exp Colher Recipien RGB
te
R1 1 -1 -1 5
2 1 -1 12 R1
3 -1 1 24 R1
R1 4 1 1 61
R2 5 -1 -1 10
6 1 -1 19 R2
7 -1 1 28 R2
R2 8 1 1 61
R3 9 -1 -1 7
10 1 -1 11 R3
11 -1 1 34 R3
R3 12 1 1 54
R4 13 -1 -1 8
14 1 -1 14
R4
15 -1 1 28 R4
R4 16 1 1 61 151
Re-arranjo dos dados

1 2
Exp Colher Recipiente RGB Média 1 2 12
1 -1 -1 5 10 7 8 8 -8 -8 8
2 1 -1 12 19 11 14 14 14 -14 -14
3 -1 1 24 28 34 28 29 -29 29 -29
4 1 1 61 61 54 61 59 59 59 59
Soma 37 66 24
Efeito 19 33 12

152
Vídeo explicativo no
Youtube

http://youtu.be/qkaFujSxwAo

153
Interpretação dos dados
24,28,34,28 : x  29 61,61,54,61: x  59

5,10,7,8 : x  8 12,19,11,14 : x  14
Normalizado -1 1
Colher
Real 1 2
8  29 14  59
Médias y   19 y   37
2 2
Efeito da y  y  37  18  19
colher
154
Interpretação dos dados
Grande 1
24,28,34,28 : x  29 61,61,54,61: x  59
Recipiente

5,10,7,8 : x  8 12,19,11,14 : x  14
Pequeno -1
Real Normalizado

8  14 29  59
Médias y   11 y   44
2 2
Efeito do y  y  44  11  33
recipiente
155
Interpretação dos dados
-1 1
1 1
24,28,34,28 : x  29 61,61,54,61: x  59

Recipiente

5,10,7,8 : x  8 12,19,11,14 : x  14
-1 -1
-1 1
Colher
29  14 8  59
Médias yˆ    22 yˆ    34
2 2
Efeito de interação yˆ  yˆ  34  22  12
colher e recipiente  
156
Cálculo da variância e dos erros
Variância (v1s21 + v2s22 + ... + vms2m)
= s2 =
ponderada (v1 + v2 + ... + vm)

vi = n – 1 = número de graus de liberdade de s2i

s = s2

s = estimativa do desvio padrão = erro experimental

157
Re-arranjo dos dados (voltando aos MM’s)
1 2
Exp Colher Recipiente RGB n v var
1 -1 -1 5 10 7 8 4 3 4
2 1 -1 12 19 11 14 4 3 13
3 -1 1 24 28 34 28 4 3 17
4 1 1 61 61 54 61 4 3 12

Variância (3 x 4) + (3 x 13) + (3 x 17) + (3 x 12)


= = 12
ponderada 3 + 3 + 3 + 3

s = 12 = 3,4

y2 = ai2 i2


y2 = Variância

158
Erro padrão dos efeitos – s (efeito)
2 2 2 2
Variância de um 12 1 1 1 1
= x - ++ +- + + =
efeito ^
V(efeito) 4 2 2 2 2

12 4
Cada efeito 4 Coeficientes (a) x = 2,9
4 4
possui n = 4 = -1/2 a +1/2

s(efeito) = 2,9 = 1,7

Variância de um efeito = 2,9

Erro padrão dos efeitos = 1,7

Teste t (95%, 12 graus de liberdade)


t tabelado = 2,179
Valor crítico (intervalo de confiança) = (1,7 x 2,179) = 3,7
159
Ou: erro padrão dos efeitos – s (efeito)

2 ErroExperiment al
ErroEfeito 
k Número de
n2 variáveis
Número de
réplicas

Assim teremos:

2  3,4
ErroEfeito   1,7
4 2 2

160
Visualização dos efeitos
ID Efeito ID Efeito

1 19 14 -3

2 23 -1
33
3 34 -1
3

Ordem crescente
Ordenados pela

4 124 -1
0
identificação

12 4 0
12
13 2
123 1 Valor
14 -3
234 1
crítico
24 1
23 -1 = 3,7
13 2
24 1
134 2
34 -1
1234 2
123 1
3 3
124 -1
12 12
134 2
234 1
1 19 Maiores
1234 2 2 33
161
Vídeo explicativo no
Youtube

http://youtu.be/C9ld_7VX5M0

162
Visualizando os dados
1
ID Efeito Coeficientes

Recipiente
1 19 9
Média
2 33 17 geral = 27
12 12 6
-1
-1 1
Colher
Metade
dos
efeitos

y = 27 + 9x1 + 17x2 +6x1x2


Colher CR
Recipiente
163
Visualizando os dados
Superfície de respostas

Grande
(+1) Duas (+1)

Pequeno Uma (-1)


(-1)
164
Verificando o modelo
y = 27 + 9x1 + 17x2 +6x1x2
Colher CR
Recipiente
x1 e x2 = 1, y = 27 + (9x1) + (17x1) +(6x1x1)= 59
x1 e x2 = -1, y = 27 + (9x-1) + (17x-1) +(6x-1x-1)= 7
1 2
Exp Colher Recipiente RGB Média 1 2 1
1 -1 -1 5 10 7 8 8 -8 -8
2 1 -1 12 19 11 14 14 14 -14 -
3 -1 1 24 28 34 28 29 -29 29 -
4 1 1 61 61 54 61 59 59 59 5
165
Visualizando os dados
Gráfico de contornos
Grande
1 55
(+1)
0.8 50

0.6 45

0.4
40
Recipiente

0.2
35
0
30
-0.2
25
-0.4
20
-0.6
15
-0.8
10
Pequeno -1
(-1) -1 -0.5 0 0.5 1
Uma (-1) Duas (+1)
Colher 166
Exercício (Excel)
Vídeos explicativos no
Youtube

http://youtu.be/N5Gfjxoyfx0

http://youtu.be/I2BzP8l2lLo

http://youtu.be/gP7H99huqVw

167
Um exemplo

168
Problema
Produção de microesferas ocas de hidroxiapatita (HA)

• Dispositivo de liberação controlada (Controlled-delivery devices)


• Uso em medicina (tratamento de câncer)...

169
Produção desses materiais
 Vidro borato (%): 15CaO, 10,63Li2O, 74,37B2O3
 Misturado com K2HPO4 (Monohidrogeno fosfato de
potássio)

Quais variáveis afetam tudo isso?

Variáveis o Temperatura
independentes o Concentração de K2HPO4
o pH

Variáveis
numéricas
170
O que deve ser monitorado?

• Área superficial
Variáveis • Tamanho do poro
dependentes • d/D

171
Detalhes da produção do material
O núcleo do vidro
continua dissolvendo
Ca2+ e outros íons são enquanto ACP é
liberados enquanto o convertido em HA
vidro dissolve Esfera
HA porosa
ACP ACP
Núcleo
Vidro
do HA nanoestruturada
borato
vidro
Vidro borato
contendo CaO 3-
Esfera
PO4 e OH- reagem oca
em solução de com Ca2+ para
fosfato formar um filme de
fosfato de cálcio Dependendo da
amorfo (ACP) na composição do
superfície vidro, HA oca ou
porosa é
formada

172
Voltando ao nosso problema?
Produção de HA oca

Variáveis que podem influenciar:


Temperatura (V1)
Concentração de K2HPO4 (V2)
pH (V3)

Níveis testados:
• V1 = 37 e 60 oC
• V2 = 0,02 e 0,25 mol/L
• V3 = 9 e 12

173
Quantas combinações podemos ter?
Três variáveis

23 = 8 possíveis combinações

Dois níveis
Níveis

Variáveis Baixo Alto

Temperatura 37 60 Respostas
(objetivo): Maiores
Concentração 0,02 0,25 valores de área
superficial (AS),
pH 9 12 poro (TP) e d/D

174
Os Experimentos

AS
Ordem Exp Temperatura Concentração pH TP (nm) d/D
(m2/g)
5 1 37 0,02 9 101 15 0,61

2 2 60 0,02 9 82 10 0,34

6 3 37 0,25 9 127 19 0,36

1 4 60 0,25 9 145 13 0,19

3 5 37 0,02 12 89 12 0,55

8 6 60 0,02 12 78 8 0,37

4 7 37 0,25 12 123 17 0,34

7 8 60 0,25 12 140 12 0,14

Variáveis Respostas

175
Caracterização dos produtos gerados

Difratograma
de raio-x

Padrão de
HA

176
Caracterização dos produtos gerados

Infravermelho

177
Caracterização dos produtos gerados

Microscopia
Eletrônica de
varredura
(elétrons
retroespalhados)
As tonalidades
diferentes indicam
composição
distinta
178
Microscópio Eletrônico de Varredura (MEV)

168
Interação do feixe de elétrons com a amostra

169
Caracterização dos produtos gerados

Microscopia
Eletrônica de
varredura
(imagens
provenientes da
sonda de raios-x)

170
Caracterização dos produtos gerados

Microscopia Eletrônica de varredura dos materiais


gerados

182 171
Os Experimentos

AS
Ordem Exp Temperatura Concentração pH TP (nm) d/D
(m2/g)
5 1 -1 -1 -1 101 15 0,61

2 2 1 -1 -1 82 10 0,34

6 3 -1 1 -1 127 19 0,36

1 4 1 1 -1 145 13 0,19

3 5 -1 -1 1 89 12 0,55

8 6 1 -1 1 78 8 0,37

4 7 -1 1 1 123 17 0,34

7 8 1 1 1 140 12 0,14

Variáveis
codificadas

172
Como verificar a importância
dessas variáveis?

Ou como podemos estabelecer


uma escala de importância?

173
Efeitos
82  145  78  140
Média _ alto   111
4 Efeito _ Temp  111110  1
AS 101 127  89  123
Exp Temperatura Média _ baixo   110
(m2/g) 4
Efeito = 134-88 = 46
1 37 101

2 60 82 134 134
3 37 127

4 60 145 125

5 37 89
114

AS (m2/g)
6 60 78 115
111
7 37 123
106 110 108
8 60 140

96,0

88
87,0
37 60 0,02 0,25 9 12
V1 V2 V3
(T) (mol/L) (pH)

Variáveis 174
Graficamente temos

Escala codificada
Valor real
Média
Efeito

134 0,25 1
Concentração
(V2)

134 – 88 =
46

88 0,02 -1

Escala codificada -1 Temperatura 1


Valor real 37 (V1) 60
Média 110 111
Efeito 111 – 110 = 1
175
Juntando as coisas! Interações

-1 1 11
0,25
127 145
123 140
Concentração Média nível
(V2) alto ( Y)

119-103 = 16
Média nível
baixo ( Y- )
101 82
89 78
0,02
-1 -1 Temperatura 1 -1
37 (V1) 60

176
Juntando mais coisas! Mais interações

-1 1 1 1 1 1
123 140

-1 1 -1 1 1 -1 Y  110
12
127 145
Y  112
pH (V3)

89 78
-1 -1 1 1 -1 1

9 101 82
-1 -1 -1 1 -1 -1
Temperatura
37 60
(V1)
Efeito 123 = 110 – 112 = -2

177
Conclusão

1,3 46 -6,3 16 1,8 1,8 2,3

23

178
5
0
5
0
5
0
5
0
5
0
5
0
0
Histograma
B

Isso é atípico! Tenho


que dar importância
B
-10
-5
0
5
10
15
20
25
30
35
40
45
50
Efeitos

Isso é comum. É importante,


mas não está apresentando
efeitos altos
179
Estabelecendo um modelo

Variáveis Baixo Alto

 Temperatura 37 60

Concentração 0,02 0,25

pH 9 12

180
Estabelecendo um modelo

Efeito = 46

Efeito = 16
Média de todos
os resultados

23

AS  111 23Concentração  8Temp  Conc

Metade do efeito

Por que isso?


181
AS (m2/g)
Estabelecendo um modelo

182
Verificando o modelo
Ex Temperatur Concentraç AS
Ex Temperatur Concentraç AS
p a ão (m2/g)
p a ão (m2/g)
1 -1 -1 101 89
1 -1 -1 101
2 1 -1 82 78
2 1 -1 82
3 -1 1 127 123
3 -1 1 127
4 1 1 145 140
4 1 1 145
AS  111 (23  1)  (8  1 1)
5 -1 -1 89

6 1 -1 78
AS  96
Reais de 89 a 101
7 -1 1 123
8 1 1 140 89 95 101

AS  111 (23  1)  (8 11)


AS  142
Reais de 140 a 145

140 142,5 145


183
Calma, são três respostas
Efeitos para o PS

-0,30

-0,25

-0,20

-0,15

-0,10

-0,05

0,00
B
1 (Temp)
2 (Conc)
B
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
Efeitos

Efeitos para o d/D 1 (Temp)

2 (Conc)
B
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
-0,30

-0,25

-0,20

-0,15

-0,10

-0,05

0,00
Efeitos 184
Modelo para o PS
PS  13,3  2,5Temperatura  2Concentração
PS (nm)

185
Modelo para o d/D
d / D  0,363  0,103Temperatura  0,105Concentração
d/D

186
Revendo as condições

Variáveis Baixo Alto

 Temperatura 37 ??? 60

Concentração 0,02 ??? 0,25

pH 9 12

Testar uma condição


intermediária (compromisso)

187
O que os autores do trabalho fizeram?
Primeiro experimento extra efetuado

Variáveis Baixo Alto

 Temperatura 37 60

Concentração 0,02 0,10 0,25

pH 9 12
-1 0 1
-0,3
AS  111 23Concentração  8Temp  Conc PS  13,3  2,5Temperatura  2Concentração

AS  111 (23  0,3)  (8  1 0,3) PS  13,3  (2,5  1)  (2  0,3)


AS  107 PS  15,2

AS real = 108 (erro relativo de 2%) PS real = 17 (erro relativo de 11%)

d / D  0,363  0,103Temperatura  0,105Concentração


d / D  0,363  (0,103 1)  (0,105 0,3)
Erro médio = 7%
d / D  0,498
d/D real = 0,54 (erro relativo de 8%) 188
O que os autores do trabalho fizeram?
Segundo experimento extra efetuado

Variáveis Baixo Alto

 Temperatura 25 37 60

 Concentração 0,02 0,25

pH 9 12
-2 -1 0 1
-0,3
AS  111 23Concentração  8Temp  Conc PS  13,3  2,5Temperatura  2Concentração

AS  111 (23  1)  (8  2  1) PS  13,3  (2,5  2)  (2 1)


AS  118 PS  20,4

AS real = 101 (erro relativo 16%) PS real = 20 (erro relativo de 2%)

Por que os erros d / D  0,363  0,103Temperatura  0,105Concentração


relativos aqui foram
na média maiores do d / D  0,363  (0,103 2)  (0,1051)
Erro médio = 14%
que aqueles do d / D  0,467
primeiro
experimento? d/D real = 0,62 (erro relativo de 25%) 189
190
Resumo
 Proposição de modelos: coeficiente
é a metade do efeito

 Visualização dos modelos utilizando


superfície de resposta e gráficos de
contorno

202
Planejamento
fatorial fracionário

203
Planejamentos Fracionários
Quando as variáveis são muitas
7 fatores  27 = 128 ensaios

Número de efeitos principais e de interações dado em


função do número de fatores, k.

Ordem
k 1ª 2ª 3ª 4ª 5ª 6ª 7ª Nº de fatores
3 3 3 1 --- --- --- ---
4 4 6 4 1 --- --- --- Chance de
5 5 10 10 5 1 --- --- um ou mais
6 6 15 20 15 6 1 --- fatores serem
significativos
7 7 21 35 35 21 7 1

204
Planejamentos Fracionários
Importância dos efeitos

Efeitos de primeira ordem: 1 2 3 4


Efeitos de segunda ordem: 12 13 14 23 24 34

Efeitos de terceira ordem: 123 124 134 234

Efeitos de quarta ordem: 1234

205
Planejamentos Fracionários
Como funcionam?

Exemplo: Estudo da atividade da enzima fosfatase alcalina

Fator Unidade Nível


-1 +1
sulfato de zinco (Z) mol dm-3 40 80

sulfato de magnésio (M) mol dm-3 1,50 2,50

pH (P) - 10,0 10,7

p-nitrofenil fosfato dissódico (D) mmol dm-3 10 20

2-amino-2-metil-1-propanol (A) mol dm-3 0,20 0,60

25 = 32 experimentos 206
1 2 3 4 5
Exp. Z M P D A Atividade (UI)
1 -1 -1 -1 -1 -1 109
2 1 -1 -1 -1 -1 113
3 -1 1 -1 -1 -1 103
4 1 1 -1 -1 -1 113
5 -1 -1 1 -1 -1 103
6 1 -1 1 -1 -1 104
7 -1 1 1 -1 -1 106
8 1 1 1 -1 -1 123
9 -1 -1 -1 1 -1 119
10 1 -1 -1 1 -1 146
11 -1 1 -1 1 -1 111
12 1 1 -1 1 -1 143
13 -1 -1 1 1 -1 116
14 1 -1 1 1 -1 145
15 -1 1 1 1 -1 110
16 1 1 1 1 -1 148
17 -1 -1 -1 -1 1 106
18 1 -1 -1 -1 1 120
19 -1 1 -1 -1 1 113
20 1 1 -1 -1 1 115
21 -1 -1 1 -1 1 109
22 1 -1 1 -1 1 117
23 -1 1 1 -1 1 105
24 1 1 1 -1 1 115
25 -1 -1 -1 1 1 96
26 1 -1 -1 1 1 128
27 -1 1 -1 1 1 95
28 1 1 -1 1 1 127
29 -1 -1 1 1 1 99
30 1 -1 1 1 1 131
31 -1 1 1 1 1 92
32 1 1 1 1 1 132 207
1 20,5 123 2,3
2 -0,6 124 0,6
3 -0,1 125 -2,4
4 10,3 134 0,6
5 -7,0 135 0,1
145 0,5
12 2,1 234 -1,0
13 1,4 235 -3,0
14 12,3 245 1,6
15 0,8 345 0,9
23 1,5
24 -2,1 1234 -0,8
25 -0,9 1235 0,5
34 1,1 1245 1,6
35 0,1 1345 0,1
45 -10,3 2345 1,5

12345 0,0
208
1

95 14
4
123
12
1245
Probabilidade (%)

245
2345
23
70 13
34
345
15
134
124
1235
145
1345
40 135
35
12345
3
2
1234
25
234
24
125
10
235
5

45
1
-12 -8 -4 0 4 8 12 16 20 24

Efeitos 209
Meia fração
1 2 3 4 1234
Exp. Z M P D A Atividade (UI)
17 -1 -1 -1 -1 1 106
2 1 -1 -1 -1 -1 113
3 -1 1 -1 -1 -1 103
20 1 1 -1 -1 1 115
5 -1 -1 1 -1 -1 103
22 1 -1 1 -1 1 117
23 -1 1 1 -1 1 105
8 1 1 1 -1 -1 123
9 -1 -1 -1 1 -1 119
26 1 -1 -1 1 1 128
27 -1 1 -1 1 1 95
12 1 1 -1 1 -1 143
29 -1 -1 1 1 1 99
14 1 -1 1 1 -1 145
15 -1 1 1 1 -1 110
32 1 1 1 1 1 132

210
1 22,0 12 3,0
2 -0,5 13 3,0
3 1,5 14 9,3
4 10,8 15 -0,3
5 -7,8 23 2,0
24 -2,3
25 -0,3
34 -1,3
35 0,8
45 -8,0

211
98
1
95

90 4
Probabilidade (%)

14
80
13
70 12
23
60 3
50 35
25
40 15
30 2
34
20
24

10 5

5
45
2
-10 -5 0 5 10 15 20 25

Contrastes
Efeitos
212
Comparação dos efeitos
Fatorial completo 25 Fatorial fracionário 25-1

1 20,5 123 2,3 1 22,0 12 3,0


2 -0,6 124 0,6 2 -0,5 13 3,0

Meia Fração
3 -0,1 125 -2,4 3 1,5 14 9,3
4 10,3 134 0,6 4 10,8 15 -0,3
5 -7,0 135 0,1 5 -7,8 23 2,0
145 0,5 24 -2,3
12 2,1 234 -1,0 25 -0,3
13 1,4 235 -3,0 34 -1,3
14 12,3 245 1,6 35 0,8
15 0,8 345 0,9 45 -8,0
23 1,5
24 -2,1 1234 -0,8
25
34
-0,9
1,1
1235
1245
0,5
1,6 Think!
35 0,1 1345 0,1
45 -10,3 2345 1,5

12345 0,0

213
Planejamentos Fracionários
Como construir uma fração meia?
4 fatores  24 = 16 ensaios fração meia: 24-1 = 8 ensaios

1. Construímos um planejamento 23 completo para os fatores 1, 2 e 3


2. Atribuímos ao fator 4 os sinais do produto das colunas 1, 2 e 3
I 1 2 3 4
+ - - - -
+ + - - +
+ - + - +
+ + + - -
+ - - + +
+ + - + -
+ - + + -
+ + + + +

214
Planejamentos Fracionários

2 3 4 5 6 1
7 2
8 39 10
4 11
5 12
6 13
7 14
8
2 13 2
4 12
3 123
13 14
1 23
2 24
3 34
4 123
12 124
13 134
14 234
23 1
-1
1 -1 -1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1
-1
2 -1
1 -1
1 -1 -1
1 1 -1
1 -1 -1
1 -1
1 -1 -1
1 1
3
1 -1 1 -1 1 -1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
1 -1
4
1 -1
1 -1
1 -1
1 -1 -1
1 -1
1 -1 -1
1 -1
1 -1 -1
1 -1
1
-1
5 -1
1 -1
1 1 -1
1 -1 -1 -1
1 1 1 -1
1 -1 -1
-1
6 1 -1 -1
1 -1
1 -1
1 -1 1 -1 -1 1 -1 -1
1
7
1 -1
1 -1
1 -1
1 -1 -1
1 1 -1
1 -1 -1 -1
1 1 -1
1
8
1 1 1 1 1 1 1 1 1 1 1 1 1

215
Planejamentos Fracionários

1 2 3 4 51 62 73 84 95 6
10 1
123 1 2 3 123
4 121 132 143 4
23 12
24 13
34 11
1
-1 -1 -1 -1 -1 -1
1 -1
1 -1
1 -1
1 1 1 -
12 1 -1 -1 1 -11 -1 -1
1 1 -1 -1
13 -1 1 -1 1 -1 1 -1 1
-1 -1
1 1
-1 -
4
-1 1 1 -1 -1 1 -11 -1 -1 -11 -1
1 -
15 -1 -1 1 1 -1
1 -1 -11 1
-1 -11 -1
1 -
6
-1 1 -1 1 -1 -11 -1
1 -11 -1 -1
1 1
-1 -
7
-1 -1 1 1 -1 -1 -11 1 -1
1 -1 -1 -
18 1 1 1 1 1 1 1 1 1 1

216
Planejamentos Fracionários
4 = 123 1 . I (elemento identidade)
44 = 1234 → I = 1234 I = 11 = 22 = 33 = 44

2 . Multiplicação comutativa e
associativa
1 = 234 l1 = l234 → 1 + 234 123 = (1)(23) = (23)(1) = (12)(3) =
321 = (2)(31) = ...
2 = 134 l2 = l134 → 2 + 134
3 = 124 l3 = l124 → 3 + 124 Relação geradora ou geratriz
4 = 123 l4 = l123 → 4 + 123
12 = 34 l12 = l34 → 12 + 34 PADRÕES DE
13 = 24 l13 = l24 → 13 + 24 CONFUNDIMENTO
14 = 23 l14 = l23 → 14 + 23
I = 1234 lI = M +½ (1234)

217
Exercício (Excel)
Vídeos explicativos no
Youtube
http://youtu.be/SDXPHy8sw-Q
http://youtu.be/xI9CcT8GpEQ
http://youtu.be/gVGsSoRa1ok
http://youtu.be/o_pihqbQmLc
http://youtu.be/gMrQbno7CxQ
http://youtu.be/8kNRPd_Nv44

218
Resumo
 Cálculo dos contrastes: Y+ - Y-
 Visualização dos contrastes por
meio de gráficos de probabilidade

 Eliminação das variáveis menos


importantes

219
Proposição de
modelos

220
Alternativa #1:
Proposição de
modelos usando
uma curva de
calibração

221
Um exemplo bem simples
ICP OES
[Ca] mg/L r1 r2
P1 4,24 11.743 11.470
P2 6,02 16.854 15.962
P3 6,90 19.183 18.408
P4 8,13 22.556 22.802
P5 10,18 27.774 28.463

Questões:
1- Os dois coeficientes são
significativos?
2- A reta “passa” pelo zero?
3- O que faço com as
réplicas? Calculo a média?
4- O R2 está bom? Ele
poderia ser melhor?
5- Desconsidero o intercepto,
pois quando a concentração
é zero o sinal deve ser zero? b = (XtX)-1 Xty
222
Mínimos quadrados
320
Abs x 1000

280

yi
240 ei
^
yi

200
9 Gi 12 15 18
223
Revendo os dados

[Ca] mg/L Sinal 30000

P1 4,24 11743 25000


P1 4,24 11470
20000
P2 6,02 16854

Sinal analítico
P2 6,02 15962 15000
P3 6,90 19183
10000
P3 6,90 18408
P4
P4
8,13
8,13
22556
22802
5000

0
y  2803x  364
P5 10,18 27774 0,00 2,00 4,00 6,00 8,00 10,00 12,00
P5 10,18 28463 Concentração de Ca (mg/kg)

224
Até onde podemos chegar?
Padrões [Ca] mg/kg Sinal (y) Diferença ( yi  y ) Diferença2 ( yi  y )2
P1 4,24 11743 11743  19522  7778 (7778) 2  60505062
P1 4,24 11470 -8051,5 64826652
P2 6,02 16854 -2667,5 7115556
P2 6,02 15962 -3559,5 12670040
P3 6,90 19183 -338,5 114582
P3 6,90 18408 -1113,5 1239882
P4 8,13 22556 3034,5 9208190
P4 8,13 22802 3280,5 10761680
P5 10,18 27774 8252,5 68103756
P5 10,18 28463 8941,5 79950422
n
Média ( y ) 19522 SQT (y
i 1
i  y ) 2
314495825

225
Fazendo previsões
Padrões [Ca] mg/kg Sinal (y) Sinal previsto ( ŷ )
P1 4,24 11743 yˆ  (2803 4,24)  (364)  11521
P1 4,24 11470 11521
P2 6,02 16854 16511
P2 6,02 15962 16511
P3 6,90 19183 18978
P3 6,90 18408 18978
P4 8,13 22556 22426
P4 8,13 22802 22426
P5 10,18 27774 28172
P5 10,18 28463 28172

226
Até onde chegamos?
Sinal
[Ca] previsto
Padrões Sinal (y) Diferença ( yˆ i  y ) Diferença2 ( yˆ i  y )2
mg/kg
( ŷ )

P1 4,24 11743 11521 11521 19522  8000 (8000) 2  64003362

P1 4,24 11470 11521 -8000 64003362

P2 6,02 16854 16511 -3011 9063656

P2 6,02 15962 16511 -3011 9063656

P3 6,90 19183 18978 -544 295732

P3 6,90 18408 18978 -544 295732

P4 8,13 22556 22426 2904 8433626

P4 8,13 22802 22426 2904 8433626

P5 10,18 27774 28172 8651 74831886

P5 10,18 28463 28172 8651 74831886

n
Média 19522 ( y ) SQR  ( yˆ
i 1
i  y)2 313256524

227
E agora?

SQR 313256524
R 
2
  0,9961
SQT 314495825
99,61 % das
informações são
explicadas pela
regressão. Os demais
0,39% não foram
modelados.

R  R 2  0,9961  0,9980

228
A SQ do resíduo (SQr) ou o
que não queremos no nosso
trabalho...

SQr  SQT  SQR  314495825 313256524 1239301

Aqui estão os 0,39%


1239301 que não foram
% da SQr  100  0,39% modelados.
314495825

229
Montando uma tabela Anova
Graus de
Soma quadrática (SQ) Média quadrática (MQ) Teste F
liberdade

Regressão p–1=2–1 313256524


313256524  313256524
(SQR) =1 1
313256524
F  2022
Residual n – p = 10 – 154913
1239301
1239301  154913 Ou significância
(SQr) 2=8 8
do F = 6,6x10-11
(é bem inferior a
Total n – 1 = 10 –
314495825 - 0,05, logo
- a
(SQT) 1=9 regressão é
significativa)

Fcal 2022
95% de confiança   380
Ftab 5,32

230
O que podemos fazer com as
réplicas?
[Ca] Sinal
Padrões Média ( y ) ( yi  y ) 2 g.l.
mg/kg (y)
P1 4,24 11743 11743  11470 (11743 11607) 2  18632 2 – 1 =
 11607
P1 4,24 11470 2 18632 1
P2 6,02 16854 198916
16408 1
P2 6,02 15962 198916
P3 6,90 19183 150156
18796 1
P3 6,90 18408 150156
P4 8,13 22556 15129
22679 1
P4 8,13 22802 15129
P5 10,18 27774 118680
28119 1
P5 10,18 28463 118680
SQEP 1003028 5

SQFaJ  SQr  SQEP  12393011003028 236273


231
Anova completa
Graus de
Soma quadrática (SQ) Média quadrática (MQ) Teste F
liberdade

Regressão p–1=2– 313256524


313256524  313256524
(SQR) 1=1 1 313256524
F  2022
Residual n – p = 10 1239301 154913
1239301  154913 Ou significância do
(SQr) –2=8 8 F = 6,6x10-11 (é bem
inferior a 0,05, logo
n – 1 = 10 a regressão é
Total (SQT) 314495825 - -
significativa)
–1=9

n – m = 10 1003028
SQEP 1003028  200606
–5=5 5 78757
F  0,39
m–p=5– 236273 200606
SQFaJ 236273  78757 Ou significância do
2=3 3
F = 0,7 (é superior a
0,05, logo não há
diferença entre FAJ e
EP. E daí?)
232
Voltando a nossa questão
inicial: erros

1 1,362  0,178
(X X ) 
t

 0,178 0,025
Diagonal principal
(contêm a variância)

154913 0,025  3886  62


MQr Esses são os erros!

1549131,362  211044  459

233
Voltando a nossa questão
inicial: intervalo de confiança
62  2,36  147
Valor de t com Esses são os
Valor de t com 8-1
95% de intervalos de
graus de liberdade confiança!
confiança
459 2,36  1086

Esse é o nosso
modelo
y  2803 x  364 Passa pelo zero
147 1086

Esse é o nosso
modelo final
y  2803 x
147

234
Até onde poderíamos ter
chegado?

SQT  SQEP 314495825 1003028


2
R
max    0,9968
SQT 314495825

Antes era:

SQR 313256524
R 
2
  0,9961
SQT 314495825
235
Reflexões
1- Efetuar corretamente a análise de
variância;

2 – Os testes F são tão importantes


quanto a visualização do R2 ou do R;

3 – Entenda corretamente os graus


de liberdade e saiba o que o seu
software preferido está calculando.

236
Estágios do Planejamento Experimental
(visão geral)

2n-k 2n

b  ( X T X)-1 X T Y
Y - Y-
Planejamento Planejamento
fatorial Primeiro Ajuste fino Modelos de
fatorial regressão:
fracionário passo
completo Composto central;
Doehlert;
Número de Número de variáveis Box-Behnken
variáveis (n)  5 Triagem (n) de 2 a 4

237
Primeiro passo Segundo passo (refinamento)
Capítulos 1 e 2 Capítulo 3
Planejamento Planejamento Modelos de regressão:
fatorial ou fatorial Planejamentos
completo fracionário Composto Central;
Doehlert;
Número de Número de Box-Behnken...
variáveis entre 2 e 4 variáveis  5 Número de variáveis:
tipicamente 2 ou 3
Tipicamente
Quantidade de experimentos Baixo
de 16 a 32
Conhecimento sobre os
fatores que influenciam Baixo Alto
sistema

238
Alternativa #2:
Proposição de
modelos usando
um exemplo
didático

239
Construção de modelos
Exemplo: proposição de um
experimento rápido, simples e didático
para alunos de graduação

Otimização “do número de gotas”


de Difenilcarbazida na
determinação de Cr (VI)

240

Leitura a
546 nm
Amostra + H2SO4

2CrO42- + 3H4L + 8H+  [Cr(HL)2]+ + Cr3+ + H2L + 8H2O


DFC Quelato de
coloração intensa

Exp. 1 2 3 4 5 6 7 8
DFC (gotas) 1 3 5 10 11 15 17 23
Abs x 1000 35 78 116 208 237 290 327 409
241
Função do modelo

y = f( G) Gotas

yi = b0 + b1Gi + i
Abs x 1000

Gotas de DFC

242
Exp. 1 2 3 4 5 6 7 8
DFC (gotas) 1 3 5 10 11 15 17 23
Abs x 1000 35 78 116 208 237 290 327 409
450

300
Abs x 1000

150

0
0 5 10 15 20 25
Gotas de DFC
243
Exp. DFC (gotas) Abs x 1000
1 1 35 y1 = b0 + b1G1 + 1
2 3 78 y2 = b0 + b1G2 + 2
3 5 116 y3 = b0 + b1G3 + 3
4 10 208 y4 = b0 + b1G4 + 4
5 11 237 y5 = b0 + b1G5 + 5
6 15 290 y6 = b0 + b1G6 + 6
7 17 327 y7 = b0 + b1G7 + 7
8 23 409 y8 = b0 + b1G8 + 8

244
y = Xb + 
y1 1 G1
y2 1 G2
y= y3 X= 1 G3
... ... ...
y8 1 G8
1
2
3 b0
= b=
... b1
8 245
Abs x 1000 320

280

yi
240 ei
^
yi

200
9 Gi 12 15 18
Gotas de DFC
246
y^ = Xb
^
y1
^
y
^ 2 b0
y= ^ b=
y3 b1
...
^
y8

(e2i) (e2i)
=0 =0
b0 b1
247
X y   X yi i
i i
b1  n
( X i ) 2

 Xi  n
2

b0  y  b1 X
248
b= t
(X X)-1 t
Xy

249
Voltando ao DFC
(onde eu quero chegar???)
1 1 35
1 3 78
1 5 116
1 10 208
X= Y=
1 11 237
1 15 290
1 17 327
1 23 409
Matriz 8x2 Matriz 8x1
250
b = (XtX)-1 Xty
t
(X X)
1 1 1 1 1 1 1 1 1 1
1 3 Xt =
1 3 5 10 11 15 17 23
1 5
1 10
X=
1 11 8 85
1 15 (XtX) =
1 17 85 1299
1 23
251
b = (XtX)-1 Xty
t
(X X)-1

x y 8 85 1 0
z t
x 85 1299
= 0 1
Matriz Matriz
inversa (XtX) identidade

0,410 -0,027
(XtX)-1 = -0,027 0,003
252
b = (XtX)-1 Xty
t
(X y)
1 1
35
1 3 78
1 5 116 1700
1 10 208 (Xty) =
X= Y=
1 11 237 24853
1 15 290
327
1 17
409
1 23
253
b = (XtX)-1 Xty
0,410 -0,027
t -1
(X X) = -0,027 0,003

1700
(Xty) = 24853

30,3
b=
17,1
254
^ = 30,3 + 17,1G
y i

1 1 47
1 3 82
1 5 116
^ 1 10 30,3 202
y = Xb = 1 x =
11 17,1 219
1 15 288
1 17 322
1 23 425

255
Reta ajustada
450
^ = 30,3 + 17,1G
y i

300
Abs x 1000

150

0
0 5 10 15 20 25
Gotas de DFC
256
Cálculo dos resíduos

35 47 -12
78 82 -4
116 116 0
208 202 6
e=y- ^
y = - =
237 219 18
290 288 2
327 322 5
409 425 -16

257
Análise de variância

(yi - y ) = ( y^i - y ) + (yi - y^i )

Desvio da previsão para ) = ( y^i -, y


(yi - oy ponto
( y^i - y ) + (yi - y^i )em relação (y
à imédia
- y) = ( y^i - y ) + (
global

+ (yi - y^i ) Diferença entre o valor observado


(yi - y ) = ( y^i - y ) + ((yi)-ey^oi )valor - y ) = (( y^i)- y ) + (
(yi previsto

258
Visualização dos desvios

y ) + (yi - y^i )
yi - y ) = ( y^i - y ) + (yi - y^i )
(yi - y ) = ( y^i - y
= ( y^i - y ) + ^(yi - y^i )
(yi - y ) = ( yi - y ) + (yi - y^i )
( y^ - y ) + (y - y^ )
i i i

259
Soma quadrática (SQ)
2 ^ 2 ^
 (yi - y ) =  ( yi - y ) + (yi - yi )
2

SQ SQ SQ
em torno devido à residual
da média regressão

SQT = SQR + SQr

SQR
R2 =
SQT
260
Tabela ANOVA

Número de
Fonte de Soma Média
graus de
variação quadrática quadrática
liberdade
2 ^ 2 ^
 (yi - y ) = ( yi - y ) + (yi - 1yi )
Regressão 2
MQR = SQR

n–p SQr
2 ^ - y ) + (y - y^ )
( y
y ) =Resíduos
2 2
(nesse caso MQr =
n-2
= s2
i i i
p = 2)

Total
2 ^ 2 ^
 (yi - y ) = ( yin- -y1) + (yi - yi )
2

261
Resultados para a DFC
^ 2
Exp.
( yi - y ) +(y
(y ^2 22 ^ ^ 2 2
- ii -y- )yi )=) =(y(i -yiy- y) +
) +(y
(y ^ ^ 2 2
e
i(y i -i y
- i y) i )
1 47 27239 156 -12
2 82 17095 13 -4
3 116 9303 0 0
4 202 115 38 6
5 219 41 326 18
6 288 5628 6 2
7 322 11950 27 5
8 425 45028 247 -16
SQR SQr
116399 813
262
Tabela ANOVA para nossos dados
Número de
Fonte de Soma Média
graus de
variação quadrática quadrática
liberdade

Regressão 116399 1 116399

Resíduos 813 8–2=6 135

Total 117212 8–1=7

116399
R2 = = 0,9931
117212
263
Como as médias quadráticas
podem ser úteis

Teste F

MQR 116399
F= = = 859
MQr 135

F tabelado
= 5,99
(1, 6 com 95%)

Razão entre os Quanto maior,


= 143 melhor!!!
valores de F
264
Visualização dos resíduos
100

50
Resíduos

-50

-100
0 5 10 15 20 25
Gotas de DFC
265
Cálculo dos erros

Variância = 135
Variância
^ = 30,3 + 17,1G
y para b0
i (30,3)

0,410 -0,027 55,6 -3,64


(XtX)-1= x 135 =
-0,027 0,003 -3,64 0,342

Variância
para b1
Erro para b0 = 55,60,5 = 7,5 (17,1)

Erro para b1 = 0,3420,5 = 0,59


266
Cálculo dos erros
Erro para b0 = 55,60,5 = 7,5
Erro para b1 = 0,3420,5 = 0,59
Variância = 135 (calculada com 6 graus
de liberdade)
Teste t para verificar se os coeficientes
(bi) são significativos
Teste t para b0 = 7,5 x 2,571 = 19,3
Teste t para b1 = 0,59 x 2,571 = 1,52

Valor de t para 5 g.l.


(95% de confiança)
267
Cálculo dos erros (interpretação)

^ = 30,3 + 17,1Gi
y
(± 19,3) (± 1,52)

b0 varia entre
11,0 e 49,6
(não passa pelo zero) Ambos são
significativos ao nível
b1 varia entre de confiança de 95%
15,6 e 18,6
(não passa pelo zero)
268
O químico ficou empolgado
Exp. 1 2 3 4 5 6 7 8 9 10 11 12 13 14
DFC (gotas) 1 3 5 10 11 15 17 23 35 46 48 50 60 70
Abs x 1000 35 78 116 208 237 290 327 409 544 620 637 643 668 651

Primeiros experimentos Experimentos efetuados


700
em um segundo
momento
600

500
Modelo Linear:
Abs x 1000

400

300
^
y = 115 + 9,78Gi
200
655550
100
R2 = = 0,9153
0 716240
0 15 30 45 60 75
Gotas de DFC 269
Parâmetros para o Parâmetros para o
novo modelo linear primeiro modelo linear

R2 = 0,9153 R2 = 0,9931

MQR 655550 MQR 116399


F= = = 130 F = = = 859
MQr 5057 MQr 813

F tabelado F tabelado
= 4,75 = 5,99
(1, 12 com 95%) (1, 6 com 95%)

Razão entre os Razão entre os


= 27 = 143
valores de F valores de F 270
Visualização dos resíduos
(segundo modelo linear)
150

100

50
Resíduos

-50

-100

-150

-200
0 15 30 45 60 75
Gotas de DFC 271
Visualização dos resíduos
100
(primeiro modelo linear)

50
Resíduos

-50

-100
0 5 10 15 20 25
Gotas de DFC
272
Proposição de um modelo quadrático

yi = b0 + b1Gi + i

Modelo linear

yi = b0 + b1Gi + b2Gi2 + i

Modelo quadrático

273
Matriz X
b0 b1 b2
1 1 1
1 3 9
1 5 25
1 10 100
1 11 121
1
1
15
17
225
289
b = (XtX)-1 Xty
X= 1 23 529
1 35 1225
1 46 2116
1 48 2304 ^
y = 15,9 + 21,1Gi – 0,172Gi2
1 50 2500
1 60 3600
1 70 4900
274
Parâmetros para o modelo quadrático
716078
R2 = = 0,9998
716240

MQR 358039
F= = = 24332
MQr 15

F tabelado
= 3,98
(2, 11 com 95%)

Razão entre os
= 6114
valores de F 275
Visualização dos resíduos
100
(modelo quadrático)

50
Resíduos

-50

-100
0 15 30 45 60 75
Gotas de DFC 276
Visualização dos resíduos
(modelo quadrático)
5

4
Contagens

0
-10 -8 -6 -4 -2 0 2 4 6 8 10 12
Resíduos
277
Comparação dos modelos

SQR SQr SQT Teste F


Modelos R2 (MQR/MQr) F tabelado Razão
(n) (n) (n)

813
116399 (6) 117212 5,99
Linear 1 0,9931 859 143
(1) (7) (1,6,95%)
s2 = 135

60690
655550 (12) 716240 4,75
Linear 2 0,9153 130 27
(1) (13) (1,12,95%)
s2 = 5057

162
716078 (11) 716240 3,98
Quadrático 0,9998 24332 6114
(2) (13) (2,11, 95%)
s2 = 14,7

278
Cálculos dos erros e teste t

Modelos bi (XtX)-1 s2 Erros g.l. Teste t

b0 = 30,3 0,410 -0,0268 7,45 19,3


Linear 1 135 5
b1 = 17,1 -0,0268 0,00253 0,585 1,52

b0 = 115 0,187 -0,00411 30,7 67,6


Linear 2 5057 11
b1 = 9,77 -0,00411 0,000146 0,859 1,89

0,349 -0,00227 2,82x10-4


b0 = 15,9 2,27 5,06
Quadrático b1 = 21,1 -0,0227 2,28x10-3 -3,23x10-5 14,7 0,183 10 0,408
b2 = -0,172 2,82x10-4 -3,23x10-5 4,88x10-7 2,68x10-3 5,97x10-3

279
O químico ficou mais empolgado ainda
^
y = 14,1 + 21,2Gi – 0,172Gi2
Exp. DFC Abs x 1000 Exp. DFC Abs x 1000
1 1 35 15 23 409
2 1 37 16 23 408
3 3 78 17 35 544
4 3 74 18 35 543
5 5 116 19 46 620
6 5 116 20 46 627
7 10 208 21 48 637 Data!!!
8 10 209 22 48 639
9 11 237 23 50 643
10 11 223 24 50 644
11 15 290 25 60 668
12 15 291 26 60 667
13 17 327 27 70 651
14 17 319 28 70 650 280
Visualização dos desvios
Réplica 1
SQ
y ) + (yi - y^i ) residual
Média

yi - y ) = ( y^i - y ) + (yi - y^i ) Réplica 2

(yi - y ) = ( y^i - y
= ( y^i - y ) + ^(yi - y^i )
(yi - y ) = ( yi - y ) + (yi - y^i )
( y^ - y ) + (y - y^ )
i SQi i
devido à
regressão

281
Visualização dos desvios
Réplica 1

yi  yi
SQ
y ) + (yi - y^i ) residual
Média
SQ
yi - y ) = ( y^i - y ) + (yi - y^i ) Réplica 2
erro puro

= ( y^i - y ) + (yi - y^i )


( y^i - y ) + (yi - y^i )

282
O que é possível fazer com estas novas
informações? Falta de
Erro puro ajuste
^ - - ^ – y- )2
Exp. yi yi yi (yi – ^
yi)2 (yi – yi)2 (yi i
1 35 35 36 0,01 1,00 0,82
2 35 37 36 3,62 1,00 0,82
3 76 78 76 4,25 4,35 0,001
4 76 74 76 4,45 4,35 0,001
... ... ... ... ... ... ...
25 665 668 668 7 0,3 5
26 665 667 668 3 0,3 5
27 653 651 651 5 0,3 7
28 653 650 651 10 0,3 7
Soma 292 179 113
SQ SQr SQep SQfaj
What to
n 25 14 11
do
now?
SQr = SQep + SQfaj

nr = nep + nfaj
283
Teste F

MQR 721025 MQfaj 10,3


F= = = 61718 F = = = 0,809
MQr 11,7 MQep 12,8

F tabelado F tabelado
(2, 25 com 95%) = 3,39 (11, 14 com 95%) = 2,60

Razão entre os Razão entre os


= 18206 = 0,311
valores de F valores de F

Quanto maior, Quanto menor,


melhor!!! melhor!!!

284
Cálculo da variância
Não há falta de ajuste:
MQfaj = 10,3 (n = 11)
Ambos são pequenos e podem
ser utilizados como uma
MQep = 12,8 (n = 14)
estimativa da variância

Podem ser combinados para obter uma variância com


maior número de graus de liberdade

179 + 113 292


s2 = = = 11,7 com 25 g.l.
14 + 11 25

285
Verificação da validade do modelo
0,175 -1,14x10-2 1,41x10-4
1,43
11,7 x -1,14x10-2 1,14x10-3 -1,61x10-5 = 0,115
1,41x10-4 -1,61x10-5 2,44x10-7 1,69x10-3

1,43 2,95
t 24 (95%) = 2,064 x 0,115 = 0,237
1,69x10-3 3,49x10-3

^
y = 14,1 + 21,2Gi – 0,172Gi2
(± 2,95) (± 0,237) (± 3,49x10-3)

Todos são significativos!!!


286
Tabela ANOVA completa
Soma Média
Fonte de
quadrática No de g. l. quadrática
variação
(SQ) (MQ)
ni
m SQR
Regressão SQR   ( yˆ i  y ) 2 p 1 MQR 
i j
p 1
m ni
SQr   ( yij  yˆ i ) 2 n p SQr
Resíduos MQr 
i j n p
m ni
SQ faj
Falta de ajuste SQ faj   ( yˆ i  yi ) 2 m p MQ faj 
i j m p
m ni
SQep
Erro puro SQep   ( yij  yi ) 2 nm MQep 
i j nm
m ni

Total SQT   ( yij  y ) 2 n 1


i j

SQR
% de variação explicada 
SQT

% máxima de variação SQT  SQep



explicável SQT
287
Tabela ANOVA completa
Soma Média
Fonte de
quadrática No de g. l. quadrática
variação
(SQ) (MQ)
Regressão 1442050 (3 – 1) = 2 721025
Resíduos 292 (28 – 3) = 25 11,7

Falta de ajuste 113 (14 – 3) = 11 10,3

Erro puro 179 (28 – 14) = 14 12,8


Total 1442342 (28 – 1) = 27
% de variação explicada 99,98
% máxima de variação
99,99
explicável
288
Finalmente o melhor no de gotas de DFC
^
y = 14,1 + 21,2Gi – 0,172Gi2
y
= 21,2 – (2x0,172)G G = 61
G ^ = 666
750 y
600
Abs x 1000

450

300

150

0 15 30 45 60 75
Gotas de DFC
289
Resumo
 Tabela Anova

 Teste F para avaliação das


variâncias

 MSPE e MSLoF (essas informações


são muito importantes). Mais
importantes que o R2

290
Proposição de
modelos em um
planejamento
fatorial

291
Estágios do planejamento de experimentos

 Identificação das variáveis que devem ser


estudadas
 Execução de planejamentos completos ou
fracionários (triagem de variáveis)
 Identificação das variáveis mais importantes
 Otimização com a “Metodologia de superfície
de resposta”

292
Nosso problema
Otimização do número de gotas de H2SO4 e DFC
para a determinação de Cr (VI)

Variável 1: Variável 2:
H2SO4 DFC


Leitura a
546 nm

Amostra
293
Primeiro passo
Planejamento fatorial de dois níveis (4 experimentos) com
ponto central (PC) em triplicata (total de 7 experimentos)

15
Gotas de DFC

11

0 5 10
Gotas de H2SO4 294
Normalização das variáveis

1
Gotas de DFC

Valor  PontoCentral
Variável1 
0
Máximo  Minímo
2

-1

-1 0 1
Gotas de H2SO4

295
Normalização das gotas de ácido e DFC

Valor  5
Ácido  Valor  5
10  0 Ácido 
5
2

Valor  11
DFC  Valor  11
15  7 DFC 
4
2
296
22 + PC

Ácido DFC Abs


Exp.
Gotas Gotas x1000
1 0 -1 7 -1 46
2 10 1 7 -1 138
3 0 -1 15 1 175
4 10 1 15 1 268
5 5 0 11 0 157
6 5 0 11 0 156
7 5 0 11 0 158

297
Modelo linear

yˆ  b0  b1 x1  b2 x2

yˆ  b0  b1 Ácido  b2 DFC

298
Matrizes X e Y
1 1 1 46
1 1 1 138
1 1 1 175
X= 1 1 1 Y = 268
1 0 0 157
1 0 0 156
1 0 0 158

b= t
(X X) -1 t
Xy 299
Tabela ANOVA completa
Soma Média
Fonte de
quadrática No de g. l. quadrática
variação
(SQ) (MQ)
Regressão 25329 (3 – 1) = 2 12664
Resíduos 2,36 (7 – 3) = 4 0,59

Falta de ajuste 0,36 (5 – 3) = 2 0,18

Erro puro 2,00 (7 – 5) = 2 1,00


Total 25331 (7 – 1) = 6
% de variação explicada 99,99
% máxima de variação
99,99
explicável
300
Testes F
Regressão e resíduos
12664
F  21491
0,59
Fcrítico (2,4,95%)  6,94
Falta de ajuste e erro puro
0,18 Não há falta de
F  0,18
1 ajuste!!!
Fcrítico (2,2,95%)  19,00
301
Coeficientes

yˆ  157  46Ácido  65DFC


Variância = 0,59 (MQr) com 4 graus de
liberdade (usar valor de t com 3 g.l.)

yˆ  157  46Ácido  65DFC


± 0,81 ± 1,07 ± 1,07
Todos são significativos!!!

302
Superfície de respostas

268

Abs x
1000

157
175 156 138
158

DFC Ácido
46

303
Gráfico de contornos
1.00 268
175

157 Caminho de
DFC 156 ascendência
158 ao máximo

46 138
-1.00
-1.00 1.00
Ácido 304
Caminho de ascendência ao máximo
1.00 ? ?
?

Caminho de
ascendência
ao máximo

-1.00
-1.00 1.00

305
Caminho de ascendência ao máximo

yˆ  157  46Ácido  65DFC

MaiorCoeficiente
Passo 
MenorCoeficiente

65
Passo   1,4
46
306
Caminho de ascendência ao máximo
7,0

5,6
Gotas de DFC

4,2

2,8

1,4

1,0 2,0 3,0 4,0 5,0


Gotas de H2SO4
307
Caminho de ascendência ao máximo

Ácido DFC Abs


Exp.
Gotas Gotas x1000
1 10 1,0 15 1,0 268
3 20 2,0 22 2,8 348
4 25 3,0 28 4,2 612
5 30 4,0 33 5,6 720
6 35 5,0 39 7,0 703

308
Planejamento 22 + PC + Estrela
41 1,4
2

39 1
Gotas de DFC
Gotas de DFC

0
33 0,0

28  1

26-1,42
-1,4
2 1 0,0
0 1 1,4
2
23 25 Gotas de
30 H2SO4 35 37
Gotas de H2SO4
309
Planejamento 22 + PC + Estrela
Ácido DFC Abs
Exp.
Gotas Gotas x1000
1 25 -1 28 -1 612
2 35 1 28 -1 653
3 25 -1 39 1 676
4 35 1 39 1 703
5 30 0 33 0 720
6 30 0 33 0 720
7 30 0 33 0 719
8 23 -1,414 33 0 644
9 37 1,414 33 0 692
10 30 0 26 -1,414 612
11 30 0 41 1,414 693

310
Matrizes X e Y
1 1 1 1 1 1 612
1 1 1 1 1 1 653
1 1 1 1 1 1 676
1 1 1 1 1 1 703
1 0 0 0 0 0 720
X= 1 0 0 0 0 0 720
Y=
1 0 0 0 0 0 719
1  2 0 2 0 0 644
1 2 0 2 0 0 692
1 0  2 0 2 0 612
1 0 2 0 2 0 693
b0 b1 b2 b3 b4 b5

Ácido DFC (Ácido) 2 (DFC )2 ( Ácido)  ( DFC )


311
Superfície de respostas
yˆ  720  17 Ácido  29DFC  26( Ácido)2  33( DFC )2  3,5( Ácido)  ( DFC )

312
Gráfico de contornos
1,4
1.40
693
676 703
1.00

0.60

0.20 720
0,0 644 720 692
-0.20 719

-0.60

612 653
-1.00

612
-1,4
-1.40
-1.40 -1.00 -0.60 -0.20 0.20 0.60 1.00 1.40
313
Resumo dos experimentos
39
AM5
22 + PC + Estrela
33
AM4

28
Gotas de DFC

AM3

22
AM2

15 AM1
22 + PC
11

0 5 10 20 25 30 35
Gotas de H2SO4 314
Quando se tem 3 variáveis
1 1 1
1 1 1  1,68 0 0
0 0 0
1 1 1 0 0 0
1,68 0 0
1 1 1 0  1,68 0
0 0 0
1 1 1 0 0 0
0 1,68 0
1 1 1 0 0  1,68
0 0 0
1 1 1 0 0 1,68
1 1 1

Fatorial 23: Ponto Central: Estrela:


8 experimentos 5 experimentos 6 experimentos

Total de 19 experimentos
315
Quando se tem 4 variáveis
1 1 1 1
1 1 1 1
1 1 1 1 2 0 0 0
1 1 1 1 0 0 0 0
2 0 0 0
1 1 1 1 0 2 0 0
0 0 0 0
1 1 1 1 0 0 0 0 0 2 0 0
1 1 1 1 0 0 0 0 0 0 2 0
1 1 1 1 0 0 0 0 0 0 2 0
1 1 1 1 0 0 0 2
1 1 1 1 0 0 0 2
1 1 1 1
1 1 1 1
1 1 1 1 Ponto Central: Estrela:
1 1 1 1 5 experimentos 8 experimentos
1 1 1 1
1 1 1 1

Fatorial 24: Total de 29 experimentos


16 experimentos
316
Planejamento composto central

N = 2k + 2k + PC

N = número de experimentos
k = número de variáveis
PC = Ponto Central

=2(k-p)/4
 = codificação da região axial
p = zero
317
Exercício
(Octave ou Matlab)
Vídeos explicativos no Youtube
http://youtu.be/VRyLxwDXtXw
http://youtu.be/d_trnaktgSE
http://youtu.be/3G4zgzHK8do
http://youtu.be/AvzsvRpwQ-M
http://youtu.be/GHmHK_SlzjM
http://youtu.be/gaijiz-1QSQ
http://youtu.be/nu67oxPtksQ
http://youtu.be/VA9i4QTVyvs
http://youtu.be/RVNOf6TY-Jg
http://youtu.be/Z4hdeqrQY6U 318
Resumo
 Tabela Anova

 Teste F

 MSPE e MSLoF (informações muito


importantes)

 Validação do modelo (é
imprescindível)

319
Vamos fazer um exercício

320
Nanotubos de carbono

• A concepção dos nanotubos de carbono surgiu com o


trabalho de Iijima (1991)

• Têm faixa de diâmetro de poucos nanômetros a


dezenas de nanômetros;

• Excelente material semicondutor ou condutor;

• Aplicação em sensores e biossensores.

321
Nanotubos de carbono

•Dois tipos conhecidos: single-wall e multi-wall;


•Multi-wall consiste em várias folhas de grafenos
concêntricas enroladas;
•De 1 a 100 nm de diâmetro

Tipos de nanotubos: multi-wall (a) e single-wall(b).

322
Utilização dos nanotubos

 Baterias
 Supercapacitores
 Sensores
 Dispositivos eletrônicos
 Armazenamento de hidrogênio
 Materiais de transmissão

323
Objetivos

Desenvolvimento de um eletrodo de
pasta de nanotubos de carbono para a
determinação de Ag+ em águas
residuárias através da técnica de
voltametria linear de redissolução
anódica e planejamento fatorial

324
Medidas voltamétricas

 Célula de vidro de 15,0 mL


 Contra-eletrodo de Pt
 Eletrodo de referência Ag/AgCl (KCl 3,0 mol L-1)
 Eletrodo de trabalho EPN
 Potenciostato/Galvanostato Autolab PGSTAT12 (Eco
Chemie) gerenciado pelo software GPES 4.9.

325
Preparação dos eletrodos

326
Planejamento fatorial 23 para triagem das
variáveis
• Variáveis estudadas:

Fatores (–) (+)

A – Tempo de pré-concentração 30 s 200 s

B – Potencial de pré-concentração -0,1 V -0,5 V

C – Velocidade de varredura 15 mV.s-1 80 mV.s-1

327
Resultados do planejamento 23

Resposta
Experimento A (tempo) B (potencial) C (velocidade) (µA)
1 -1 -1 -1 49,38
2 1 -1 -1 91,74
3 -1 1 -1 9,83
4 1 1 -1 196,73
5 -1 -1 1 507,91
6 1 -1 1 66,32
7 -1 1 1 601,07
8 1 1 1 69,15

328
Planejamento fatorial 22 + PC + Estrela
Resultados

Tempo de pré conc. (s) Vel. Varredura (mV. s-1) Resposta


Experimento Reais Normalizado Reais Normalizado (µA)
1 38 -1 98 -1 12,31
2 172 1 98 -1 33,64
3 38 -1 182 1 6,81
4 172 1 182 1 28,64
5 105 0 140 0 32,10
6 105 0 140 0 35,09
7 105 0 140 0 30,90
8 10 -1,4142 140 0 3,23
9 105 0 80 -1,4142 23,86
10 200 1,4142 140 0 28,84
11 105 0 200 1,4142 20,71

329
Evolução dos experimentos

Pra onde fomos

Onde estávamos

330
Matriz X

b12
b22
b11
b0

b1

b2
1 1 1 1 1 1
1 1 1 1 1 1
1 1 1 1 1 1
1 1 1 1 1 1
1 0 0 0 0 0
X 1 0 0 0 0 0
1 0 0 0 0 0
1  2 0 2 0 0
1 0  2 0 2 0
1 2 0 2 0 0
1 0 2 0 2 0

331
Coeficientes de regressão
36

30

24
Valores dos coeficientes

18

12

-6

-12
b0 b1 b2 b11 b22 b12
Coeficientes

332
Entendendo os coeficientes
Identificação Valor do Intervalo Intervalo Intervalo de
Conclusão
dos coeficientes coeficiente inferior superior confiança

32,70 29,28 36,11 3,42 Significativo


b0
(32,70 ± 3,42)

9,92 7,83 12,02 2,09 Significativo


b1
(9,92 ± 2,09)

-1,87 -3,96 0,22 2,09 Não


b2 significativo

(-1,87±2,09)

-8,03 -10,52 -5,54 2,49 Significativo


b11
(-8,03±2,49)

-4,91 -7,40 -2,42 2,49 Significativo


b22
(-4,91±2,49)

0,13 -2,83 3,08 2,96 Não


b12 significativo
(0,125±2,96)
333
Superfície de resposta

334
Gráfico de contorno
2 200
20,71

+1 182 6,81 28,64


Velocidade de varredura (mV/s)

32,1
0 140 3,23 35,09 28,84
30,9

-1 98 12,31 33,64

23,86
 2 80
10 38 105 172 200
 2 -1 0 +1 2
Tempo de pré-concentração (s)
335
Desvendando a rotina regression2

322
function [Mod_par,Coef,Pred] = regression2(X,Y,SSPE,DF);

% [Mod_par,Coef,Pred] = regression2(X,Y,SSPE,DF);

% Essa rotina tem como função calcular modelos de regressão empregando a


% seguinte equação:
% Coefficientes (b) = inv(X'X)*X'Y

% Inputs:
% X = matriz com os coeficientes que serão calculados
% Y = resposta que será modelada (deve ser um vetor)
% SSPE = Soma quadrática do erro puro (Obtida dos experimentos em replicata)
% DF = Grau de liberdade da SSPE

% Outputs:
% Mod_par = matriz (7,4) contendo a tabela Anova (Analysis of Variance)
% SSReg | DF | MSReg | Ftest1
% SSres | DF | MSres
% SSTot | DF | MSTot
% SSPE | DF | MSPE | Ftest2
% SSLoF | DF | MSLoF
% R^2 | R
% R^2max | Rmax
323
% Coef = coeficientes calculados, coeficientes - intervalo de confiança (IC),
% coeficientes + intervalo de confiança e intervalo de confiança.

% Pred = y previsto, y previsto para coeficiente - IC, y previsto para


% coeficiente + IC.

% A função irá perguntar sobre qual variância será utilizada para o cálculo
% do IC.

% Duas opções são possíveis:


% MQres (Mod_par(2,3)): se o modelo está bem ajustado ou
% MQLoF (Mod_par(5,3)): se o modelo apresenta falta de ajuste

% Depois o valor de t correspondente deverá ser digitado:

% t: pode ser usada a função invt do Excel. O intervalo de confiança


% dependerá do usuário. O padrão é 95%.

338
324
Figura 1

325
Figura 2

326
Figura 3

342
Figura 4

343
Which variance do you want to use: MSr, Mod_par(2,3) or MSLof, Mod_par(5,3)?Mod_par(2,3)

Variance =

4.5473

Type the correspondent t value2.776

t=

2.7764

327
Figura 5

328
Figura 6

329
Figura 7

347
Coeficientes (Coef)

32,70 29,28 36,11 3,42


9,92 7,83 12,02 2,09
-1,87 -3,96 0,22 2,09
-8,03 -10,52 -5,54 2,49
-4,91 -7,40 -2,42 2,49
0,13 -2,83 3,08 2,96

330
Valores previstos (Pred)

11,83 4,65 19,00


31,42 25,98 36,86
7,84 2,40 13,28
27,93 12,39 43,48
32,70 29,28 36,11
32,70 29,28 36,11
32,70 29,28 36,11
2,60 -2,84 8,04
25,52 20,08 30,96
30,66 19,30 42,02
20,24 8,88 31,60

331
O que podemos fazer sem os
coeficientes que não foram
significativos?
Experimento Matriz X (11 linhas e 6 colunas)
Vetor y (resposta, 11 linhas e 1 coluna)
b0 b1 b11 b22

1* 1 -1 1 1 12,31

O que
2** 1 1 1 1 33,64

3* 1 -1 1 1 6,81

4** 1 1 1 1 28,64 temos


agora?
5 1 0 0 0 32,1

6 1 0 0 0 35,09

7 1 0 0 0 30,9

8 1  2 2 0 3,23

9*** 1 0 0 2 23,86

10 1  2 2 0 28,84

11*** 1 0 0 2 20,71
350
Finalmente a tabela Anova
Soma Quadrática Graus de liberdade Média Quadrática Testes F
R 1192 3 (p-1=4-1) 397 54,80
r 50,75 7 (n-p=11-4) 7,25
T 1243 10 (n-1) 124
EP 41,89 5 (n-m=11-6) 8,38 0,53
FaJ 8,864 2 (m-p=6-4) 4,43
R2 0,9591 R = 0,9793
R2 máximo 0,9662 R máximo = 0,9830
SQfaj = 8,85

17,44%
SQep = 41,9

82,56%
4,08%
SQR = 1192 SQres = 50,8
95,92%

SQT=SQR+SQr=1242

351
Ops... Temos que validar
primeiro!
Tempo de pré Velocidade de Resposta Reposta
Experimento concentração (s) varredura (mV/s) experimental prevista
Real Normalizado Real Normalizado (µA) (µA)
12 (ótimo) 146 0,62 140 0 36,8 35,8
13 10  2 200 2 2,3 -7,21

2 200 37,50
2,30 (experimento 13)
31,88

26,25
+1 182 20,63
Velocidade de varredura (mV/s)

15,00

Por que as
9,375

3,750

-1,875

coisas são
-7,500
0 140 36,8
(experimento 12)

assim?
-1 98

 2 80
y  32,70 9,92 v1  8,03 v12  4,91v22
3, 42  2, 09  2, 49  2 , 49
10 38 105 146 172 200
 2 -1 0 0,62 +1 2
Tempo de pré-concentração (s)
352
Superfície de resposta (Excel):
template_superfície.xls

y  32,70 9,92 v1  8,03 v  4,91v


2
1
2
2
3, 42  2, 09  2, 49  2 , 49

353
Resumo
 É importante validar a condição
apontada como ótima

354
Reflexões
1- Mais importante do que fazer os
cálculos e interpretar corretamente a
tabela Anova, é necessário validar o
modelo;

2 – O modelo está “dando bons


resultados”? Como está o
“real/referência” versus e o previsto?

3 – Veja a superfície e o gráfico de


contorno. Eles trazem muitas
informações importantes.
355
Programas comerciais

356
Uso do Simplex

357
Otimização simplex
Siró, colaboradores, Optimized synthesis of Di, Tri and
Tetrafused Pyridazinium Cations, Tetrahedron, 2000,
56, 2469-2472.
Visualização das variáveis mais importantes com um planejamento 25-1
(16 experimentos)
Exp. Temperatura [Dioxane] Tempo Trietilamina V. solvente Rendimento (%)
1 -1 -1 -1 -1 1 0
2 1 -1 -1 -1 -1 7
3 -1 1 -1 -1 -1 0
4 1 1 -1 -1 1 11
5 -1 -1 1 -1 -1 3
6 1 -1 1 -1 1 12
7 -1 1 1 -1 1 1
8 1 1 1 -1 -1 16
9 -1 -1 -1 1 -1 9
10 1 -1 -1 1 1 36
11 -1 1 -1 1 1 15
12 1 1 -1 1 -1 29
13 -1 -1 1 1 1 10
14 1 -1 1 1 -1 30
15 -1 1 1 1 -1 19
16 1 1 1 1 1 43 358
95 Trietilamina

Temperatura
Probabilidade (%)

8
70 3
2
9
10
40 15
11
5
7
6
10 13
12

14

-3 0 3 6 9 12 15 18 21
Contraste (rendimento %)
359
25-1 = 22 (com 4 réplicas)

1 4
Exp. Temperatura Trietilamina Rendimento (%) Média 1 4 14
1 -1 -1 0 0 3 1 1 -1 -1 1
2 1 -1 7 11 12 16 12 12 -12 -12
9 -1 1 9 15 10 19 13 -13 13 -13
10 1 1 36 29 30 43 35 35 35 35
Soma 32 35 11
Contraste 16 18 5,4

Var exp Var efeito


Var Coef^2 20 5
2 0,25
14 0,25 Erro exp Erro exp
22 0,25 4 2
42 0,25
1 t 12, 95% 2,179
5

360
80

50 55 60
35 40 45
75 30
7 36
11 29
(1) 70 12 30
16
25 43

65

20

15

10

5
35
0 9
0 15
3 10
1 19
(-1) 30
0,10

2,00
1,50

1,80
1,40

1,60
(-1) (1) 361
80 1/55
2/56

75 10/56 4/57 3/58

36
29
30
70 13/59 43
9/61 6/59 5/60

65 12/57 11/56 8/56 7/56


1,50

1,80

2,00
1,40

1,60

362
Otimização simplex – Características

• Algoritmos muito simples (podem ser


implementados em instrumentos analíticos)
• É necessário conhecer a resposta
imediatamente anterior
• Conveniente em instrumentos ou
experimentos de resposta rápida
• É possível otimizar somente uma resposta
por vez
• Não requer o uso de testes de significância
(testes t e F).

363
Otimização simplex – Definição

• Figura geométrica: polígono de p + 1


vértices, onde p é o número de variáveis
Duas variáveis – simplex = triângulo

Três variáveis – simplex = tetraedro

Quatro ou mais variáveis – simplex =


hiperpoliedro 364
Simplex básico
Figura regular: para duas variáveis temos um
triângulo eqüilátero
Regra 1: O primeiro
simplex é
determinado
fazendo-se um
número de
experimentos igual
ao número de
variáveis
B C controladas mais
A um.

365
D

B C

Regra 2: O novo simplex é formado rejeitando-se


o vértice correspondente à pior resposta e
substituindo-o pela sua reflexão na hiperface
definida pelos vértices restantes.
366
367
Regra 3: Quando o vértice refletido tiver a pior
das respostas do novo simples deve-se rejeitar o
segundo pior vértice.

368
Regra 4: Se um mesmo vértice tenha sido
mantido em p+1 simplexes, antes de construir o
próximo simplex deve-se determinar novamente
a resposta correspondente a esse vértice.

369
Regra 5: Se o novo vértice
ultrapassar os limites
aceitáveis para qualquer uma
das variáveis que estão sendo
ajustadas, deve-se atribuir um
valor indesejável à resposta
nesse vértice.

370
Simplex modificado

• O simplex pode alterar o seu tamanho


• Adapta-se melhor à superfície de resposta
• Determinação mais precisa do ponto ótimo
• O simplex pode encolher
• O simplex pode esticar
• Pode resultar em um número menor de
experimentos
• Aproxima-se mais rapidamente à região de
interesse

371
Simplex modificado
C

B G E D F

A
ABC: Simplex inicial (igual ao simplex básico)
ADC: Reflexão do simplex inicial
AFC: Expansão
AEC: Contração
AGC: Contração com mudança de direção
372
Resumo
 Alternativa simples e conveniente
quando o desejável é verificar uma
região específica

373
Planejamento
Doehlert
(determinada
variável é mais
importante que
as demais)

374
Planejamento Doehlert
Sérgio L. C. Ferreira, colaboradores, Doehlert matrix: a
chemometric tool for analytical chemistry - review,
Talanta, 2004, 63, 1061-1067.
Exp A B
1 0 0
2 0 0
3 0 0
4 1 0
5 0,5 0,866
6 -1 0
7 -0,5 -0,866
8 0,5 -0,866
9 -0,5 0,866
375
Duas variáveis
Variável B 0,866

0,000

-0,866

-1,000 -0,500 0,000 0,500 1,000


Variável A 376
866

000

866

377
0,866

Variável B
0,866 0,000

Variável B
0,866 0,000 -0,866

-1,000 -0,500 0,000 0,500 1,000


Variável A
Variável B

0,866 0,000 0,866


-0,866

-1,000 -0,500 0,000 0,500 1,000


Variável A
Variável B
Variável B

0,000 -0,866 0,000

-1,000 -0,500 0,000 0,500 1,000


Variável A

-0,866 -0,866

-1,000 -0,500 0,000 0,500 1,000 -1,000 -0,500 0,000 0,500 1,000

Variável A Variável A

378
Três variáveis

0,817
Variável 3

0,866
0,577
0,289
-0,817 0
-1 -0,289
-0,5 -0,577
0 -0,866
0,5
1
379
Planejamento Doehlert

N = k2 + k + PC

N = número de experimentos
k = número de variáveis
PC = Ponto Central

 xi  x
0

Ci   i
  
 xi 
380
Exemplo de codificação
Variável A Variável B
Codificado Real Codificado Real
-1 10 -0,866 10
-0,5 12,5 0 15
0 15 0,866 20
0,5 17,5
1 20

Codificação do 12,5
Ponto central
 12,5  15 
Ci     0,5  0,5
 2,5  Delta
codificado
Delta real
381
Planejamento Box-
Behnken (não são
testadas condições
extremas e as
variáveis possuem 3
níveis)

382
Três variáveis

-1 1
-1
0
0

1 -1

383
Planejamento Box-Behnken

N = 2k (k – 1) + PC

N = número de experimentos
k = número de variáveis
PC = Ponto Central

384
Comparações
Número de experimentos (f) Eficiência (p/f)
Número de
Variáveis parâmetros
(p) Composto Box- Composto Box-
Doehlert Doehlert
central Behnken central Behnken

2 6 9 7 - 0,67 0,86 -

3 10 15 13 13 0,67 0,77 0,77

4 15 25 21 25 0,60 0,71 0,60

5 21 43 31 41 0,49 0,68 0,61

6 28 77 43 61 0,36 0,65 0,46

7 36 143 57 85 0,25 0,63 0,42

8 45 273 73 113 0,16 0,62 0,40

385
Resumo
 Doehlert: boa alternativa quando
uma variável é mais importante que
as demais

 Box-Behnken: importante quando


condições extremas não podem ser
testadas

386
Planejamentos saturados de Plackett e
Burman

• Quantidade de experimentos: 8, 12, 20, 24, 28,...


(múltiplos de 4)
• É possível avaliar 7, 11, 19, 23, 27,... Variáveis
• Admite que os efeitos de interação não são
significativos (cuidado)
• Interessante para avaliar a robustez de um método

387
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

388
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

389
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

390
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

391
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

392
Exemplo
Preconcentração de carbamatos em água.

1 2 3 4 5 6 7
Exp. V. eluente V. amostra M. adsorvente T. adsorvente d1 d2 d3 Rec (%)
1 1 -1 -1 1 -1 1 1 77,39
2 1 1 -1 -1 1 -1 1 52,13
3 1 1 1 -1 -1 1 -1 60,89
4 -1 1 1 1 -1 -1 1 31,46
5 1 -1 1 1 1 -1 -1 88,41
6 -1 1 -1 1 1 1 -1 30,31
7 -1 -1 1 -1 1 1 1 52,16
8 -1 -1 -1 -1 -1 -1 -1 42,8

-1 1mL 50mL 100mg C8 - - -


1 7mL 500mL 300mg C18 - - -

d = variáveis dummy

393
Efeitos calculados

Efeito Variável
30 1
-21 2 Importantes

7,6 3
4,9 4
2,6 5
1,5 6
-2,3 7

394
395
396
O que os autores identificaram?

397
Problemas com
múltiplas
respostas

398
Visão geral
2n-k 2n

Modelos de
Planejamento regressão:
Planejamento
fatorial Primeiro Ajuste fino Composto
fatorial
fracionário passo central;
completo
Doehlert;
Box-
Número de Número de Behnken
variáveis  5 variáveis de 2 a 4

399
Exemplo
Resultados obtidos no grupo
de Catálise e Oleoquímica do
Departamento de Química da
UFPA: Professores José
Roberto Zamian e Geraldo
Narciso da Rocha Filho

400
Objetivos

Otimização das condições de


transesterificação do óleo de
jupatí (Raphia taedigera Mart)
utilizando etanol e catálise
ácida

401
Planejamento experimental
[Cat] Temperatura RM Álcool Respostas
Exp Real Norma Real Norma Real Norma T. Ester Visco Rend Est
1 1,00 -1,00 70 -1,00 41,3 -1,00 83,60 7,10 72,04
2 2,00 -0,38 70 -1,00 41,3 -1,00 87,00 6,50 74,88
3 1,00 -1,00 80 1,00 41,3 -1,00 85,00 6,30 75,83
4 2,00 -0,38 80 1,00 41,3 -1,00 95,00 5,30 79,62
5 1,00 -1,00 70 -1,00 61,9 -0,24 92,00 5,80 73,93
6 2,00 -0,38 70 -1,00 61,9 -0,24 88,00 5,90 83,41
7 1,00 -1,00 80 1,00 61,9 -0,24 94,00 5,80 84,36
8 2,00 -0,38 80 1,00 61,9 -0,24 99,40 4,50 86,26
9 1,50 -0,69 75 0,00 51,6 -0,62 98,20 4,90 85,50
10 1,50 -0,69 75 0,00 51,6 -0,62 97,70 4,60 86,54
11 1,50 -0,69 75 0,00 51,6 -0,62 97,90 4,80 85,12
12 3,00 0,25 80 1,00 68,8 0,02 98,50 4,60 91,24
13 4,00 0,87 80 1,00 68,8 0,02 99,80 4,10 93,33
14 3,00 0,25 80 1,00 82,6 0,53 99,20 4,20 92,38
15 4,00 0,87 80 1,00 82,6 0,53 98,70 4,20 91,43
16 3,50 0,56 80 1,00 75,7 0,28 98,50 4,50 89,52
17 3,50 0,56 80 1,00 75,7 0,28 98,60 4,50 90,57
18 3,50 0,56 80 1,00 75,7 0,28 98,80 4,20 91,14
19 2,79 0,12 80 1,00 75,7 0,28 98,90 4,10 90,48
20 4,21 1,00 80 1,00 75,7 0,28 99,10 4,30 91,90
21 3,50 0,56 80 1,00 56,2 -0,45 99,40 4,10 92,38
22 3,50 0,56 80 1,00 95,2 1,00 98,60 4,60 89,24

402
Tratamento do dados
320
Abs x 1000

280

yi
240
^
yi
ei
b= t
(X X) -1 t
Xy
200
9 12 15 18
403
Resultados obtidos

404
Resultados obtidos

405
Resultados obtidos

406
Atingindo o objetivo
80

78

Altos teores de Ester


(100%)

Temperature ( C)

76
o

74

72

70
1,0 1,5 2,0 2,5 3,0 3,5 4,0
Catalyst concentration (%m/v)

407
Atingindo o objetivo
80

Temperature ( C)
78 Baixa
Viscosidade
(< 4,5)

76
o

74

72

70
1,0 1,5 2,0 2,5 3,0 3,5 4,0
Catalyst concentration (%m/v)

408
Atingindo o objetivo
80

78
Temperature ( C)


76
o

Alto
rendimento
74 (>94%)

72

70
1,0 1,5 2,0 2,5 3,0 3,5 4,0
Catalyst concentration (% m/v)

409
Atingindo o objetivo
80

78 Experimentos
efetuados para validar
os modelos: erros
Temperature ( C)

76 relativos inferiores a
o

6% ao comparar os
valores reais e
74 previstos

72

70
1,0 1,5 2,0 2,5 3,0 3,5 4,0
Catalyst concentration (%m/v)

410
Resumo
 Sobreposição: boa alternativa
quando temos poucas respostas

411
Problemas com várias respostas

Estratégia inicial: visualização dos


gráficos de contorno e/ou de
superfície com o objetivo de
identificar uma região de ótimo
para as respostas em análise

Problemas: as condições ideais


(de ótimo) para as diferentes
respostas podem estar presentes
em diferentes regiões, tornando
difícil a tomada de decisões
412
Metodologia de critérios múltiplos

Função Derringer ou Função de


Desejabilidade (Desirability function)

Etapa 1: Construção de funções de


desejabilidade (di) para cada resposta

di = 0 (resposta indesejável)
di = 1 (resposta desejada)

413
Calculando di para Maximizar

0 se y  L
s
di   y-L 
  se L  y  T
T-L
1 se y  T
Onde: Se s = 1: a função é
y = resposta linear
L = Menor valor aceitável Se s > 1: maior
T = Valor alvo importância é dada ao
valores próximos do alvo
s = peso (T)
414
Teor de éster
1,0 1,0

0,8 0,8

Desejabilidade (di)
Desejabilidade (di)

0,6 0,6

0,4 0,4

0,2 0,2

0,0 s=1 0,0 s=2


80 85 90 95 100 105 80 85 90 95 100 105
Teor de éster (%) Teor de éster (%)

1,0

0,8
Desejabilidade (di)

0,6

Geralmente s
0,4
varia de 1 até 5
0,2

0,0 s=4
80 85 90 95 100 105
Teor de éster (%)
415
Calculando di para Minimizar

1 se y  T
t
di   U-y
  se T  y  U
 U-T 
0 se y  U
Onde: Se t = 1: a função é linear
y = resposta Se t > 1: maior
U = Maior valor aceitável importância é dada ao
T = Valor alvo valores próximos do alvo
(T)
t = peso
416
Viscosidade
1,0
1,0

0,8
0,8
Desejabilidade (di)

Desejabilidade (di)
0,6
0,6

0,4
0,4

0,2
0,2

0,0 t=1 0,0 t=2


4,0 4,5 5,0 5,5 6,0 6,5 7,0
4,0 4,5 5,0 5,5 6,0 6,5 7,0
Viscosidade Viscosidade

1,0

0,8
Desejabilidade (di)

0,6

0,4
Geralmente s
varia de 1 até 5
0,2

0,0 t=4
4,0 4,5 5,0 5,5 6,0 6,5 7,0
Viscosidade

417
Valor alvo (T) entre L e U

0 se y  L
s
 y-L 
  se L  y  T
di  T-L
t
 U-y
  se T  y  U
 U-T 
0 se y  U

418
Recuperação para o Pb
(exemplo Faber Castell)
1,0

0,8
Desejabilidade (di)

0,6

0,4

1,0
0,2

set =1 0,8
0,0

Desejabilidade (di)
-50 0 50 100 150 200 250 0,6
Recuperação para o Pb

0,4

0,2

0,0 set=3
-50 0 50 100 150 200 250
Recuperação para o Pb 419
Desejabilidade global (D): média
geométrica de d

D  d1 d2  ...dm
m

Outras abordagens:

D wi
(d1)  (d 2)  ...( dm)
w1 w2 wm

420
Vamos a um exemplo

421
Espectrometria de absorção atômica
sequencial rápida
Espectrômetro de absorção atômica com
atomizador de chama SpectrAA FS da Varian (FS
FAAS- Fast Sequential Flame Atomic Absorption
Spectrometry) para determinação de cobre,
manganês, ferro, zinco e magnésio em amostras
Apenas em 2004
de minério. Projahn et al.

Interesse por determinações


multi-elementares utilizando a
AAS
Foram ocorrendo
avanços que
contribuíram para o
desenvolvimento da
AAS.

Lowe, R.M.; Sullivan, J.V.; Spectrochim. Acta Part B, 54, 2031, 1999.
Projahn, H.D.; Steeg, U.; Sanders, J.; Vanclay, E.; Anal. Bioanal. Chem. 378, 1083, 2004. 422
Espectrometria de absorção atômica
sequencial rápida

Redução no tempo total de


análise

Redução no volume de
amostra

Realiza a medida de todos os elementos em


uma amostra para então avançar para a
amostra seguinte.

423
Metodologia
Três etapas:
Tubo atomizador (Ni ou Quartzo) 1. A geração da espécie volátil; ou
seja, a reação química
propriamente dita,
2. O transporte da
Argônio
Vazões espécie volátil
140 ml min-1
(ml min-1)
Separador (1,2) para a célula de
gás-líquido NaBH4
(1,2) atomização (que
HCl
ll (6,8)
Amostra
inclui também
Bobina
Bomba sua expulsão da
peristáltica solução);
3. A atomização

Dreno Sistema utilizado para determinação experimental de As e Sb por HG AAS.


Guerra, M. B. B.; Carapelli, R.; Miranda, K.; Nogueira, A. R. A.; Pereira-Filho, E.R.; Anal. Methods, 3, 599-605, 2011. 424
Metodologia

Parâmetros estabelecidos:

• Comprimento de onda utilizado:


As – 193,7 nm
Sb – 217,6 nm
• Tempo de estabilização (delay): 20 s
• Tempo de medição: 3 s

Guerra, M. B. B.; Carapelli, R.; Miranda, K.; Nogueira, A. R. A.; Pereira-Filho, E.R.; Anal. Methods, 3, 599-605, 2011. 425
Excel e Octave

Exp HCl NaBH4 As Sb


1 -1 -1 0,128 0,203
2 1 -1 0,144 0,199
3 -1 1 0,143 0,205
4 1 1 0,151 0,208
5 -1,41421 0 0,132 0,197
6 1,414214 0 0,146 0,197
7 0 -1,41421 0,128 0,208
8 0 1,414214 0,153 0,209
9 0 0 0,145 0,205
10 0 0 0,141 0,204
11 0 0 0,141 0,205

426
Resumo
 Excelente estratégia, mas é
necessário verificar se determinada
resposta apresenta modelo com
falta de ajuste. Nesse caso, o ideal
é atribuir um peso menor para essa
resposta

427
Planejamento
fatorial + PCA

428
Análise exploratória dos dados

 Permite extrair o máximo de informação de um


conjunto de dados.

Análise de Componentes Principais

(PCA, Principal Component Analysis)


Técnicas:
Análise de Agrupamentos Hierárquicos

(HCA, Hierarchical Cluster Analysis)

429
PCA
A Análise de Componentes Principais
é uma ferramenta quimiométrica que
reduz as dimensões originais de um
determinado conjunto de dados
numéricos.

430
Fundamentação da PCA
Variável 2
PC1

PC2 PC3

Variável 1

431
Componentes Principais (PC)
 Os novos eixos (PC) são ortogonais
entre si (completamente não
correlacionados)
 São construídos em ordem
decrescente da quantidade de
variância que descrevem (primeiro
fator descreve maior variância nos
dados que o segundo...)
 Determinação da dimensionalidade
intrínseca do conjunto de dados 432
Componentes Principais (PC)
 PC: Número menor que as
variáveis originais (Redução de
variáveis)

 Direção que melhor explica os


dados: 1ª PC

 Base da PCA: Calcular autovalores


e autovetores de uma matriz de
variância-covariância
433
Posto de matriz, autovalores e
autovetores
Posto de uma matriz
• Número de linhas ou colunas linearmente
independentes.
Autovalores e Autovetores
• Cálculo de sub-sistemas muito menores para
dados que apresentam muitas variáveis
(dimensões)

A = x
Autovetor
Autovalor 434
Variância e Covariância
Variáveis Auto.
Variância (s2):
AF Fe AF Fe
Espalhamento dos dados ao
297,7 7,3 0,6 -0,4
257,5 9,3 0,2 1,3 redor do seu valor médio
338,7 10,9 1,0 2,6 para uma única variável


271,6 8,7 0,3 0,8 2
306,7 9,3 0,7 1,2 xd onde xd  ( x  x )
s 
2 i
n 1
...

...

...

107,5 6,3 -1,4 ...


-1,2
97,0 5,6 -1,5 -1,7 Covariância (Cov):
151,7 7,4 -0,9 -0,3 Distribuição dos dados
141,2 7,8 -1,0 0,0 multivariados e suas
139,9 8,7 -1,0 0,8 relações

Média 241 8 0 0
COV 
 ( x  x AF )( x  x Fe )
i i
SD 98 1 1 1
n 1 435
Cálculos
Variáveis Auto.
xi  xAF xi  xFe ( xi  xAF )(xi  xFe)
AF Fe AF Fe
297,7 7,3 0,6 -0,4 0,6 -0,4 -0,2
257,5 9,3 0,2 1,3 0,2 1,3 0,2
338,7 10,9 1,0 2,6 1,0 2,6 2,6
271,6 8,7 0,3 0,8 0,3 0,8 0,2
306,7 9,3 0,7 1,2 0,7 1,2 0,8
...

...

...

...

...

...

...
107,5 6,3 -1,4 -1,2 -1,4 -1,2 1,6
97,0 5,6 -1,5 -1,7 -1,5 -1,7 2,5
151,7 7,4 -0,9 -0,3 -0,9 -0,3 0,3
141,2 7,8 -1,0 0,0 -1,0 0,0 -0,1
139,9 8,7 -1,0 0,8 -1,0 0,8 -0,8

Média 241 8 0 0 Soma 11,8


SD 98 1 1 1
Variância (s2) 1 1 436
Matriz variância e covariância

11,8
COV = 29 = 0,4

AF Fe
COVAFFe AF 1,0 0,4
Fe 0,4 1,0

437
Matriz variância e covariância

S Fe
2
Graficamente
1,4

1,2 Cov FeAF


1,0

0,8

0,6

0,4

0,2 Cov AFFe

0,0
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4
2
S AF 438
Matriz variância e covariância

S Fe
2
1,4

1,2

1,0

0,8

0,6

0,4

0,2

0,0
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4
2
S AF

Projeção de uma
elipse

439
Autovalores

S Fe
2
1,4

1,2

1,0
PC1
0,8

Autovalor
PC2 0,6

0,4
da PC1
Autovalor
da PC2
0,2

0,0
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4
2
S AF

440
1,2
Autovetores (seno e cosseno)
1,0
0,92 PC1
0,8 Sen  = 0,707

0,6
PC2

0,4

Cos  = 0,707
0,2

 = - 45o =45o
0,0
Sen  = -0,707
0,0 0,2 0,4 0,6 0,8 1,0 1,2
Cos  = 0,707
0,86
441
Como calcular os autovalores
AF Fe
COVAFFe AF 1,0 0,4
Fe 0,4 1,0
Para uma matriz quadrada temos:
det (COVAFFe – a.I)=0
Onde I é a matriz identidade e “a” são os autovalores.
Assim teremos:
Diagonal secundária

1,0  a 0,4  O cálculo da determinante é a

det    0 diferença do produto da

 0,4 1,0  a 
diagonal principal com o
produto da diagonal secundária
Diagonal principal

442
Como calcular os autovalores
Assim teremos uma equação de segundo grau:

a  2a  0,84  0
2

a1  1,4
a 2  0,6
Variância explicada:
1,4
% referentea a1  100  70,4%
1,4  0,6
0,6
% referentea a2  100  29,6%
1,4  0,6 443
Matriz de Scores

Dados autoescalados Scores


AF Fe PC1 PC2
0,58 -0,36 0,16 -0,67
PC1 = Sen  AFi + Cos  Fei
0,18 1,26 1,02 0,77
1,00 2,56 2,52 1,10
PC2 = Sen  AFi + Cos  Fei 0,32 0,78 0,77 0,32
0,68 1,26 1,37 0,42
PC1 = 0,70AFi + 0,70Fei ... ... ... ...
-1,37 -1,17 -1,79 0,14
-1,47 -1,73 -2,26 -0,19
PC2 = -0,70AFi + 0,70Fei
-0,91 -0,28 -0,84 0,45
-1,02 0,05 -0,69 0,76
-1,03 0,78 -0,18 1,28

444
Matriz de Loadings (Pesos)
PC1 PC2
AF 0,707 0,707
Fe -0,707 0,707

Matriz de Scores: 30 linhas


(amostras) e 2 colunas (PC1 e
PC2)

Matriz de Loadings: 2 linhas


(variáveis – AF e Fe) e 2 colunas
(PC1 e PC2)
445
Visualização dos dados - Scores
1,5

0,5

0
-4 -3 -2 -1 0 1 2 3
PC2 (29%)

-0,5 Milho
Trigo
-1

-1,5

-2

-2,5
PC1 (70%)

446
Visualização dos dados - Loadings
1
0,8
Fe
0,6
0,4
0,2
PC2 (29%)

0
-1 -0,5 -0,2 0 0,5 1

-0,4
-0,6
AF
-0,8
-1
PC1 (70%)

447
Scores e Loadings
1,5

1
1
0,8
0,5 0,6 Fe
0,4
0
0,2

PC2 (29%)
-4 -3 -2 -1 0 1 2 3
PC2 (29%)

-0,5 Milho 0
-1 -0,5
Trigo -0,2 0 0,5 1
-1
-0,4
-1,5 -0,6
-0,8
-2 AF
-1
PC1 (70%)
-2,5
PC1 (70%)

448
Planejamento fatorial + PCA

449
Otimização das condições de extração de metais
em amostras de efluentes salinos de refinarias.
Determinação utilizando ICP OES

Tempo de irradiação (min) pH [Tampão] final


Experimento
Real Normalizada Real Normalizada Real Normalizada
1 10 -1 6 0 22 0
2 8 -0,5 4,5 −0,5 40 -0,707
3 8 -0,5 4,5 −0,5 4 −0,707
4 8 -0,5 7,5 -0,5 40 -0,707
5 8 -0,5 7,5 -0,5 4 −0,707
6 6 0 3 −1 22 0
7A 6 0 6 0 22 0
7B 6 0 6 0 22 0
7C 6 0 6 0 22 0
8 6 0 9 -1 22 0
9 4 −0,5 4,5 −0,5 40 -0,707
10 4 −0,5 4,5 −0,5 4 −0,707
11 4 −0,5 7,5 -0,5 40 -0,707
12 4 −0,5 7,5 -0,5 4 −0,707
13 2 −1 6 0 22 0
450
Respostas: intensidades de 6 metais
Experimento Cd Cr Cu Mn Ni Pb
1 2493 4170 4884 9665 4525 1968
2 2336 3598 4408 8476 3605 1821
3 2327 3534 4309 8283 3452 1869
4 4275 4490 5882 18087 4123 2039
5 3989 4364 5806 17932 4012 2000
6 2203 3220 3362 6470 2533 1516
7A 2322 4049 4813 10907 4228 2032
7B 2532 4112 4828 10130 4114 2017
7C 2430 4073 4753 10895 4146 2011
8 5156 4642 5930 20045 3885 2033
9 2452 3413 4361 6609 3414 1755
10 2411 3468 4273 6464 3261 1753
11 3249 4354 5375 16305 3355 2050
12 3197 4207 5218 15844 3306 2000
13 2320 3435 4479 6993 3496 1810 451
3

2
3 réplicas
Sinais autoescalados

(7A a 7C)
1

-1 Cd
Cr
Cu
-2 Mn
Ni
Pb
-3
Exp1 Exp2 Exp3 Exp4 Exp5 Exp6 Exp7A Exp7B Exp7C Exp8 Exp9 Exp10 Exp11 Exp12 Exp13

Experimentos
452
Estratégia de otimização
0,8
Ni
0,6

0,4
Pb

0,2
PC2

0,0 Cr
Cu

-0,2

Mn
-0,4
Cd
-0,6
0,28 0,32 0,36 0,40 0,44 0,48
PC1
453
Interpretação dos dados
6500

6000

5500

5000
[Cu]

4500

4000 Equation y = a + b*x


Weight No Weighting
Residual Sum of 885279,67343
Squares
3500 Adj. R-Square 0,86336
Value Standard Error
B Intercept -882,99706 609,40305
B Slope 1,4532 0,15365
3000
3000 3200 3400 3600 3800 4000 4200 4400 4600 4800
[Cr]

454
Interpretação dos dados

6500

6000

5500

5000
[Cu]

4500

Equation y = a + b*x
4000 Weight No Weighting
Residual Sum of 4,60994E6
Squares
Adj. R-Square 0,28845
3500 Value Standard Error
B Intercept 1873,56122 1160,49839
B Slope 0,80391 0,31115

3000
2400 3000 3600 4200 4800
[Ni]

455
Interpretação dos dados

6000 Equation y = a + b*x


Weight No Weighting
5500 Residual Sum 1,04672E7
of Squares
Adj. R-Square -0,012
5000 Value Standard Error
B Intercept 1329,7973 1748,68923
4500 B Slope 0,42818 0,46886

4000
[Cd]

3500

3000

2500

2000

1500
1800 2400 3000 3600 4200 4800
[Ni]

456
Estratégia de otimização
0,8
Ni
0,6

0,4
Pb

0,2
PC2

0,0 Cr
Cu

-0,2

Mn
-0,4
Cd
-0,6
0,28 0,32 0,36 0,40 0,44 0,48
PC1
457
Estratégia de otimização
2

1
7A
7C
7B
1

1332
PC2

0
9
10
5 4
11
12
-1

8
6

-2
-5 -4 -3 -2 -1 0 1 2 3 4 5
PC1 458
Região adequada
para Cd, Cr, Cu,
Mn e Pb

Região adequada
para Ni

459
Respostas: intensidades de 6 metais
Experimento Cd Cr Cu Mn Ni Pb
1 2493 4170 4884 9665 4525 1968
Região 2 2336 3598 4408 8476 3605 1821
adequada
para Ni 3 2327 3534 4309 8283 3452 1869
(alto PC2) 4 4275 4490 5882 18087 4123 2039
5 3989 4364 5806 17932 4012 2000
6 2203 3220 3362 6470 2533 1516
7A 2322 4049 4813 10907 4228 2032
7B 2532 4112 4828 10130 4114 2017
7C 2430 4073 4753 10895 4146 2011
8 5156 4642 5930 20045 3885 2033
Região adequada 9 2452 3413 4361 6609 3414 1755
para Cd, Cr, Cu, 10 2411 3468 4273 6464 3261 1753
Mn e Pb
(alto PC1) 11 3249 4354 5375 16305 3355 2050
12 3197 4207 5218 15844 3306 2000
13 2320 3435 4479 6993 3496 1810460
Resumo
 Excelente alternativa quando as
respostas são muitas

461
Planejamento de
misturas

462
Preparando um
suco de abacaxi

0,00
1,00

0,25
0,75

B(
a)
gu


0,50

uc
0,50

ar)
C

0,75
0,25

1,00
0,00
0,00 0,25 0,50 0,75 1,00
A (Suco conc)

463
0,0 87,5% solução de
Preparando um 0,00 0,0 açúcar (150g/600 mL)
suco de abacaxi 1,00
6,25% água
6,25% suco
0,25
0,75
7,5

B(
a)
gu


(Á 0,50

uc
6,0 5,0
4,5 8,5 0,50

ar)
C

5,0 6,0
4,5
9,0
0,75 8,0
0,25

0,5
3,5 1,0 2,0
1,00 4,0 0,5
0,00
0,00 0,25 0,50 0,75 1,00
0,0 1,5
0,0 A (Suco conc) 1,0

464
Modelos que podem ser
calculados

Quadrático
Y = b1v1 + b2v2 + b3v3 + b12v12 + b13v13 + b23v23

Cúbico
Y = b1v1 + b2v2 + b3v3 + b12v12 + b13v13 + b23v23 + b123v123

465
Preparando um suco de
D
abacaxi, melhor modelo
0,00 6,760
ajustado 1,00
5,915

5,070
0,25
0,75
4,225

B(
a)
gu


3,380
0,50

uc
X1 = 50% 0,50

ar)
C

X2 = 50% 2,535
Y max = 6,1
1,690
0,75
0,25
0,8450

0,000
1,00
0,00
0,00 0,25 0,50 0,75 1,00
y  22,3x1x2  22,1x1x3 A (Suco conc)
466
Planejamento de Misturas 0,0
3,2 1,0
3,0

0,2
Preparação de uma
0,8 membrana
) 4,0
(x3

0,4

KC
6
N)

0,6
(C

l (x
3,9 1,9
4 e

2)
4,4 1,2
KF

4,1 2,0
0,6
3,6 0,4
3,4

0,8
0,2
1,8 1,6

1,0
0,0
0,4 0,3 0,5
0,0 0,2 0,4 0,6 0,8 1,0
0,3 0,3 0,4
0,2 KCl (x2) 467
0,0
3,2 1,0
3,0

X1 = 67% y  3,14x1 9,61x1x3  30,88x1x2x3


X2 = 2% 0,2
X3 = 31% 0,8

)
4,0

(x3
0,4 *

KC
6
N)
Y max = 4,2 0,6
(C

l (x
3,9 1,9
4 e

2)
4,4 1,2
KF

3,8
4,1 2,0
0,6
3,6 3,3 0,4
3,4

2,8
2,4
0,8
0,2
1,8 1,9
1,6
1,4

0,9
0,5
1,0
0,0
0,4 0,3 0,5
0,0 0,2 0,4 0,6 0,8 1,0
0,3 0,3 0,4
0,2
Pirrol (x1)
KCl (x2) 468
Reflexão final

Mesmo inseguro sobre o emprego


das ferramentas quimiométricas,
você estará procedendo de forma
mais correta do que se estivesse
utilizando o método univariado.

469
Obrigado a
todos pela
atenção!

Contatos
e-mail: [email protected] ou [email protected]
Home page: http://www.gaia.ufscar.br
470

Você também pode gostar