Aplicação de Conceitos de Manutenção Preditiva Com Aplicação de Ferramentas de Inteligência Artificial
Aplicação de Conceitos de Manutenção Preditiva Com Aplicação de Ferramentas de Inteligência Artificial
Aplicação de Conceitos de Manutenção Preditiva Com Aplicação de Ferramentas de Inteligência Artificial
Dissertação submetida a
Faculdade de Engenharia da Universidade do Porto
para o grau de:
Orientador na FEUP:
Prof. Luís Andrade Ferreira
i
Abstract
The present dissertation was developed in the context of the Integrated Master’s
Degree in Mechanical Engineering, specialization in Project and Mechanical Cons-
truction, in the Faculty of Engineering of the University of Porto.
The growing competitiveness of the market, coupled with the increase in automation
driven by the advent of the Industry 4.0, highlights the importance of maintenance
within organizations. At the same time, the amount of data capable of being extrac-
ted from industrial systems has increased exponentially due to the proliferation of
sensors, transmission devices and data storage via Internet of Things. These data,
when processed and analyzed, can provide valuable information and knowledge
about the equipment, allowing a move towards predictive maintenance.
iii
Data is the new Oil. It is only useful when
refined.
Agradecimentos
Não poderia deixar de agradecer à minha família, amigos e colegas de curso, pelo
apoio incondicional ao longo destes anos.
Por fim, gostaria de agradecer a todas as pessoas que direta ou indiretamente torna-
ram possível a realização deste trabalho e me ajudaram a dar um passo importante
na caminhada da minha formação pessoal e académica.
vii
Conteúdo
Lista de Figuras xv
1 Introdução 1
1.1 Enquadramento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Estado da Arte 5
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.6.1 Manutibilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
ix
2.6.2 Fiabilidade e Disponibilidade . . . . . . . . . . . . . . . . . . . 14
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4 Machine Learning 29
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.10 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.1 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
xiii
4.7 Exemplo de underfitting e overfitting [38] . . . . . . . . . . . . . . . . 37
5.1 Evolução dos dados de Telemetria ao longo dos primeiros quinze dias
do mês de Janeiro de 2015, para a máquina 1 . . . . . . . . . . . . . . 48
5.17 Importância das features para para Decision Tree no conjunto de desen-
volvimento com Max_Depth=6 . . . . . . . . . . . . . . . . . . . . . . 68
xvii
5.14 Resultado para K-Nearest Neighbors no conjunto de desenvolvimento
com “n-neighbors”= 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
AI Artificial Intelligence
ANN Artificial Neural Network
AR Augmented Reality
BN Bayesian Network
DL Deep Learning
FN False Negative
FP False Posite
IA Inteligência Artificial
IoT Internet of Things
NN Neural Networks
RF Random Forests
RNN Recurrent Neural Network
RTF Run-To-Failure
xix
RUL Remaining Useful Life
TN True Negative
TP True Positive
VR Virtual Reality
1. Introdução
1.1. Enquadramento
1
2 1.1. Enquadramento
A Indústria 4.0 é um conceito que surge em novembro de 2011, num artigo publicado
pelo governo Alemão [3], relativamente a uma estratégia de desenvolvimento tecno-
lógico. É caracterizada pela fusão conceptual de tecnologias que encurtam a fronteira
entre os sistemas físico, digital e o ser humano, através de um conjunto de avanços
e desenvolvimentos tecnológicos disruptivos, que afetam a indústria a nível global,
tais como a Internet of Things (IoT), Cyber-Physical Systems (CPS), Virtual/Augmented
Reality (VR/AR), Big Data e Cloud Computing [1].
1
Capítulo 4
1.2. Objetivos
ratura científica.
2.1. Introdução
De acordo com Giagi (2007) [9], “para que uma instalação assegure a função para
que foi concebida, é necessário que os seus equipamentos e máquinas sejam mantidos
em boas condições de funcionamento. Isto requer que sejam efetuadas reparações,
inspeções, rotinas preventivas, substituição de componentes ou peças, mudanças de
óleo, limpezas, correções de defeitos e pinturas para que se possa repor os níveis de
operacionalidade. Este conjunto de ações forma o leque de atividades da Função de
Manutenção”.
5
6 2.2. Definição de Manutenção
É possível encontrar várias definições para a manutenção propostas por diversos au-
tores. Para Pinto [10], a manutenção é o ato de “combinar ações de gestão, técnicas e
económicas, aplicadas aos bens para otimização do seu ciclo de vida”. Já para Cabral
[11], a manutenção pode ser definida como “o conjunto das ações destinadas a as-
segurar o bom funcionamento das máquinas e das instalações, garantindo que estas
são intervencionadas nas oportunidades e com o alcance certo, de forma a evitar que
avariem ou baixem de rendimento e, no caso de tal acontecer, que sejam repostas em
boas condições de operacionalidade com a maior brevidade, tudo a um custo global
otimizado”.
Algumas das principais limitações presentes atualmente na manutenção são [2, 14]:
Esta abordagem é de fácil implementação, uma vez que não necessita de grandes
esforços de organização e planeamento o que, consequentemente, conduz a uma
diminuição dos custos indiretos da manutenção, isto é, custos associados às ativida-
des de gestão, organização e planeamento da manutenção [11, 14]. No entanto, a
manutenção corretiva apresenta diversas desvantagens: uma paragem não planeada
leva a um aumento do custo e perdas na produção; possível aumento no número de
defeitos; diminuição do tempo útil de vida dos equipamentos; aumento do risco de
acidente e consequente redução da segurança dos utilizadores do equipamento [11,
14].
De notar que na MPS não existe o recurso à monitorização nem à análise do estado
atual dos equipamentos e dos seus componentes [11] e, portanto, podem ser realiza-
das ações de manutenção desnecessárias, que contribuem para um aumento do custo
total da manutenção e afetam o estado de equilíbrio entre os vários componentes do
equipamento [10, 11].
De acordo com Schmidt (2017) [18], a manutenção preditiva, de modo a ser capaz
de estimar a saúde e o estado de degradação dos equipamentos, deve utilizar vários
tipos de informação:
Figura 2.2: Intervalo de Tempo “P-F” entre a deteção do início da falha (P) e o
momento em que existe perda da função (F) [19]
Com o advento da Internet of Things (IoT), cada vez mais parâmetros relacionados
com a condição dos equipamentos estão disponíveis em tempo real, possibilitando
assim estimar a duração do intervalo de tempo “P-F” com maior precisão, permitindo
uma abordagem “just in time” à prevenção de falhas, prolongando a vida útil dos
componentes [19]. Além disso, Big Data2 pode permitir determinar fatores adicionais
com possível influência neste intervalo, para um determinado modo de falha numa
peça especifica, sob condições especificas [5, 19].
2
Secção 3.3
uma falha) de modo a poder treinar e testar modelos3 que permitem prever falhas
nos equipamentos [15].
Na Figura 2.3 está representada uma visão geral das diferentes estratégias de ma-
nutenção abordadas até aqui, num intervalo de tempo [t0 , t], no que diz respeito
à deteção e possível ocorrência de uma falha e ainda o posicionamento e duração
temporal dos custo e indisponibilidade dos equipamentos [16].
3
Capítulo 4
Por exemplo, dado que um determinado equipamento opera com uma temperatura
variável nos seus rolamentos, os métodos preditivos informam quando é provável a
ocorrência de uma falha devido ao seu perfil de temperatura [21]. Por outro lado, os
métodos prescritivos informam que a redução da velocidade do equipamento numa
certa quantidade pode permitir duplicar o tempo até ocorrer uma falha [21].
2.6.1. Manutibilidade
É quantificada pelo parâmetro Mean Time To Repair (MTTR) (Tempo Médio de Re-
paração) - Equação 2.1. Representa a média de tempo que leva a reparação dos
equipamentos, na qual o intervalo de tempo considerado é entre a deteção de uma
falha até à retoma de trabalho.
TTR
P
MTTR = (2.1)
N
Onde:
TBF
P
MTBF = (2.2)
N
Onde:
Outro parâmetro associado ao MTBF é a taxa de falhas (λ) - Equação 2.3 - que pode
ser definida como a razão entre o número de falhas, n, e o produto entre um deter-
minado intervalo de tempo, τ , e o número de equipamentos sobre o qual incide a
análise. Este parâmetro quantifica a frequência média de falhas por equipamento.
Desta forma, tem-se que:
n
λ= (2.3)
mτ
• Juventude (Fase Inicial): a taxa de falhas é mais elevada, sendo que depois
decresce e tende a estabilizar;
• Maturidade: as falhas são aleatórias, com taxa de falhas baixa e aproximada-
mente constante;
• Velhice (Fase Final): a taxa de falhas aumenta de uma forma acentuada, de-
vido a factores como a acumulação de danos, fadiga ou degradação.
MTBF
D= × 100 % (2.4)
MTBF + MTTR
Onde:
A gestão da manutenção é uma atividade dinâmica que envolve funções como o pla-
neamento, a coordenação, a monitorização e o controlo de recursos [10]. Neste
sentido, a manutenção pode ser considerada como uma atividade de apoio à produ-
ção, uma vez que contribui para uma melhoria da operacionalidade dos equipamen-
tos [10]. Ainda assim, é muitas vezes designada como um “mal necessário” para a
empresa, pois possui sempre um determinado custo associado, além de forçar a para-
gem de equipamentos e, consequentemente, da produção. No entanto, atualmente,
a manutenção pode ser um fator estratégico para garantir alta produtividade de sis-
temas industriais [10]. É, portanto, fundamental desenvolver estratégias de gestão
de manutenção [10].
Esta definição impõe uma visão global da gestão de ativos físicos, desde a sua fase
inicial de projeto até à sua desativação e abate [25]. Este é um processo de análise
económica com fim a avaliar o custo do ciclo de vida de aquisição, posse e alienação
de um equipamento [25]. Esta análise pode ser útil em qualquer etapa da vida de
um equipamento, no entanto, quando realizada na fase de conceção e/ou aquisição,
revela-se de maior utilidade dado que permite conhecer as diferentes alternativas que
podem surgir nesta fase e compreender qual será o custo total dos equipamentos ao
longo da sua vida, podendo assim auxiliar a tomada de decisão com base não apenas
nos custos iniciais, mas em todos os custo envolvidos [25]. A título de exemplo, na
Figura 2.6 está representada a evolução dos custos gerados para dois equipamentos
distintos A e B. Apesar do equipamento A apresentar um custo inicial mais elevado
(equipamento de qualidade superior), o custo de ciclo de vida é superior para o
equipamento B (de menor qualidade e menor vida útil) [23].
Figura 2.6: Comparação do Custo do Ciclo de Vida para dois equipamentos com
custo inicial distintos [23]
A fiabilidade tem um grande impacto no custo do ciclo de vida, sendo que, em muito
sistemas, pode até ser um dos fatores de custo mais importantes nesta análise [10].
As faltas de fiabilidade, ou seja, as falhas dos equipamentos, podem originar diferen-
tes tipos de custos, desde custos diretos, resultantes das intervenções de manutenção
como materiais e peças de substituição, assim como custos indiretos como a perda
de produção, mão-de-obra de produção parada, perdas financeiras devido à paragem
dos equipamentos, entre outros [10]. Estes fatores são normalmente representados
com recurso ao “iceberg” dos custos de manutenção - Figura 2.7.
3.1. Introdução
A primeira revolução industrial, que ocorreu em finais do século XVIII, ficou carac-
terizada pela mecanização da produção, usando água e energia a vapor como fontes
desse movimento [29]. Na segunda revolução industrial, final do século XIX e início
21
22 3.3. Indústria 4.0
do século XX, surge a produção em larga escala de produtos, de uma forma rápida e
barata, com a energia elétrica como o fator de inovação [29]. Na terceira revolução
industrial, durante os anos 70 do século passado, surge o advento das tecnologias de
informação e comunicação [29]. Com a revolução digital, a que ela dá origem, surge
o uso intensivo dos computadores pela sociedade, a Internet e as plataformas digitais
[28]. Atualmente, estamos perante a Indústria 4.0, como uma quarta revolução in-
dustrial, que assenta no desenvolvimento de Sistemas Ciber-Físicos inteligentes com
capacidade de resposta rápida e assertiva a alterações na produção e ainda supervi-
são contínua de equipamentos e processos [26, 28]. Na Figura 3.1 está representada
a cronologia das revoluções industriais.
A Indústria 4.0 é um conceito que surge em novembro de 2011, num artigo publi-
cado pelo governo Alemão [3], relativamente a uma estratégia de desenvolvimento
tecnológico. Caracteriza-se essencialmente por um conjunto de avanços e desenvol-
vimentos tecnológicos disruptivos, que afetam a indústria a nível global, tais como a
Internet of Things (IoT), os Cyber-Physical Systems (CPS), a Virtual/Augmented Reality
(VR/AR), o Big Data e o Cloud Computing [26, 27].
A Internet das Coisas (Internet of Things - IoT) pode ser definida como um ecossis-
tema no qual os objetos e equipamentos nele inseridos estão equipados com sensores
e outros dispositivos digitais, sendo assim capazes de reunir e trocar informações
uns com os outros, num sistema interligado em rede [1]. Esta tecnologia permitirá
Os sistemas Ciber-Físicos resultam da fusão do nível físico com o nível digital, inte-
grando computação e redes de comunicação que interagem entre si e influenciam-se
mutuamente [26]. No caso da manutenção preditiva, por exemplo, os dados rela-
tivos a parâmetros de processo de componentes mecânicos (elementos físicos) são
armazenados em sistemas digitais e, assim sendo, a condição real do sistema resulta
da interação dos seus elementos físicos com os parâmetros digitais implementados
[26].
Os dados recolhidos via IoT necessitam de ser analisados e processados [27]. O con-
ceito Big Data está relacionado com esta grande quantidade de dados que são gerados
e armazenados a cada instante resultantes da existência de um elevado número de
sistemas em rede via IoT [1]. Por ser um volume exponencial, torna-se impossível
a sua gestão manual. “Dados” podem ser números, palavras ou outros sinais e re-
presentam factos discretos sobre uma realidade objetiva [1]. Podem ser verificados
e validados, contudo não tem qualquer significado se não forem interpretados e con-
textualizados, dando origem a informação passível de ser utilizada como auxílio à
tomada de decisão. A capacidade de processar estes dados é fundamental, de modo
a permitir que estes possam ter significado e que as organizações sejam capazes de
melhorar as operações com decisões mais rápidas e inteligentes [1]. Na Figura 3.2
está representada a Hierarquia DIKW, de “Data-Information-Knowledge-Wisdom”, que
é por vezes utilizada no campo da ciência dos dados e procura refletir a relação entre
os vários níveis de informação [30].
O Cloud Computing tem oferecido um outro tipo de vantagens para a indústria, nome-
adamente, tarefas de computação com maior capacidade e rapidez, armazenamento
de dados em grande escala e outros recursos computacionais, incluindo servidores,
armazenamento, bases de dados, rede, software e análises, através da Internet (“a
cloud”) para disponibilizar mais rapidamente recursos flexíveis [1].
Luger [31] define IA como o ramo da ciência da computação que se ocupa da automa-
ção do comportamento inteligente, focado no desenvolvimento de sistemas que exi-
bem características que estão associadas à inteligência no comportamento humano,
como a compreensão da linguagem, raciocínio e resolução de problemas.
Inteligência artificial (IA), Machine Leaning (ML) e Deep Learning (DL) são conceitos
que estão relacionados, sendo que, habitualmente existe dificuldades para diferenciá-
los. Com o objetivo de ilustrar as suas diferenças (Figura 3.3), são apresentadas as
seguintes definições [6]:
Por outro lado, o Machine Learning pode ser considerado como uma vertente da IA,
sendo definido como “o conjunto de métodos capazes de detetar padrões automatica-
mente num conjunto de dados e usá-los para fazer previsões acerca de dados futuros,
ou para tomar outro tipo de decisões num ambiente de incerteza”. O tema Machine
Learning será analisado com detalhe no Capítulo 4 [6].
Por último, o Deep Learning é um ramo do Machine Learning que, de uma forma
simples, procura produzir representações hierárquicas de alto nível dos dados de
entrada, por meio de camadas de processamento sequencial numa rede neuronal
artificial [6].
Figura 3.3: Distinção entre Inteligência Artificial, Machine Learning e Deep Learning
[33]
Alguns dos desafios mais relevantes são a pouca familiarização com uma visão e es-
tratégia digital, desconhecimento dos benefícios tecnológicos, recursos financeiros,
segurança de dados, falta de qualificação de recursos humanos, falta de normas e
legislação, ou insuficiências na infraestrutura tecnológica [4]. A criação de uma ar-
O Machine Learning pode ser definido como “o campo de estudo que dá ao compu-
tador a habilidade de aprender sem ser explicitamente programado”. De forma mais
simples, pode dizer-se que “os algoritmos de Machine Learning usam métodos compu-
tacionais para aprender informação diretamente dos dados sem recurso a equações
pré-definidas como modelo” [6].
O Machine Learning certamente não será capaz de resolver todos os problemas para
os quais ainda não há resposta, no entanto, o seu potencial não deve ser desprezado
[35]. De entre as várias tarefas para as quais há uma elevada probabilidade das
ferramentas de Machine Learning serem usadas com sucesso, destacam-se:
29
30 4.2. Tipos de Machine Learning
Supervised learning
Supervised learning é um dos modos de aprendizagem mais comum e também com
maior sucesso [35]. Neste, os dados fornecidos aos algoritmos durante a fase de
treino incluem a solução desejada (label), isto é, a variável dependente resultante
das variáveis independentes observadas [6]. É assim possível desenvolver modelos
preditivos capazes de gerar respostas para novos dados [35].
Por outro lado, as técnicas de regressão prevêem respostas contínuas [35]. Um exem-
plo de um problema deste tipo é, dado um conjunto de dados sobre o tamanho de
casas no mercado imobiliário, tentar prever o seu preço (variável contínua) [35].
Unsupervised learning
Em alguns casos, conseguir dados com a solução desejada (label) pode ser caro ou
até mesmo impossível [35].
Reinforcement learning
Em reinforcement learning , o sistema tenta aprender qual a melhor ação a ser to-
mada, dependendo das circunstâncias na qual essa ação será executada [35]. Como,
a priori, não sabe o que irá acontecer no futuro, é desejável uma abordagem que
leve em consideração essa incerteza, capaz de incorporar as eventuais mudanças no
processo de tomada da melhor decisão [35]. Uma recompensa ou punição é dada ao
sistema de apredizagem, dependendo da decisão tomada; ao longo do tempo e com
a repetição do processo, espera-se que este seja capaz de associar as ações que geram
maior recompensa para cada situação que o ambiente apresenta, e passe a evitar as
ações que geram punição ou recompensa menor [35].
Semisupervised learning
Alguns algoritmos são capazes de lidar, em simultâneo, com uma combinação de
dados de treino categorizados (normalmente em pequena quantidade) e não catego-
rizados (em grande quantidade) - Figura 4.3 [35]. Esta combinação de um grande
número de dados não categorizados, regra geral mais fáceis de obter, com alguns
Outro critério usado para classificar os sistemas de Machine Learning é a sua capaci-
dade de aprender de forma incremental (Figura 4.4), a partir de um fluxo de dados
recebidos [35]. Em batch learning (Figura 4.4a), o sistema é incapaz de aprender
incrementalmente, sendo que necessita de acesso à totalidade dos dados para ser
treinado [35]. De modo a fornecer novos dados ao sistema, é necessário treinar um
nova versão com o conjunto de dados completo (não apenas os novos dados, mas
também os antigos) [35].
Por outro lado, em online learning (Figura 4.4b), a fase de treino é realizada de forma
incremental, isto é, o sistema é capaz de treinar continuamente ao ser alimentado
com exemplos [35]. Este modo de treino é ideal para sistemas que recebem um fluxo
de dados contínuo e necessitam de se adaptar de forma rápida ou autónoma [35].
A última divisão dos sistemas de Machine Learning baseia-se no modo como as pre-
visões são efetuadas, ou seja, na forma como os modelos generalizam (Figura 4.5).
Dado um conjunto de exemplos para treino, o modelo tem de ser capaz de generali-
zar para exemplos desconhecidos. Esta generalização pode basear-se em medidas de
similaridade (distância) aos exemplos conhecidos - instance-based learning (Figura
4.5a) - ou então pode basear-se num modelo matemático associado a estes sistemas
- model-based learning (Figura 4.5b) [35].
Caso o erro cometido pelo modelo seja baixo no conjunto de treino mas alto no
conjunto de teste significa que o modelo pode apresentar overfitting, isto é, o modelo
é capaz de explicar muito bem os dados de treino, mas não de generalizar [35]. Por
outro lado, o underfitting acontece quando o modelo ”não aprendeu o suficiente“, ou
seja, não é capaz de capturar a tendência subjacente dos dados de treino [35]. Na
Figura 4.7 estão representados estes comportamentos. Dependendo do modelo em
questão, é importante procurar um desempenho que se situe entre o underfitting e
o overfitting [37]. Estes dois termos estão também ligados aos conceitos de bias e
variance (Figura 4.8) [35]. O conceito de bias está relacionado com o underfitting e
significa que o algoritmo tende a aprender consistentemente a mesma coisa errada
[35]. O conceito de variance, relacionado com o overfitting, ocorre quando não existe
um padrão nos erros de previsão [35].
Cada algoritmo de Machine Learning possui diversos parâmetros que podem ser afina-
dos de modo a procurar obter uma melhor performance para cada dataset específico
[6]. A estes parâmetros intrínsecos dos algoritmos dá-se o nome de hiperparâmetros
[6].
Métricas de Avaliação
O processo de avaliação dos modelos é essencial em qualquer projeto de Machine
Learning [6, 35]. Existem várias métricas de avaliação distintas, sendo que, é neces-
sário escolher com cuidado quais usar, uma vez que a performance dos modelos será
inteiramente dependente da métrica escolhida [5, 6, 35].
A métrica mais simples é a Accuracy (Equação 4.1), que representa a razão entre o
número de previsões efetuadas com sucesso e o número total de previsões efetuadas
[6]. No entanto, quando existe desequilíbrio entre classes, esta métrica pode não ser
a mais indicada [6].
TP + TN
Accuracy = (4.1)
TP + FP + TN + FN
Previsão
Positivo Negativo
Positivo TP FN
Real
Negativo FP TN
TP
Precision = (4.2)
TP + FP
TP
Recall = (4.3)
TP + FN
O F1 score - Equação 4.4 - é uma média harmónica destas duas métricas que dá
mais peso a valores mais baixos, pelo que um modelo com um elevado F1 score tem
Precision e Recall elevados [6].
2 Precision × Recall TP
F1 Score = 1 1 =2× = (4.4)
Precision
+ Recall
Precision + Recall T P + F N +F
2
P
Estas métricas são, regra geral, mais importantes para problemas de classificação
binária [5, 6], no entanto, permitem também tirar conclusões importantes em pro-
blemas de classificação multi-classe [40]. No Capítulo 5 será realizada uma aplicação
destas métricas de avaliação num problema de classificação multi-classe. A Accuracy,
para classificação multi-classe, define-se novamente como a fração de exemplos cor-
retamente classificados. Uma vez mais, quando existe um desequilíbrio entre classes,
a Accuracy pode não a métrica de avaliação mais adequada [6]. Em relação às métri-
cas Precision, Recall e F1 Score para problemas multi-classe, estas são calculadas, para
cada uma das classes, de forma semelhante aos problemas binários, obtendo assim,
para cada uma das classes, um valor de Precision, Recall e F1 Score. De seguida, é
possível realizar uma média sob todas as classes [6]. Esta média pode ser realizada
de acordo com uma das seguintes estratégias [6]:
• “Macro Averaging”: É realizada uma média não ponderada com igual peso para
todas as classes, independentemente do seu tamanho relativo;
• “Weighted Averaging”: É realizada uma média ponderada tendo em considera-
ção o tamanho relativo de cada classe;
• “Micro Averaging”: É calculado o número total de falsos positivos, falsos nega-
tivos e verdadeiros positivos em todas as classes e, de seguida, utilizando estes
valores, as métricas de avaliação multi-classe são calculadas.
Relativamente aos dados utilizados, é necessário que estes sejam relevantes para o
problema. Geralmente, é recomendado conceber sistemas de previsão sobre compo-
nentes específicos e não subsistemas maiores, uma vez que estes terão dados mais
dispersos [41].
Em sistemas críticos, eventos de falha são raros. Ainda assim, ao construir mode-
los de previsão, os algoritmos necessitam de aprender acerca do padrão operacional
normal de um componente, assim como os seus padrões de falha [41]. Os dados
de treino devem conter um número suficiente de exemplos de ambas as categorias.
Assim, no que diz respeito à origem dos dados, as fontes relevantes para a manuten-
ção preditiva incluem, mas não se limitam a: histórico de falhas, histórico de ma-
nutenção e reparação, condições de funcionamento do sistema e informações acerca
dos equipamentos [41].
Contudo, segundo [43], uma razão que pode explicar o ainda baixo número de publi-
cações científicas é a complexidade de implementação de estratégias de manutenção
preditiva em ambientes industriais. Mais ainda, o recurso a algoritmos de Machine
Learning em manutenção preditiva necessita de profissionais especialista em Inteli-
gência Artificial e/ou Data Science.
1
http://ieeexplore.ieee.org
2
http://www.sciencedirect.com
Figura 4.10: Número de publicações científicas, por ano, de acordo com os critério
estabelecidos [15]
tiplas áreas [15]. Os equipamentos onde estes métodos são aplicados incluem, mas
não se limitam a, turbinas, motores, compressores, bombas [15]. Cerca de 89% dos
artigos utiliza um conjunto de dados reais, sendo que 11% recorre a dados sintéticos
[15]. Em relação à utilização dos algoritmos de Machine Learning nas publicações
científicas analisadas em [15], o mais utilizado é Random Forest (RF) - 33%, seguido
de métodos baseados em Neural Networks (NN), como por exemplo Artificial NN,
Convolution NN, Long Short-Term Memory Network (LSTM) e Deep Learning - 27%,
Support Vector Machine (SVM) - 25% e k-means - 13% [15]. Foi também verificado
uma maior tendência de uso de sinais de vibração [15].
Tabela 4.2: Resumo da revisão sistemática da literatura científica mais recente para
manutenção preditiva com métodos de Machine Learning - Adaptado de [15]
Referência Algoritmo de ML Equipamento Conjunto de Dados
(Onanena et al., 2009) [44] LR Célula de combustível Medições de espectroscopia de impedância eletroquímica
(Hong and Zhou, 2012) [45] GPR Rolamentos Dados de vibração
(Susto et al., 2013) [46] SVM Filamento de Tungsténio Ciclos históricos de manutenção
(Schopka et al., 2013) [47] LR, RF, BN Filamento Dados de processo, equipamentos e logística de avaria
(Li et al., 2014) [48] SVM Rede Ferroviária Dados de falhas, manutenção, inspeção, tipo e clima
(Praveenkumar et al., 2014) [49] SVM Caixa de Velocidades Automóvel Sinais de vibração
(Prytz et al., 2015) [50] RF Compressores de ar em caminhões e autocarros Dados On-board e registos de serviços
(Biswal and Sabareesh, 2015) [51] ANN Turbina Eólica Dados de acelerómetros
(Machado and Mota, 2015) [52] ANN and SVM Sistemas de energia elétrica Sinais elétricos
(Durbhaka and Selvaraj, 2016) [53] k-NN, SVM, k-means Rolamentos Sinais de vibração
(Aydin and Guldamlasioglu, 2017) [54] LSTM Motor Dados operacionais e de medições de sensores
(Canizo et al., 2017) [55] RF Turbina Eólica Dados operacionais e de estado
(Santos et al., 2017) [56] RF Motores de Indução Formas de onda de corrente e tensão
(Su and Huang, 2018) [57] RF Disco Rígido Dados históricos (vibração, temperatura)
(Uhlmann et al., 2018) [58] k-means Fusão a Laser Dados do sensor da máquina-ferramenta
(Amihai et al., 2018) [59] RF Bombas Industriais Sinais de vibração
(Huuhtanen and Jung, 2018) [60] CNN Painéis fotovoltaicos Sinal diário de energia elétrica
(Kulkarni et al., 2018) [61] RF Sistemas de refrigeração para supermercados Dados de sensor de temperatura
(Luo et al., 2018) [62] Deep Learning Máquina de Comando Numérico Computadorizado Sinais de vibração
5.1. Introdução
45
46 5.2. Origem dos Dados
Os dados foram adquiridos ao longo de um ano (2015) para cem máquinas, à exceção
do histórico de manutenção, que contém também registos do ano de 2014 [7].