MONOGRAFIA AnaliseCinematicaBiomecanica
MONOGRAFIA AnaliseCinematicaBiomecanica
MONOGRAFIA AnaliseCinematicaBiomecanica
João Monlevade
2021
FABIO DUARTE GUIEIRO LOPES
João Monlevade
2021
SISBIN - SISTEMA DE BIBLIOTECAS E INFORMAÇÃO
CDU 531.1:004.8
FOLHA DE APROVAÇÃO
Membros da banca
Doutor - Prof. Talles Henrique de Medeiros - Orientador(a) - Universidade Federal de Ouro Preto
Doutor - Prof. Luiz Carlos Bambirra Torres - Universidade Federal de Ouro Preto
Doutor - Prof. Rafael Frederico Alexandre - Universidade Federal de Ouro Preto
Prof. Talles Henrique de Medeiros, orientador do trabalho, aprovou a versão final e autorizou seu depósito na Biblioteca Digital de Trabalhos de Conclusão de Curso
da UFOP em 14/06/2021.
Documento assinado eletronicamente por Talles Henrique de Medeiros, PROFESSOR DE MAGISTERIO SUPERIOR, em 15/06/2021, às 13:50,
conforme horário oficial de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.
Referência: Caso responda este documento, indicar expressamente o Processo nº 23109.005873/2021-39 SEI nº 0182553
The search for physical activities as a way of leisure on healthy life maintenance has
grown significantly in the past few years. In the same rhythm, musculoskeletal injuries have
become more common, as a reflex of the practice of physical activities without supervision
and preparation. This work applies mathematical and artificial intelligence concepts with the
objective of identifying kinematics patterns using as input a database about articulation
movements (kinematics) of 28 athletes at 3 different speeds, applying algorithms such as
Fourier transform, K-Means and KNN to make inferences about what the articulation
movements data have to say about the athlete. After the data analysis it was not possible to
identify enough patterns to make such inferences, which motivated a deeper study about the
individuals features, revealing big homogeneity in it.
SUMÁRIO
1 Introdução 13
1.1 Objetivos 13
1.2 Justificativa 14
1.3 Estrutura do Trabalho 15
2 Conceitos Gerais e Revisão da Literatura 16
2.1 Biomecânica de Corrida 16
2.2 Base de Dados 17
2.2.1 O Sistema 19
2.2.2 Análise do Perfil dos Indivíduos 21
2.3 Trabalho sobre Cinética de Corrida 25
2.4 Transformada de Fourier 26
2.5 Agrupamento de Dados 27
2.5.1 K-Means 28
2.5.2 Métricas de Validação de Cluster 29
2.5.2.1 Coeficiente de Silhueta 29
2.5.2.2 Davies-Bouldin 30
2.5.2.3 Calinski-Harabasz 30
2.6 Classificação de Dados 31
2.6.1 K Nearest Neighbors 31
3 Metodologia 33
3.1 Pré-processamento dos Dados 33
3.1.1 Manipulação da Base de Dados 34
3.1.2 Transformada de Fourier 36
3.1.3 Seleção das Componentes da Transformada de Fourier 38
3.1.4 Preparação do vetor de dados 40
3.2 Aplicação do K-Means 41
3.3 Aplicação do KNN 42
4 Apresentação e Análise dos Resultados 44
4.1 Análise da Transformada de Fourier 44
4.2 K-Means 47
4.3 Análise do KNN 51
5 Conclusões 53
Referências 55
13
1 Introdução
Nos dias de hoje, as discussões sobre a qualidade de vida e a saúde têm ganhado
cada vez mais espaço na sociedade. Neste cenário, a longevidade e bem-estar tornaram-se,
além de uma preocupação de saúde pública. Como consequência, o número de indivíduos que
buscam a prática de algum tipo de atividade física, vem se tornando cada vez mais expressivo.
Passamos a almejar não só a saúde física, mas também um equilíbrio entre saúde
física, mental e emocional. Dentro desse âmbito, destacam-se as atividades físicas ao ar livre,
por exemplo, caminhadas e corridas, também conhecidas como pedestrianismo (SALGADO,
J.V. 2006).
Segundo Williams et al (1996) os benefícios da prática de corrida estão
relacionados às funções metabólicas, prevenção de doenças ósseas (osteoporose), doenças
crônico-degenerativas (hipertensão arterial e diabetes), diminuição dos riscos de doenças
cardiovasculares, além de melhoras nos níveis de colesterol, aumentando o HDL e diminuindo
o LDL.
Um estudo de Weineck (2003) aponta ainda o sentimento de prazer, a sensação de
bem-estar, realização própria, o controle do estresse e a superação de limites, como fatores
motivacionais para a procura da corrida de rua. Por outro lado, tem sido observado que muitos
dos novos praticantes não contam com o acompanhamento de um profissional, e isto tem
culminado num aumento do número, e da gravidade das lesões musculoesqueléticas.
Apesar de a taxa de lesões reportada em diferentes estudos variar de 15 a 85%,
devido a um desencontro nos critérios para categorizar uma lesão (Heiderscheit, 2014), nos
últimos 40 anos, ela tem se mostrado estar próximo de 50%, a despeito da evolução
tecnológica significativa no desenvolvimento do calçado de corrida (Nigg et al, 2015). Um
estudo de Borel, Wyngrid Porfirio et al.(2019) analisou diversos artigos e ponderando os
critérios de lesão que cada autor utilizou, chegou ao resultado que a prevalência de lesões no
Brasil é de 36,5%.
A fim de melhorar a qualidade de vida dos praticantes e, consequentemente,
diminuir o índice de lesões nestes indivíduos, é cada vez mais frequente o uso de algoritmos
no auxílio ao processo de diagnóstico (Paniagua et. al 2015) e (Steiner MTA et al 2006), à
predição de riscos (HORNG S et al 2011) e à biomedicina (OBENSHAIN M. K. 2014).
1.1 Objetivos
1.2 Justificativa
De acordo com Hatze (1974) e Hall (2016), a biomecânica é a ciência que estuda o
corpo humano produzindo movimento sob conceitos da mecânica. A mecânica encontra-se
dividida em, estática e dinâmica. Sendo a estática o corpo parado, ou seja, sem deslocamento
e a dinâmica com deslocamento. A mecânica dinâmica pode ser analisada utilizando os
conceitos da cinética e cinemática.
A cinemática descreve os aspectos dos movimentos lineares e angulares, como
deslocamento, velocidade, aceleração e tempo e foi utilizada como objeto do presente trabalho.
Já a análise biomecânica quantitativa consiste em utilizar a tecnologia para
capturar informações acerca do movimento (dinâmica) e transcrever os aspectos do movimento
em formas numéricas. Compõem a análise biomecânica quantitativa os seguintes métodos:
Antropometria, Dinamometria, Cinemetria e Eletromiografia (EMG).
Neste trabalho foram utilizados os métodos de antropometria, dinamometria e
cinemetria. O primeiro, de acordo com Melo e Santos. (2000), serve para criar modelos
antropométricos para auxiliar nos treinos otimizando a individualidade de cada corredor. Sua
utilização foi feita nas duas primeiras etapas do estudo da base de dados. Já a dinamometria é
definida por Suzuki et al (2016) como método utilizado para mensurar as forças atuantes no
sistema e pode ser observado na sexta etapa, onde se analisa o desempenho de cada um dos
participantes através de velocidades de 2,5 m/s, 3,5 m/s e 4,5 m/s. Por fim, a cinemetria é, de
15
acordo com Chung (2000), a análise de movimento a partir de imagens, e isso pode ser visto
na seção que aborda o sistema, onde são explicados os 12 pontos de câmera utilizados no
laboratório.
Este texto está dividido em cinco capítulos. No primeiro capítulo, há uma breve
introdução sobre o objeto de estudo, bem como os objetivos a serem alcançados e a
justificativa, também dita como relevância desse presente.
O capítulo 2 traz o referencial teórico sobre os trabalhos que inspiraram e
trouxeram fomento para que este trabalho fosse possível, bem como a introdução de conceitos
que precisam ser inseridos para a contextualização do estudo.
O capítulo 3 traz a metodologia e todos os passos percorridos no desenvolvimento
da pesquisa, enquanto o capítulo 4 traz os resultados que foram alcançados e algumas
análises sobre eles. Por fim, no capítulo 5 são apresentadas as conclusões e sugestões para
trabalhos futuros.
16
2 Conceitos Gerais e Revisão da Literatura
2.2.1 O Sistema
O método de coleta dos dados obtidos nesse estudo foi realizado a partir da
captura de movimento 3D com 12 câmeras de resolução 4Mb e o software Cortex 6.0. Esses
dados foram coletados em uma esteira ergométrica, enquanto os voluntários caminhavam
sobre o aparelho a diferentes velocidades (2,5 m/s, 3,5 m/s e 4,5 m/s) usando calçados neutros
padrão.
20
Tem-se, nas figuras 3 a 10, o histograma de alguns dos dados analisados dos
corredores. Esses gráficos explicitam a homogeneidade dos atletas selecionados para a
pesquisa. Os histogramas, em sua maioria, tem suas barras niveladas, o que comprova que os
dados coletados não tem amplitude, tampouco diversidade de amostra, o que certamente
influenciou o resultado indefinido no agrupamento dos dados.
Como dito anteriormente, este trabalho vem para dar sequência ao trabalho feito
por Mônica Oliveira (2018), onde a autora utilizou dados do mesmo estudo sobre coleta de
dados de corredores, porém analisou dados sobre a cinética da corrida, isto é, a força
resultante da passada do atleta.
No estudo, a autora se utiliza da Transformada de Fourier, se aproveitando da
propriedade cíclica dos dados recebidos, ou seja, do movimento da passada, extraindo as
características chave desse sinal. Mônica aplicou a transformada de Fourier nos arquivos de
entrada e aplicou algoritmos de aprendizagem de máquina como o K Nearest Neighbor (KNN),
frequentemente aplicado em reconhecimento de padrões, e o Support Vector machine (SVM),
capaz de separar os dados em classes distintas utilizando hiperplano de separação, sendo
ambos algoritmos para classificação de dados. Foi obtido êxito na classificação dos episódios
de lesão, com acurácia de até 77,7%.
Finalmente, a autora concluiu, através de sua pesquisa, que o uso da
Transformada de Fourier desempenhou papel fundamental para escolher e para visualizar
padrões. Além disso, o SVM encontrou um valor de classificação ótimo. Em contrapartida, pôde
perceber que o kNN possui pouca relevância para o estudo, uma vez que não revelou uma alta
taxa de acerto máxima, obtendo apenas 55,5%. Enfim, sua pesquisa não contrasta com a
26
literatura utilizada, pois ela já apontava o kernel Radial Basis Function (Função de Base Radial)
como opção promissora em diversas áreas de pesquisa.
Desde que existe o advento da computação, busca-se entender dados. Com o avanço
das tecnologias e sistemas, o volume de dados disponíveis, de uma maneira geral, tem crescido
exponencialmente, segundo o IDC (2014) chegando a dobrar a cada 2 anos.
Possuir grandes massas de dados em nada ajuda, se não os arranjá-los de forma a
entendê-los e investigar padrões, por isso é necessário, de alguma forma, organizá-los. Neste
contexto, surge como forte opção a clusterização, ou agrupamento dos dados, conceito que
consiste em reunir os dados semelhantes entre si, formando grupos, ou clusters, e revelando
padrões de similaridade.
Agrupamento ou Clustering é uma técnica de mineração de dados não
supervisionada, isto é, agrupa as entradas de dados sem ter o conhecimento prévio do “target”,
valor de saída que o algoritmo busca descobrir. Algoritmos de clustering tem como objetivo
descobrir padrões em objetos de dados, gerando uma partição da base de dados que contenha
grupos (clusters) de objetos com características comuns entre si (FONTANA et al, 2009).
Segundo Jain et al (1999), o agrupamento é de grande utilidade em várias
aplicações que buscam análise de padrões. Como exemplos, na mineração de dados, na
recuperação de documentos, na segmentação de imagens e na classificação de padrões.
28
2.5.1 K-Means
3) Recalcular posição dos centróides como sendo a média dos atuais valores do
grupo.
4) Repetir os passos 2 e 3 até que não haja mais mudança na posição dos
centróides.
29
Figura 13 – Demonstração do funcionamento do algoritmo K-Means.
Proposta pela primeira vez por Peter Rousseeuw (1987), a métrica de coeficiente de
silhueta tem uma abordagem espacial para definir seu valor de saída. O valor de silhueta é a
medida do quanto um objeto é similar aos demais do mesmo grupo (coesão), e quanto ele é
distante dos outros grupos (separação). A saída da função é um valor entre 1 e -1 onde valores
mais próximos de 1 indicam um bom agrupamento, enquanto valores próximos de -1 indicam
um agrupamento ruim.
2.5.2.2 Davies-Bouldin
Proposta por David L. Davies and Donald W. Bouldin (1979) é uma função da razão da
soma da dispersão dentro dos agrupamentos pela dispersão entre os agrupamentos (PAKHIRA
et al, 2004). Quanto menor é o valor de saída desta função, melhor é o resultado do
agrupamento.
2.5.2.3 Calinski-Harabasz
É uma métrica que avalia tanto a distância intra-cluster, distância entre os elementos de
um mesmo cluster, quanto a distância inter-cluster, distância entre diferentes clusters. Em um
estudo de 2001, esta métrica foi classificada como uma das melhores para validação de
clusters (LIPOR e BALZANO, 2020).
Uma vez que os dados foram corretamente extraídos dos arquivos, percebe-se que
esses dados formam um sinal contínuo em relação ao tempo. O sinal extraído dos dados
precisa ser transformado a fim de analisar os componentes periódicos que melhor expressam
esse sinal. Para isso, a solução escolhida foi aplicar a Transformada de Fourier nos dados.
A escolha da ferramenta para esta etapa se deve ao comportamento que sugere
que os sinais possuem periodicidade nos padrões. A Transformada de Fourier, como
anteriormente abordado, é utilizada para decompor o sinal em seus componentes periódicos,
componentes estes que serão posteriormente selecionados e alimentarão o algoritmo de
agrupamento e de classificação de dados.
As Figuras 20, 21 e 22 ilustram o efeito da Transformada de Fourier sobre os
dados. São representados 3 marcadores articulares referentes à articulação denominada
espinha ilíaca esquerda, localizada no quadril, em suas 3 dimensões (X, Y e Z). Na parte
esquerda das figuras estão os gráficos originais, referentes às movimentações dos marcadores
e, à direita, a Transformada de Fourier do sinal original indicando as principais componentes
identificadas.
37
Figura 20 – Gráfico da espinha ilíaca esquerda (dimensão X) do arquivo RBDS001runT25markers e o
gráfico da sua transformada de Fourier.
Tabela 2 – Testes de tempo de execução do algoritmo com as articulações do quadril isoladas X todas
as articulações.
Após a seleção dos picos, a estrutura de dados está como representado na Figura
25: o vetor “todos_os_dados” contém dados extraídos de cada um dos 84 arquivos de dados,
cada um dos arquivos contém informações de cada um dos 96 marcadores articulares e estes,
por sua vez, contém 7 componentes de maior frequência, extraídos da Transformada de
Fourier.
41
Figura 25 – Estrutura do vetor de dados.
Métricas K-Means
Silhouette Coefficient ↑ Calinski-Harabasz ↑ Davies-Bouldin ↓
k=2 0,209238495 23,46235924 1,723454097
k=3 0,218102936 23,50563589 1,537917355
k=4 0,205363685 20,1598248 1,666626053
k=5 0,158503765 17,85519539 1,741296392
k=6 0,174299177 16,22384081 1,635051552
k=7 0,176545869 15,49249176 1,569326256
KNN
valor de K proporção para testes Acurácia alcançada matriz de confusão
verdadeiro falso
1 30% 0.5769230769230769 verdadeiro 1 4
falso 7 14
verdadeiro falso
3 30% 0.7307692307692307 verdadeiro 0 5
falso 2 19
verdadeiro falso
5 30% 0.6923076923076923 verdadeiro 1 4
falso 4 17
verdadeiro falso
7 30% 0.7307692307692307 verdadeiro 0 5
falso 2 19
verdadeiro falso
9 30% 0.8076923076923077 verdadeiro 0 5
falso 0 21
verdadeiro falso
11 30% 0.8076923076923077 verdadeiro 0 5
falso 0 21
Neste capítulo serão apresentadas as análises que puderam ser feitas sobre os
resultados dos esforços deste trabalho. Será abordada a transformada de Fourier e no que ela
auxiliou no estudo, K-Means, estudo sobre os atletas e KNN.
Figura 26 – Gráficos originais e transformados para uma mesma articulação nas dimensões X, Y e Z,
respectivamente.
Figura 28 – Gráfico da transformada de Fourier para a coluna ilíaca ântero-superior direita de um atleta
a 3,5 m/s.
47
Figura 29 – Gráfico da Transformada de Fourier para a coluna ilíaca ântero-superior direita de um atleta
a 4,5 m/s.
4.2 K-Means
Figura 36 – Gráficos da quantidade de sessões de corrida que os corredores fazem por semana em
cada grupo.
Figura 37 – Gráficos da distância percorrida pelos corredores por semana em cada grupo.
Após a análise dos gráficos apresentados, não foi possível notar heterogeneidade
que sugerisse a presença de um padrão. Os resultados obtidos não foram conclusivos em
relação às características predominantes nos grupos de indivíduos. Portanto, não é possível
comprovar, apenas com informações de cinemática disponibilizadas pela base de dados, a
classificação destes corredores.
Era esperado, com o agrupamento de dados, que algumas características se
concentrassem em um dos grupos. Por exemplo: caso a maioria dos atletas de elite estivessem
agrupados em um só grupo, isto comprovaria que os dados de cinemática destes atletas são
consideravelmente diferentes dos demais. Tal comportamento não foi observado em nenhum
dos grupos, em nenhuma das características estudadas.
51
4.3 Análise do KNN
Referências
BIJALWAN, V.; KUMAR, V.; KUMARI, P.; PASCUAL, J. KNN based Machine Learning
Approach for Text and Document Mining. International Journal of Database Theory and
Application, vol.7, no.1 (2014), pp.61-70. http://dx.doi.org/10.14257/ijdta.2014.7.1.06
COOLEY, J.; TUKEY, J. An Algorithm for the Machine Calculation of Complex Fourier
Series. Mathematics of Computation, 19(90), 297-301, 1965. doi:10.2307/2003354
HATZE, H. A model of skeletal muscle suitable for optimal motion problems. In: Nelson
R.C., Morehouse C.A. (eds) Biomechanics IV. International Series on Sport Sciences. Palgrave,
London, 1974. https://doi.org/10.1007/978-1-349-02612-8_62
HORNG, S.J. et al. A novel intrusion detection system based on hierarchical clustering
and support vector machines. Expert systems with Applications, v. 38, n. 1, p. 306-313, 2011.
https://doi.org/10.1016/j.eswa.2010.06.066
JAIN, A.K.; MURTY, M. N.; FLYNN, P. J.Data clustering: a review. ACM Comput. Surv.31, 3
(Sept. 1999), 264–323. DOI:https://doi.org/10.1145/331499.331504
LIPOR, John; BALZANO, Laura. Clustering quality metrics for subspace clustering. Pattern
Recognition, v. 104, p. 107328, 2020. https://doi.org/10.1016/j.patcog.2020.107328
56
MANGINI, F.L.; FABRICA, G. Mechanical stiffness: a global parameter associated to elite
sprinters performance. Rev. Bras. Ciênc. Esporte, Porto Alegre , v. 38, n. 3, p. 303-309, Sept.
2016. https://doi.org/10.1016/j.rbce.2016.02.004
MUSTAFA, M. et al. Comparison between KNN and ANN classification in brain balancing
application via spectrogram image. Journal of Computer Science & Computational
Mathematics, v. 2, n. 4, p. 17-22, 2012.10.20967/jcscm.2012.04.004
NETO, A. L. A note on projective Levi flats and minimal sets of algebraic foliations.
Annales de l'Institut Fourier, Tome 49 (1999) no. 4, pp. 1369-1385. doi : 10.5802/aif.1721.
http://www.numdam.org/item/AIF_1999__49_4_1369_0/
NIGG, B.; BALTICH, J.; HOERZER, S.; ENDERS, H. Running shoes and running injuries:
mythbusting and a proposal for two new paradigms: ‘preferred movement path’ and
‘comfort filter’. British Journal of Sports Medicine, V. 49, p 1290-1294,
2015.10.1136/bjsports-2015-095054
PAKHIRA, M.K.; BANDYOPADHYAY, S.; MAULIK, U. Validity index for crisp and fuzzy
clusters. Pattern Recognition, v. 37, n.3, p. 487-501, 2004.
https://doi.org/10.1016/j.patcog.2003.06.005
PORTELA, M.M.; LIMA, M.O.; SILVA, P.L.; BARJA, P.R.; TEMOTEO, R.F.; ARISAWA, E.A.
Análise Biomecânica Comparativa Do Padrão De Movimento Entre Corredores Após Dois
Protocolos De Treinamento De Atrator. Revista Univap. 25. 1.
10.18066/revistaunivap.v25i48.2196. 2019.
UZUN, Isa Servan; AMIRA, Abbes; BOURIDANE, Ahmed. FPGA implementations of fast
Fourier transforms for real-time signal and image processing. IEE Proceedings-Vision,
Image and Signal Processing, v. 152, n. 3, p. 283-296, 2005. 10.1109/FPT.2003.1275737
WILLIAMS et al. Motivational predictors of weight loss and weight loss maintenance.
Journal of Personality and Social Psychology, Washington DC, v.70, n.1, p.115-126, 1996.
10.1037//0022-3514.70.1.115
WU, G.; CAVANAGH, P.R. ISB Recommendations for standardization in the reporting of
kinematic data. The Center for Locomotion Studies, Penn State University, University Park, PA
16802, U.S.A. 1995. 10.1016/0021-9290(95)00017-c
else:
indices_peaks = detect_peaks(y_values,mph)