TCC Lucas - Alvarenga PDFA
TCC Lucas - Alvarenga PDFA
TCC Lucas - Alvarenga PDFA
Alvarenga e Silva, Lucas Fernando
Uso de Aprendizado Profundo em Redes 5G através de Representações
Pictóricas de Séries Temporais/ Lucas Fernando Alvarenga e Silva
Orientador(a) Jurandy Jr Gomes de Almeida; Coorientador(a) Bruno Yuji Lino
KimuraSão José dos Campos, 2021.
67 p.
Trabalho de Conclusão de CursoEngenharia da ComputaçãoUniversidade
Federal de São PauloInstituto de Ciência e Tecnologia, 2021.
1. Redes 5G. 2. Aprendizado profundo. 3. Transformação de séries temporais
em imagens. 4. Indicadores de qualidade de sinal. I. Gomes de Almeida, Jurandy
Jr, orientador(a). II. Lino Kimura, Bruno Yuji,coorientador(a). III. Título.
Lucas Fernando Alvarenga e Silva
Agradeço primeiramente a minha família, pois sem o apoio deles nada disso seria
possível. Aos meus pais Samira Alvarenga e Angelo Pires, por todo apoio e ligações
em momentos não esperados com o coração apertado de saudade. Aos meus avós, Nilza
Maia e Ariovaldo Alvarenga, por toda criação e educação que me deram, sendo além de
avós, amigos e companheiros muito queridos que me permitiram entrar no mundo dos
“computadores” desde muito cedo, área a qual escolhi para a vida. A Manusa Leal, que
entrou na minha vida ainda na UNIFESP mas que vem me permitindo dividir uma vida,
repleta de felicidades, com ela. Também agradeço a todos os demais parentes, como meus
tios, Ludmila, Cristiano, Nádia e Henrique, e meus primos Victor e Stiven.
Em seguida, agradeço imensamente meu orientador, Prof. Dr. Jurandy Almeida,
que lá em 2017 (meu segundo semestre na universidade) com um email aberto a todo
o corpo discente anunciou uma bolsa de iniciação científica, a qual me candidatei sem
muitas expectativas, mas que acabei sendo aceito e que me introduziu a toda a comunidade
acadêmica. Essa foi apenas uma dentre todas as oportunidades que ele me proporcionou,
como ser bolsista de iniciação científica pela FAPESP; indicações a uma vaga de estágio
em uma start-up relacionada a nossa área de pesquisa; publicação de artigos, sendo um
deles sendo premiado como melhor trabalho da sessão; e, atualmente, continuar nosso
trabalho como aluno de mestrado bolsista da FAPESP. Agradecimentos especiais para
o Prof. Dr. Bruno Kimura por ser coorientador deste trabalho de conclusão de curso e
ao Prof. Dr. Henrique Paiva que me convidou a participar da escrita de um artigo, já
publicado em uma revista acadêmica.
Por fim, também agradeço imensamente aos meus amigos, anteriores a UNIFESP,
e, principalmente, aos novos que obtive a durante minha caminhada no ICT/UNIFESP,
que tornaram toda essa trajetória mais leve e divertida.
“There is no such thing as a free lunch”
Resumo
Novos padrões de consumo de dados, em sua maioria não centralizado no comportamento
humano, estão começando a esgotar os recursos de transmissão da infraestrutura de rede
móvel atual. Por conta disso redes 5G começaram a ser padronizadas e implantadas ao
redor do mundo, adotando enlaces de ondas de rádio milimétricas de alta frequência que
permitem suprir as demandas de velocidades de transferência de dados atuais. Entretanto,
a gestão das redes 5G atuais acontece de modo reativo, em que parâmetros de rede
são calculados pelos dispositivos de usuários e enviados periodicamente as estações-base,
porém isso não é ideal pois geram atrasos e lentidões na rede que podem impossibilitar
o cumprimento de seus requisitos de tempo. Assim, as redes além das redes 5G estão
sendo desenvolvidas com objetivo de apresentar sistemas mais inteligentes através do
uso de métodos de aprendizado de máquina para melhoria de tomadas de decisões e
alocações de recursos. Com base nas redes além das redes 5G, este trabalho propõe o
desenvolvimento de um arcabouço de aprendizado profundo que visa prever valores futuros
de um parâmetros de qualidade da rede, o Indicador de Qualidade de Canal, com base em
um histórico de valores passados. Espera-se que esse sistema de previsão seja executado
em infraestruturas de nuvem que pró-ativamente envia previsões para as estações-bases,
permitindo que elas escolham seu curso de ações futuro para manter a qualidade dos
canais de comunicação com os equipamentos de usuário. Na literatura existem algumas
propostas para a previsão de valores futuros de CQI, mas a maior parte delas investigam
modelos de aprendizado profundo custosos sobre ambientes simulados ou, quando em
ambientes reais, em redes móveis de gerações anteriores, como as redes 4G. Dado estas
limitações, este trabalho realiza uma comparação entre diferentes técnicas de aprendizagem
profunda em um conjunto de dados reais (registros de transmissão) obtidos da perspectiva
de um equipamento de usuário de uma operadora 5G da Irlanda. Foram usadas redes
recorrentes LSTM, modelos convolucionais tradicionais e modelos convolucionais residuais,
ambos modelos convolucionais voltadas para representações de dados unidimensionais,
usando diretamente séries temporais pré-processadas, e bidimensionais, que adicionam
uma etapa adicional de processamento séries temporais por técnicas de transformação
de séries temporais em imagens, e.g., Gráficos de Recorrência, Campos Angulares de
Gramian e Campos de Transição de Markov. Após uma extensa avaliação experimental
sobre dois padrões de movimentação distintos, estático e móvel, pôde-se verificar que a
LSTM obteve o melhor desempenho médio (aproximadamente 12% de NRSME) para
previsão, seguida pelo modelo convolucional tradicional 1D (16%) e o residual 2D (19%).
Porém, informações temporais de processamento e treinamento são vitais em redes 5G, e
nesse sentido observa-se que a LSTM apresentou o maior tempo dentre todos os modelos
avaliados, impossibilitando sua aplicação no mundo real. Assim, constatou-se que o modelo
com melhor compromisso entre desempenho e complexidade foram as redes residuais,
particularmente, a ResNet5 2D, com um erro de aproximadamente 19% NRMSE e um
tempo de inferência e treinamento aproximadamente 99% menor que LSTM.
Palavras-chaves: redes B5G, aprendizado profundo, indicadores de qualidade.
Abstract
New patterns of data consumption, generally different from human behavior, are starting
to exhaust the resources of today’s mobile network. As a result, 5G networks began to be
standardized and deployed around the world, which uses high-frequency millimeter-wave as
links to ensure the current data transfer demands. However, the current 5G networks work
in a reactive way, that is, network parameters are calculated by the user equipment and
periodically send to the base stations. Acting in a reactive manner might generate delays
that slow down the network traffic, not letting the network reach its time requirements.
Thus, beyond 5G networks have been developed to improve the smart capabilities of the
network infrastructure by the use of machine learning methods, providing smarter decision-
making and resource allocation procedures. Based on beyond 5G networks, this work
proposes a deep learning framework to predict future values of a network quality parameter,
the Channel Quality Indicator, based on its past values. This forecasting system is expected
to run in a cloud infrastructure that proactively sends forecasts to the base stations, allowing
them to choose their future action in order to maintain the quality of the communication
channel with the user equipment. In the literature, there have been some works about
network parameters forecasting, but most of them use expensive deep learning models on
computer-simulated environments or, when dealing with real environments, only above past
generations mobile networks, such as 4G networks. So, in this work, we made a comparison
between different deep learning techniques trained in a real-valued dataset composed
of transmission logs obtained from a user equipment perspective, which was attached
to a 5G operator in Ireland. We evaluated LSTM recurrent networks, two traditional
convolutional models, and three residual convolutional models, where both convolutional
models (traditional and residual methods) were further divided into one-dimensional
kernels or two-dimensional kernels. One-dimensional kernels can natively process time
series, but the two-dimensional kernel method needs an additional step of transforming the
time series into images by image-based time series transformations, e.g., Recurrence Plots,
Gramian Angular Fields, and Markov Transition Fields. Next, an extensive experimental
evaluation was performed separating two distinct movement patterns, static and mobile.
We could verify that LSTM obtained the best average performance (approximately 12% of
NRSME) for prediction, which was followed by the traditional 1D convolutional model
(16%) and, finally, the residual 2D model (19%). However, in the context of 5G networks
time metrics of training and inference are vital. When leveraging this information we can
see that LSTM had the longest time processing among all the models, which limits its
applicability in the real-world scenario. Finally, we conclude by showing that ResNet5,
the two-dimensional convolutional residual network has the best compromise between
performance and complexity, with an error of approximately 19% NRMSE and with an
inference and training time approximately 99% smaller than LSTM time metrics.
Keywords: B5G networks, deep learning, signal quality indicators.
Lista de ilustrações
EB Exabytes.
GGSN Roteador de Borda de Suporte GPRS (do inglês, Gateway GPRS Support
Node).
GSM Sistema Global de comunicação Móvel (do inglês, Global System for
Mobile communications).
IoT Internet das Coisas (do inglês, Internet of Things).
MIMO Múltiplas Entradas e Múltiplas Saídas (do inglês, Multiple Inputs Mul-
tiple Outputs).
NwDAF Função de Analise de Dados de Rede (do inglês, Networks Data Analytics
function).
RMSE Raiz Quadrada do Erro Quadrático Médio (do inglês, Root Mean Square
Error).
SDN Redes Definidas por Software (do inglês, Sofware Defined Networks)
x Vetores.
X Matrizes.
h, i Produto Escalar.
θ Conjunto de parâmetros.
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Problema de pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Motivações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Justificativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6 Resultados obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Organização do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . 6
2.1 Aprendizado de máquina . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Capacidade, sobreajuste e subajuste . . . . . . . . . . . . . . . . . . . . . 6
2.2 Aprendizado profundo . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Camadas totalmente conectadas . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Camadas convolucionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.3 Redes convolucionais residuais – ResNet . . . . . . . . . . . . . . . . . . . 12
2.2.4 Long Short-Term Memory – LSTM . . . . . . . . . . . . . . . . . . . . . 12
2.3 Redes de Computadores . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.1 Núcleo da rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.2 Redes não guiadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.3 Redes 5G e para além das redes 5G . . . . . . . . . . . . . . . . . . . . . 21
2.4 Métodos de transformação de séries temporais em imagens . . . . . 23
2.4.1 Gráficos de recorrências . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Campos angulares gramianos . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Campos de transição de markov . . . . . . . . . . . . . . . . . . . . . . . 25
3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . 27
5 AVALIAÇÃO EXPERIMENTAL . . . . . . . . . . . . . . . . . . . . . 36
5.1 Procedimento experimental . . . . . . . . . . . . . . . . . . . . . . . . 36
5.1.1 Preprocessamento dos dados . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.2 Treinamento e ajuste dos parâmetros dos modelos profundos . . . . 38
5.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6 CONCLUSÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1
1 Introdução
Em geral, o consumo de dados esperado por seres humano costuma seguir com-
portamentos cíclicos e sazonais, apresentando em certos períodos do dia um aumento
da taxa de transmissão (e.g., períodos de pico) e uma baixa taxa de transmissão (e.g.,
períodos noturnos). Porém, novos padrões de consumo de dados móveis não centralizados
no comportamento humano estão cada vez mais presentes nas redes móveis, fazendo com
que os recursos das redes móveis atuais, como as Redes de Quarta Geração (4G), se
esgotem. Exemplos destes novos padrões de consumo são as transmissões de vídeos de
ultra-altas resolução, que precisam de grandes bandas de comunicação; e comunicações
massivas entre maquinas, com uma massiva quantidade de pequenos pacotes de dados que
inundam continuamente as redes móveis (FU et al., 2018)
Logo, como um habilitador para estes novos padrões de consumo e suas aplicações
futuras, as Redes de Quinta Geração (5G) começaram a ser padronizadas e implantadas
ao redor do mundo. Essencialmente, as redes 5G possuem uma infraestrutura heterogênea
de serviços que podem ser categorizados em três principais frentes: a de cominuição de
banda-larga móvel (do inglês, Mobile Broadband – eMBB), voltada para uso humano de
aplicações que requerem transferências de grande porte (de 10 a 100× maiores que o
4G) como aplicações multimídia de ultra-alta resolução; as comunicações ultra-confiáveis
de baixa latência (do inglês, Ultra-Reliable Low-Latency Communications – uRLLC),
voltadas para aplicações que requerem comunicações quase instantâneas (latências menores
que 5ms), referindo-se normalmente a aplicações sensíveis e que envolvem risco a vida
humana, como trens ultra-rápidos e equipamentos de telemedicina; e comunicação massiva
entre máquinas (do inglês, Massive Machine-Type Communication – mMTC), referente a
comunicação massiva dos novos dispositivos de internet das coisas e equipamentos vestíveis
que vem se conectando as redes móveis, como cidades inteligentes, industria 4.0 e relógios
inteligentes (FU et al., 2018).
As Redes 5G são Redes Definidas por Software (do inglês, Software Defined Networks
– SDN) e que adotam como enlace padrão ondas de rádio milimétricos de altas frequências.
O gerenciamento e operação de SDNs contam com uma infraestrutura em nuvem, também
denominada Núcleo 5G, que executa Funções de Rede (do inglês, Network Functions – NF)
virtualizadas. Dentre as diversas funções de rede disponíveis no núcleo 5G, este trabalho
tem como maior foco a Função de Analise de Dados de Rede (do inglês, Network Data
Analytics Function – NwDAF), definida recentemente pela agencia de padronização 3GPP
(do inglês, 3rd Generation Partnership Project). Esta função possui subfunções voltadas
para análise de dados, usadas tanto para o plano de dados (i.e., estações-base), quanto
para o próprio plano de controle (i.e., outras funções de rede) (SEVGICAN et al., 2020).
Capítulo 1. Introdução 2
1.2 Motivações
As novas redes Para além das Redes 5G (do inglês, Beyond 5G Networks – B5G),
estão sendo propostas para que informações de redes possam ser precisamente preditas por
modelos de Aprendizado de Máquina (do inglês, Machine Learning – ML), evitando-se,
assim, comportamentos reativos. Particularmente, seu principal habilitador refere-se a
função de rede NwDAF prevista na infraestrutura em nuvem entregue pelo núcleo 5G, o
que garante um sistema completo com os recursos necessários para a execução de modelos
Capítulo 1. Introdução 3
1.3 Objetivos
O objetivo central deste trabalho refere-se a tornar o processo de escolha de ações
associadas a qualidade de canal entre os eNBs e os UEs pró-ativas a partir da regressão do
valor futuro (i.e., previsão) do indicador de qualidade CQI das redes B5G. Para isso, três
principais vertentes foram avaliadas: (1) uso de modelos profundos recorrentes; (2) uso de
modelos convolucionais voltados para dados unidimensionais (i.e. séries temporais); e, por
fim, (3) uso de modelos convolucionais voltados para dados representados por imagens,
obtidos por meio de técnicas de transformações de séries temporais em imagens para
aplicação direta nos modelos de visão computacional.
1.4 Hipótese
Este trabalho toma duas principais hipóteses. A primeira delas é que o uso de
infraestruturas mais inteligentes podem beneficiar as redes 5G convencionais. Outra
hipótese é que o uso de modelos profundos voltados para dados representados em forma
de imagens (modelos convolucionais de filtros bidimensionais) podem apresentar um
bom compromisso entre baixa complexidade e bom desempenho quando relacionado as
abordagens do estado-da-arte, dado que técnicas de transformação de séries temporais em
imagens podem auxiliar a percepção de comportamentos cíclicos e sazonais, de similaridades
entre pontos e, também, de comportamentos transitórios.
1.5 Justificativas
Existem diversas abordagens que atuam sobre objetivos semelhantes aos deste
trabalho, especificamente, relacionados à regressão de CQI por métodos de aprendizado
profundo também em redes B5G – maiores informações podem ser encontradas na Seção 3
deste documento. Entretanto, pode-se destacar os seguintes pontos em aberto encontrados
em outros trabalhos da literatura:
1. Ausência de conjuntos de dados reais, de tal forma que seus modelos são treinados e
avaliados somente sobre dados sintéticos e ambientes simulados;
Este trabalho, além de tratar a regressão de indicadores de qualidade das redes 5G,
um problema pertinente devido a característica reativa dos equipamentos atuais, busca
explorar e desenvolver exatamente estes pontos negativos por meio do uso de um conjunto
de dados desafiador composto por dados reais obtidos da perspectiva de um dispositivo de
usuário conectado a uma provedora de rede móvel 5G da Irlanda (RACA et al., 2020).
Além disso, este trabalho também se diferencia dos demais pelo fato de investigar modelos
convolucionais residuais, de baixa complexidade, e de modelos convolucionais compostos
por filtros bi-dimensionais, atuando conjuntamente com transformações de séries temporais
em imagens para aprendizagem de padrões e características hierárquicas dos dados.
2 Fundamentação Teórica
• Aprendizado por Reforço. Por último mas não menos importante e igualmente
desafiador, o aprendizado por reforço refere-se a agentes que devem aprender regras
e os padrões do problema com base na interação do agente com o ambiente, muitas
vezes acontecendo por tentativa e erro.
F C(x; W, b) = Wx + b (2.2)
são usualmente adicionadas ao final de CNNs, pois, como os campos receptivos das últimas
camadas convolucionais normalmente não conseguem cobrir toda a dimensão espacial das
imagens (BASHA et al., 2020), seu uso permite misturar informações de diferentes campos
receptivos, consequentemente, ponderando informações que alcançam diferentes partes
dos dados originais. As camadas FC também podem auxiliar o ajuste de dimensionalidade
dos dados, isto é, levar os dados a novos espaços de características e, também, a definir
arquiteturalmente as tarefas a partir de sua quantidade de neurônios de saída.
Entretanto, devido ao mesmo fato de ponderarem todas as informações de entrada,
sua maior desvantagem refere-se a sua grande quantidade de parâmetros (aproximadamente
89% dos parâmetros de uma VGGNet e 96% dos parâmetros de uma Alexnet estão em suas
camadas FC), o que consequentemente aumentando o custo computacional de execução
destes modelos.
+∞
X
s(t) = (x ? w)(t) = x(a) · w(a − t) (2.4)
a=−∞
Capítulo 2. Fundamentação Teórica 11
1. Interações esparsas: Como o núcleo das convoluções normalmente possui uma dimen-
sionalidade infinitamente menor que o tamanho de sua entrada, as interações entre o
mapa de características e a entrada são mais localizadas, melhorando a desempenho
temporal (complexidade de execução) e espacial (quantidade de parâmetro) dos
modelos profundos.
Sistema Final
Servidor
Roteadores
ISP
Sistemas Finais Móveis
Clientes
Estações-Base
Redes Locais
Células de
redes móveis
Enlaces
ISP
Sistemas Finais
Clientes
Afim de permitir que uma conexão global e universal seja estabelecida entre os
sistemas finais e os dispositivos arquiteturais da internet, que podem ser de diferente
fabricantes, a definição de padrões e protocolos é necessária. Um protocolo define o
formato, o modo e a ordem em que as mensagens são trocadas entre duas ou mais
entidades comunicantes, com uma sequência de ações bem definida que deve ser tomada
para permitir a transmissão e o recebimento destas mensagens. Particularmente, a internet
é organizada em uma arquitetura de camadas, em que cada uma de suas camadas referem-
se a uma parcela bem definida do sistema como um todo e que executa um determinado
protocolo de rede. Esses protocolos oferecem, por sua vez, serviços as camadas subsequentes,
normalmente por meio da execução de ações sobre a mensagem recebida e o encapsulamento
de seu conteúdo para o envio as camada subsequentes. Isso provê modularidade ao sistema,
Capítulo 2. Fundamentação Teórica 16
de tal forma que a realização de modificações em uma camada não altera o funcionamento
das demais camadas, desde que a entrada e a saída das camadas continuem os mesmos.
A internet pode ser dividida em 5 principais camadas, sendo elas a camada física,
a camada de enlace, a camada de rede, a camada de transporte e a camada de aplicação.
Esse conjunto de camadas é normalmente denominado como pilha de protocolo da internet.
Kurose et al. (KUROSE; ROSS, 2016) em seu livro, realiza o estudo de cada uma
das camadas de uma maneira de cima para baixo (do inglês, top-down), as quais são
apresentadas a seguir:
• Camada física: A camada física é aquela que efetivamente transmite os bits dos
quadros através dos meios físicos no mundo real (meios guiados e meio não-guiados).
• Hospedeiros sem fio: sistemas finais não cabeados, como celulares e notebooks.
• Enlaces sem fio: Meios físicos não guiados que realizam a transmissão dos bits por
ondas eletromagnéticas.
As redes móveis foram concebidas com intuito de prover conectividade a internet aos
hospedeiros móveis, e, como a telefonia celular já estava presente em grande parte do mundo,
uma possível estratégia seria sua extensão para também lidar com a conexão e transferência
de pacotes com a rede de internet. O primeiro padrão desenvolvido foi o Sistema Global
para comunicações Móveis (do inglês, Global System for Mobile Communications – GSM),
sendo considerado o precursor das redes móveis que identificou e resolveu o problema
das comunicações incompatíveis entre as diferentes partes da Europa. Posteriormente
diversas tecnologias de comunicação celular começaram a ser definidas e implantadas,
sempre buscando aumentar a área de cobertura e prover melhores conectividades e taxas de
transferências de dados cada vez mais altas. Estas redes móveis são normalmente divididas
em gerações, as quais são: 1a geração, voltada apenas para trafego de vós; 2a geração,
também voltada para vós, mas que posteriormente foi estendida para transmissão de dados
com sua versão 2.5; 3a geração, foi a primeira geração que originalmente suportou ambas
formas de comunicação de vós e dados; 4a geração, eliminou a distinção entre redes de vós
e dados do núcleo 3G; e, atualmente, as redes de 5a geração que levam em consideração
Capítulo 2. Fundamentação Teórica 19
Central de
Comutação
Controlador de
Estação-Base
Internet
Roteador de
borda
Dispositivos de
Estação-Base Células
Usuário
um servidor de nó de suporte GPRS (do inglês, Serving GPRS support node – SGSN)
e um roteador de borda de suporte GPRS (do inglês, Gateway GPRS Support Node –
GGSN), em que GPRS significa Generalized Packet Radio Service, referente ao antigo
serviço de dados das redes 2G. Nesta nova infraestrutura das redes 3G (Figura 6) SGSNs
tem a responsabilidade de entregar datagramas aos hospedeiros moveis associados a rede
de acesso sem fio enquanto que GGSNs atuam como roteadores de borda entre a SGSN e
a rede externa da internet, o que permite esconder a mobilidade dos hospedeiros da rede
de internet.
Telefônica
Internet
SGSN GGSN
Dispositivos de
Estação-Base Células
Usuário
núcleo 5G
nuvem
Internet
Redes MIMO
uRLLC eMBB
Células de Conexão
pequenas
Sistemas Comunicação de
finais Sistemas Controle
finais
mMTC
Comunicação de
Dados
Sistemas
finais
norma entre duas entradas de alta dimensionalidade, as quais, em seguida, são subtraídas
por um termo de limiar e, por fim, encaminhadas uma função degrau.
de modo temporal correlaciona todos os pontos de uma série-temporal, i.e., performa uma
medida de similaridade que é inerente ao cálculo do produto escalar, a projeção entre
vetores (DIAS et al., 2020).
A partir da definição supracitada, derivam-se os Campos Angulares de Soma Gra-
mianos (do inglês, Gramian Angular Summation Field – GASF) e os Campos Angulares
da Diferença Gramianos (do inglês, Gramian Angular Difference Field – GADF) introdu-
zidos por Dias et al. (2020) para a transformação das séries temporais em representações
pictóricas. De modo geral, enquanto GASF explora somas trigonométrica, GADF explora
diferenças trigonométricas entre o angulo dos vetores. Na prática, para aplicar a transfor-
mação GASF/GADF sobre séries temporais x, primeiramente normaliza-se seus valores
para corresponder a Imagem das funções trigonométricas básicas (cosseno e seno), ou seja,
para valores dentro do intervalo [−1, 1] através de uma normalização por mínimo/máximo.
Denotaremos a série-temporal normalizada por x̂. Em seguida, transforma-se seus valores
para ângulos através da aplicação da função inversa da função trigonométrica cos, o arccos,
para cada um de seus valores, resultando, então, em x̂ ˆi = φi = arccos(x̂i ). Uma vez
obtido os valores em ângulos, por fim, pode-se construir as matrizes GASF e GADF,
respectivamente, através do cosseno da soma de ângulos e do seno da diferença entre
ângulos:
Como as funções trigonométricas cos(·) e sin(·) são funções R → [−1, 1], as imagens
de saída para ambas transformação GADF e GASF também estão no intervalo [−1, 1]
3 Trabalhos relacionados
avaliados, como linha de partida, dois métodos preditivos não relacionados a aprendizado
profundo: por média, em que o próximo CQI é predito como a média dos CQI anteriores,
e por auto-ARIMA, uma implementação automática da técnica Auto-Regressiva de média
móvel integrada (do inglês, Auto-Regressive Integrated Moving Avergage – ARIMA). Em
seguida, os resultados obtidos através da linha de partida são comparados com os resultados
de uma CNN uni-dimensional constituída por 3 camadas convolucionais e uma camada
totalmente conectada ao final, e também com os resultados de um modelo LSTM, com
sua camada de entrada composta por unidades LSTM e ao final uma camada totalmente
conectada. Os modelos são treinados sobre dados provenientes de uma rede móvel 4G
em aplicação real, com seus dados espaçados de hora em hora se referindo a média da
variação do CQI neste período. Estas séries temporais são inicialmente normalizadas e,
posteriormente, sub-divididas através de janelas deslizantes de tamanho fixo em 24 pontos.
Considerando esses trabalhos, a Tabela 1 apresenta um sumário das principais
características de cada um. Pode-se destacar que a proposta deste trabalho se diferencia
dos demais por adotar um cenário real, com uso de parâmetros de infraestrutura de
rede calculados por um UE conectado a uma rede 5G em funcionamento e, também, por
investigar o uso de CNN-2D sobre representações pictóricas de séries temporais.
núcleo 5G
nuvem
UE
eNB
Pacotes
Capítulo 4. Arcabouço de previsão de CQI em redes B5G 31
Pré processamento
Entrada de CQI
Séries Temporais
de CQI
Treinamento de
Modelos de previsão
NwDAF
Previsões
NwDAF
Capítulo 4. Arcabouço de previsão de CQI em redes B5G
Tabela 2 – Atributos dos históricos de transmissão
Atributo Descrição Unidade
Carimbo de data Instante de tempo em que obteve-se as medidas Data e hora
Coordenadas geográficas Coordenadas de GPS Latitude e longitude
Velocidade velocidade de deslocamento do UE km/h
Operadora telefônica Nome da operadora de rede móvel 5G (anonimizado) -
Identificação da célula Número de identificação da célula -
Padrão de comunicação Tecnologia de conexão das redes móveis (2G/3G/4G/5G) -
Taxa de download e upload Taxa de transferência em downlink e uplink mensuradas pelo UE kbps
Estado Estado atual do processo de download (idle ou em download) -
Estatísticas de Latência Valores médios e de incerteza do ping mensurado -
CQI Indicador de qualidade com base na taxa de transmissão do canal [0, 16)
RSSI Potência recebida de banda-larga [−100, 0] dBm
RSRQ Relação entre RSRP e RSSI [−43, 20] dB
RSRP Potência média do sinal em uma célula específica [−140, −44] dBm
SNR Relação Sinal-Ruído [−23, 40] dB
Métricas para células vizinhas RSRP e RSRQ de células vizinhas dBm
32
Capítulo 4. Arcabouço de previsão de CQI em redes B5G 33
5 Avaliação Experimental
valores futuros, ou seja, regressão, uma função objetivo comum neste caso refere-se ao
Erro Quadrático Médio (do inglês, Mean Squared Error – MSE), uma função de perda
definida pela média dos erros ao quadrado (Equação 5.1).
N
1 X
M SE(ŷ, y) = (yi − ŷi )2 (5.1)
N i=1
O MSE possui a característica de penalizar valores de erros (diferença entre o valor
esperado e o valor predito) grandes com pesos ainda maiores, pois a penalização não
é proporcional ao erro, mas ao seu quadrado. Além disso, os valores do MSE não são
diretamente relacionados a unidade de medida dos dados de entrada, sendo necessário
realizar a operação de raiz quadrada (do inglês, square Root) sobre o MSE (RMSE)
para-se verificar a média do erro na mesma unidade do problema, no caso do arcabouço
desenvolvido, em unidades de CQI. Neste trabalho adotou-se como função de perda o
RMSE.
O melhor modelo encontrado durante o processo de treinamento, tomando como base
o desempenho sobre o conjunto de dados de validação, é recuperado ao final para inferência
sobre o conjunto de dados de teste, tendo seus valores de desempenho apresentados e
discutidos na Seção 5.3 de resultados.
A rigor, o processo de treinamento de modelos profundos requer a definição de
alguns hiper-parâmetros. Durante a avaliação de todos os modelos profundos foram usados o
mesmo conjunto de hiper-parâmetros de treinamento propostos por Parera et al. (PARERA
et al., 2019), os quais estão presentes na Tabela 3.
5.3 Resultados
A seguir são apresentados os resultados obtidos pelos métodos de aprendizado
profundo a partir da execução do procedimento experimental descrito anteriormente.
Primeiramente, foram-se avaliados os modelos 1D (PareraLSTM e PareraCNN-1D)
como resultados de ponto de partida. Em seguida, com objetivo de verificar a eficácia
Capítulo 5. Avaliação Experimental 40
Verifica-se que a PareraLSTM é o modelo que melhor gerou previsões dos valores
futuros de CQI, com uma taxa de aproximadamente 12% de erro (NRMSE) durante a
inferência no conjunto de dados de teste. Entretanto, apesar de possuir o menor valor dentre
as demais abordagens, devido a escolha de hiper-parâmetros sugerida por Parera et al. (PA-
RERA et al., 2019) seu uso em produção para problemas 5G seria limitado, visto que seu
tempo de treinamento e teste foi o maior entre os modelos, possivelmente devido a sua
estrutura recorrente e a escolha de mini-lotes de tamanho 1. Pode-se também perceber
que a ResNet5-2D possui uma porcentagem de erro um pouco menor que sua versão
1D, permitindo verificar que existe alguma melhora no uso de representações pictóricas
de séries temporais caso o modelo profundo correto seja usado. Com relação ao padrão
de movimentação veicular, pode-se verificar que seus resultados foram majoritariamente
piores que os valores estáticos, o que é esperado visto que os indicadores de qualidade
de sinal sofrem maiores flutuações devidos a efeitos doppler e o desvanecimento rápido
que nós veiculares estão expostos. Por conta disso, os registros de transmissão veiculares
Capítulo 5. Avaliação Experimental 41
possuem muito mais instantes não conectados a redes 5G, o que quebra o conjunto de
dados original em diversos conjuntos de pontos adjacentes menores que estão conectados a
rede 5G.
Parera et al. (PARERA et al., 2019) usa em seu trabalho uma série temporal que
contém valores da média de CQI espaçados de hora em hora, sendo um dos motivos que fez
os autores escolheram usar janelas de tamanho w = 24, pois assim cada janela conseguiria
conter pontos referentes ao período de uma dia. Entretanto, os registros de transmissão
usados neste trabalho possuem valores de CQI espaçados em aproximadamente 1 valor por
segundo, o que remove a motivação em usar uma janela de tamanho 24. Por conta disso,
avaliou-se a CNN ResNet5-2D, que obteve o menor erro dentre os métodos convolucionais
de filtros 2D para o padrão de movimento estático, com diferentes valores de janelas, sendo
eles w ∈ {30, 60, 120} referindo-se, respectivamente, intervalos de meio minuto, 1 minuto e
2 minutos. Os resultados estão presentes na Tabela 5, onde pode ser visto que uma janela
de meio minuto (w = 30) permitiu melhorar ainda mais seu desempenho.
PareraCNN-1D
ResNet5-1D
PareraCNN-2D
ResNet5-2D
HatamiCNN-2D
45
6 Conclusões
tarefa de classificação sobre esse mesmo conjunto de dados real, por exemplo, buscando
classificar o melhor momento para se realizar handoff de rede (alteração da tecnologia de
conexão de rede) ou o melhor momento para mudança de associação do UE para outros
eNBs.
47
Referências
PARERA, C. et al. Transfer learning for channel quality prediction. In: ISMN’2019. [S.l.:
s.n.], 2019. Citado 9 vezes nas páginas 2, 3, 27, 28, 29, 33, 39, 40 e 41.
RACA, D. et al. Beyond throughput, the next generation: a 5g dataset with channel and
context metrics. In: MMSys’2020. [S.l.: s.n.], 2020. Citado 5 vezes nas páginas 3, 5, 30, 31
e 32.
SAKIB, S. et al. A deep learning method for predictive channel assignment in beyond 5g
networks. IEEE Netw., 2020. Citado 4 vezes nas páginas 2, 3, 27 e 29.
SIMONYAN, K.; ZISSERMAN, A. Very deep convolutional networks for large-scale image
recognition. In: ICLR’15. [S.l.: s.n.], 2015. Citado 2 vezes nas páginas 9 e 10.
SZEGEDY, C. et al. Going deeper with convolutions. In: CVPR’15. [S.l.: s.n.], 2015.
Citado na página 10.
WANG, Z.; OATES, T. Imaging time-series to improve classification and imputation. In:
IJCAI’2015. [S.l.: s.n.], 2015. Citado na página 26.
YIN, H. et al. Predicting channel quality indicators for 5g downlink scheduling in a deep
learning approach. CoRR, 2020. Citado 3 vezes nas páginas 2, 27 e 29.