Anexo - AvantIntel v2.7.3
Anexo - AvantIntel v2.7.3
Anexo - AvantIntel v2.7.3
Sumário
Conteúdo
Sumário 2
1. Introdução 3
2. Sobre 4
3. Instalação 6
Pré-requisitos 6
Scripts 6
Templates 7
4. Utilização 8
5. Testando 11
1. Introdução
O AvantIntel é o módulo de inteligência artificial para identificação de
padrões, anomalias comportamentais de entidades, como por exemplo, usuários,
endereços, dispositivos ou qualquer elemento analisado, além de possibilitar a
predição de eventos temporais, baseado na análise de dados históricos. Desta
forma, é possível gerar alertas ou ou ainda tomar ações corretivas quando for
reconhecido um desvio de padrão comportamental de um elemento individual ou
de grupos específicos, reconhecido de uma base de milhares de entidades
analisadas.
2. Sobre
Com o objetivo de detectar anomalias, o AvantIntel utiliza 3 algoritmos para
identificar irregularidades em 5 diferentes conjuntos de parâmetros.
Algoritmos utilizados:
• ED (Domínio Externo)
• SLBDW (Logins Suspeitos por Dia da Semana)
• SLBH (Logins Suspeitos por Hora)
• SLBIA (Logins Suspeitos por Endereço IP)
• SLBSN (Logins Suspeitos por Nome de Serviço)
• Outros modelos podem ser criados a partir dos exemplos acima.
3. Instalação
O procedimento de instalação consiste no envio dos arquivos do AvantIntel
para o AvantData e na verificação dos pré-requisitos.
Pré-requisitos
Scripts
Os scripts disponibilizados na área de scripts (Baseline_Main.py, Fit_Main.py e
Predict_Main.py) devem ser enviados para o ambiente de execução de scripts
do AvantData.
Como a ordem de execução dos scripts deve ser Baseline_Main.py > Fit_Main.py
> Predict_Main.py, recomenda-se ajustar a Frequência seguindo a ordem
correta. Pode-se colocar, por exemplo, o baseline para ser executado em todo
minuto 0, o fit em todo minuto 5 e o predict em todo minuto 10. Favor atentar
ao volume de dados analisados e ao sizing do AvantData para a correta
definição do tempo de execução. Pode ser necessária a execução de
configurações de escalonamento do sistema para atender as demandas dos
modelos.
Templates
Os templates para cada item a ser tratado nas anomalias devem ser enviados
para o ambiente de templates dentro do AvantData.
Atenção: A aplicação dos templates depende da correta definição dos tipos dos
campos, assim como da quantidade de shards primários e possíveis réplicas.
4. Utilização
5. Testando
Para testar o AvantIntel e descobrir erros de funcionamento, pode-se rodar os
scripts manualmente. Para isso, deve-se colocar os scripts em uma pasta local
e mudar o base_url para o endereço de funcionamento do AvantData
base_url = 'https://127.0.0.1'
scroll_time = '5m'
time_filter = '3M'
Baseline_Main.py
Primeiramente o arquivo Baseline_Main.py deve ser executado. A sua
execução gera os índices que serão utilizados posteriormente para produção
dos modelos e predição. Caso a execução seja bem sucedida, novos índices
contendo o nome dos templates serão adicionados:
Fit_Main.py
Sendo Fit_Main.py o segundo arquivo a ser executado, deve gerar uma pasta
/ML contendo arquivos com a extensão .pkl. Produz arquivos contendo técnicas
de pré-processamento de dados, sendo um *_ordinalEncoder.pkl, um
*_standardscaler.pkl e um modelo *_estimator.pk para cada template e para
cada algoritmo.
Predict_Main.py
Como último arquivo a ser executado, o Predict_Main.py deve reindexar os
índices originais com os resultados e os falsos positivos contendo o valor de
True ou False.