Não é novidade que a cada dia que passa, há um aumento na complexidade dos ambientes de TI das empresas. Com a virtualização disseminada, aplicações em nuvem, serviços, sistemas e redes, a quantidade de logs de aplicações de aumentou muito, e ter controle sobre esta se tornou um desafio.
O problema é que muitas vezes é um número limitado de pessoas que tem total conhecimento do funcionamento do ambiente, tornar este conhecimento acessível a todos, por meio de uma plataforma de software que consiga identificar a causa raiz de um problema é essencial.
No post de hoje, vamos te apresentar como funciona a correlação de eventos no cenário da TI e como ela auxilia as empresas a identificar a causa raiz dos problemas de maneira ágil.
O que é correlação de eventos
A correlação de eventos pode ser considerada como o precursor da inteligência artificial e do machine learn. Ela é muito utilizada de uma forma codificável, passa de uma codificação para uma plataforma que permite fazer a correlação destes eventos.
Com essa tecnologia você pode tratar e relacionar eventos desconexos, de maneira capaz de identificar a causa raiz de um problema no ambiente de TI. Através de dados de logs de aplicações e sistemas, os eventos são gerados e assim analisados em busca de identificar seus relacionamentos, para que assim sejam executadas ações como envio de alertas mais precisos.
Tipos formais de correlação
Existem várias maneiras para se realizar a correlação de eventos, abaixo listamos algumas:
- Compreensão: É setado um intervalo de tempo entre as observações de eventos, indicando quantas vezes o mesmo ocorreu dentro dessa janela de tempo, correspondendo a um único evento;
- Supressão seletiva: Inibe de forma temporária um determinado evento;
- Filtragem: Nele são levados em conta apenas os parâmetro do evento em questão, podendo englobar ações como compreensão e supressão.
- Contagem: Gerado um novo alarme quando um evento ultrapassa a quantidade de vezes previamente estabelecido. Exemplo: tentativa de login.
Para conhecer mais formas de correlacionar eventos, você pode acessar nosso post, clicando aqui
Aplicações
Um dos maiores exemplos de aplicação que podemos citar, é a análise de fraudes, que já é utilizada há muito tempo pelas empresas de cartão de crédito. Elas fazem uso do sistema de geolocalização para analisar ações suspeitas.
Também podem citar a detecção de ataques de segurança computacional, como tentativas de login. A detecção de falhas em sistemas elétricos, como associar falhas em sistemas de meteorologia.
E por fim, detecção de falhas e identificação de causa raiz em sistemas computacionais em rede. Ela faz uso da correlação de eventos que acontecem em todo o ambiente de TI, em busca da identificação de causa raiz de forma mais rápida e automática.
Vídeo sobre correlação de eventos
Recentemente, realizamos um evento online sobre o assunto. Você pode assistí-lo abaixo:
Event Guard no OpMon
Dentro do software OpMon, desenvolvido por nós da OpServices, temos o módulo de Event Guard, nele é possível construir regras de correlacionamento entre eventos de forma ágil para identificar falhas e causa raiz de um problema. A plataforma conta com as premissas de:
- Alto throughput: para aplicações que processam um grande volume de evento (entre 1.000 a 100k eventos por segundo);
- Baixa latência: verifica ações que reagem em tempo real (de baixos milisegundos a poucos segundos);
- Computações complexas: detecta padrões, realiza filtragem e conta com gatilhos baseados na ausência de eventos.
Abaixo temos exemplos de como funciona a configuração de eventos de criação da lógica de correlacionamento de eventos do Event Guard, dentro da plataforma OpMon
Como você pode ver, a correlação de eventos é um assunto bastante interessante para correlacionar regras aparentemente desconexas e criar automatizações úteis para seu ambiente de TI. Caso queira implementar essa tecnologia na sua empresa, fale com nossos especialistas.