Por Brad Hale, diretor de marketing de produtos de gerenciamento de redes da SolarWinds
Há tempos que a análise no nível de pacotes vem sendo considerada a maior ambição da análise de desempenho da rede e do tráfego. Ela envolve a captura (ou seja, fazer uma cópia) e a inspeção dos pacotes de rede que trafegam entre os dispositivos cliente e servidor. Pela inspeção do fluxo de pacotes e dos parâmetros do protocolo, informações úteis sobre o desempenho da rede podem ser extraídas, o que inclui o tempo de resposta da rede e de aplicativos e os tipos e volumes relativos do tráfego de aplicativos.
Historicamente, as ferramentas de inspeção de pacotes têm sido de dois tipos: gratuitas e caras. Entre as gratuitas, temos o potente Wireshark, de código aberto, que pode ser instalado em uma estação de trabalho ou um laptop. Além do custo (eu disse grátis), o Wireshark também tem a vantagem de ser uma solução portátil que pode ser movimentada pela rede. A desvantagem é que sua configuração e uso exigem muita habilidade, além de ele ser normalmente usado apenas quando necessário, após a ocorrência de algum tipo de evento que demande investigação.
Entre as ferramentas caras, temos os dispositivos especializados de captura de pacotes, que executam a inspeção e o arquivamento de alta taxa de transferência. Normalmente, eles estão restritos a empresas de grande porte com muito dinheiro, devido aos custos de implantação e ao conhecimento tecnológico necessário para usá-los com sucesso.
Isso não deixa muitas opções para um departamento de TI médio que queira aproveitar as vantagens da captura de pacotes.
Qualidade da experiência
Quando o usuário final reclama que a “rede está lenta”, ele não sabe, nem se importa em saber, se o problema é a rede ou o aplicativo. Ele só sabe que a qualidade de sua experiência é insatisfatória. Por outro lado, você se importa porque precisa solucionar e corrigir o problema. O tempo de resposta do usuário final, ou a qualidade de sua experiência, consiste em dois componentes principais: o tempo de resposta da rede (NRT) e o tempo de resposta do aplicativo (ART).
O NRT – também conhecido como latência do caminho da rede — é uma medida do tempo que um pacote precisa para percorrer um caminho de rede desde o emissor até o receptor. Quando ocorrem latências no caminho da rede, o desempenho de aplicativos geralmente é afetado de forma desfavorável. Existem quatro fatores principais que afetam a latência no caminho da rede:
- Atraso de propagação à velocidade da luz
- Roteamento/distância geográfica da rede
- Atraso de serialização nos links da WAN
- Atrasos de enfileiramento em dispositivos de rede
Alguns aplicativos, como os de voz e videoconferência, são sensíveis à perda de pacotes, atrasos e jitter (variações no tempo de entrega entre pacotes sequenciais). Perda de pacotes e jitter podem afetar a qualidade geral de uma chamada de voz, causando gaguez e estranhos efeitos no tom de voz, enquanto que os altos níveis de atraso geral no caminho podem aumentar os efeitos notáveis de eco e atrapalhar as interações de quem fala devido a sobreposição de falas.
Perda de pacotes e altos níveis de atrasos no caminho podem ter efeitos ainda mais graves em sistemas de videoconferência (também conhecida como “telepresença”). Uma perda de pacotes pode causar pixelamento e/ou tremores no vídeo, bem como interrupções no áudio. Alta latência de rede pode causar perda de sincronização de lábios, pois os pacotes de voz relativamente pequenos podem ser entregues em um intervalo de tempo diferente daquele para pacotes de conteúdo de voz maiores. Portanto, é importante que os pacotes de voz e vídeo fluam pela rede de forma regular e confiável.
O atraso de rede em todas as suas formas é um fator significativo e importante para o desempenho geral de aplicativos, o que certamente justifica o monitoramento de aplicativos de missão crítica.
O ART pode ser definido como o tempo que um cliente leva para fazer uma solicitação a um servidor e até que este responda. Como acontece com os atrasos de rede, os tempos de processamento de servidores podem ser um fator significativo em tempos de resposta insatisfatórios de aplicativos. O tempo de processamento do servidor pode ser medido no nível de pacote observando-se um conjunto específico de três pacotes, também conhecido como Tempo até o primeiro byte.
Pelo monitoramento contínuo do NRT e do ART com a análise de pacotes, pode-se determinar se a qualidade insatisfatória da experiência é causada pelo aplicativo ou pela rede.
Análise e categorização do tráfego
A análise de pacotes também permite categorizar o tráfego por tipos, com base em endereços IP do servidor de destino, portas usadas e medida dos volumes total e relativo de tráfego de cada tipo. Isso é útil para identificar os volumes de tráfego que fluem em um link de rede e/ou para servidores/aplicativos específicos para fins de gerenciamento de capacidade. Também pode ser útil para identificar níveis excessivos de tráfego não empresarial (mídia social, navegação na Web externa etc.) que podem precisar ser filtrados ou eliminados de alguma maneira.
Captura e análise contínua de pacotes
Conforme mencionado acima, historicamente, a captura de pacotes têm sido de dois tipos: gratuita e cara. Até agora. A SolarWinds desenvolveu uma ferramenta chamada Quality of Experience (QoE) que oferece monitoramento e criação de relatórios, em tempo integral e baseados em análise de pacotes, de fatores de desempenho críticos. Ela está incluída no SolarWinds Network Performance Monitor (NPM). Esse sistema processa e informa a medição de desempenho derivada de dados de análise de pacotes coletados dos sensores de captura. Esses sensores de captura podem ser implantados diretamente em servidores de aplicativos ou em dispositivos de coleta dedicados conectados às portas de SPAN/espelhamento de switches de rede. Eles oferecem monitoramento integral dos tempos de resposta da rede e dos aplicativos a uma grande quantidade de aplicativos pré-configurados ou personalizados. Também emitem relatórios sobre as taxas de transações gerais e os volumes de dados em comparação com várias categorias de agrupamento de tráfego. Recentemente, anunciamos que o NPM agora inclui até 1.000 sensores, dependendo do tamanho da licença.
Um recurso importante do painel do QoE é a capacidade de identificar rapidamente as reduções ou alterações no desempenho de aplicativos (antes de os usuários começarem a telefonar para reclamar) e determinar se a alteração foi causada por um aumento do atraso na rede ou pelo baixo desempenho do servidor de aplicativos, o que ajuda a responder à velha pergunta: é a rede ou o aplicativo ?