No escenario típico dunha aplicación NPB, o problema máis problemático para os administradores é a perda de paquetes causada pola conxestión dos paquetes duplicados e as redes NPB. A perda de paquetes en NPB pode causar os seguintes síntomas típicos nas ferramentas de análise de backend:
- Xérase unha alarma cando o indicador de monitorización do rendemento do servizo APM diminúe e a taxa de éxito das transaccións diminúe.
- Xérase a alarma de excepción do indicador de monitorización do rendemento da rede NPM
- O sistema de vixilancia de seguridade non detecta ataques de rede debido á omisión de eventos
- Eventos de auditoría de comportamento de perda de servizo xerados polo sistema de auditoría de servizos
... ...
Como sistema centralizado de captura e distribución para a monitorización de Bypass, a importancia de NPB é evidente. Ao mesmo tempo, o xeito en que procesa o tráfico de paquetes de datos é bastante diferente do conmutador de rede en directo tradicional, e a tecnoloxía de control de conxestión do tráfico de moitas redes de servizo en directo non é aplicable a NPB. Para resolver a perda de paquetes NPB, comecemos pola análise da causa raíz da perda de paquetes para vela!
Análise da causa raíz da conxestión por perda de paquetes NPB/TAP
En primeiro lugar, analizamos a ruta de tráfico real e a relación de mapeo entre o sistema e as entradas e saídas da rede de nivel 1 ou de nivel NPB. Independentemente do tipo de topoloxía de rede que forme a NPB, como sistema de recollida, existe unha relación de entrada e saída de tráfico de moitos a moitos entre o "acceso" e a "saída" de todo o sistema.
Despois, analizamos o modelo de negocio de NPB desde a perspectiva dos chips ASIC nun único dispositivo:
Característica 1O "tráfico" e a "taxa da interface física" das interfaces de entrada e saída son asimétricas, o que resulta nun gran número de microrráfagas, o que é un resultado inevitable. Nos escenarios típicos de agregación de tráfico moitos a un ou moitos a moitos, a taxa física da interface de saída adoita ser menor que a taxa física total da interface de entrada. Por exemplo, 10 canles de recollida de 10G e 1 canle de saída de 10G; Nun escenario de despregamento multinivel, todos os NPBBS pódense ver como un todo.
Característica 2Os recursos de caché dos chips ASIC son moi limitados. En canto aos chips ASIC de uso común na actualidade, un chip cunha capacidade de intercambio de 640 Gbps ten unha caché de 3 a 10 Mbytes; un chip cunha capacidade de 3,2 Tbps ten unha caché de 20 a 50 Mbytes. Entre os fabricantes de chips ASIC inclúense BroadCom, Barefoot, CTC, Marvell e outros.
Característica 3O mecanismo convencional de control de fluxo PFC de extremo a extremo non é aplicable aos servizos NPB. O núcleo do mecanismo de control de fluxo PFC é lograr unha retroalimentación de supresión do tráfico de extremo a extremo e, en última instancia, reducir o envío de paquetes á pila de protocolos do punto final de comunicación para aliviar a conxestión. Non obstante, a fonte de paquetes dos servizos NPB son paquetes duplicados, polo que a estratexia de procesamento da conxestión só se pode descartar ou almacenar na caché.
O seguinte é o aspecto dunha microrráfaga típica na curva de fluxo:
Tomando como exemplo a interface 10G, no diagrama de análise de tendencias de tráfico de segundo nivel, a taxa de tráfico mantense en aproximadamente 3 Gbps durante moito tempo. No gráfico de análise de tendencias de micromilisegundos, o pico de tráfico (MicroBurst) superou con creces a taxa física da interface 10G.
Técnicas clave para mitigar as microrráfagas de NPB
Reducir o impacto da discrepancia asimétrica da velocidade da interface física- Ao deseñar unha rede, reduza ao máximo as taxas de interface física de entrada e saída asimétricas. Un método típico é usar unha ligazón de interface de enlace ascendente de maior velocidade e evitar as taxas de interface física asimétricas (por exemplo, copiar tráfico de 1 Gbit/s e 10 Gbit/s ao mesmo tempo).
Optimizar a política de xestión da caché do servizo NPB- A política común de xestión da caché aplicable ao servizo de conmutación non é aplicable ao servizo de reenvío do servizo NPB. A política de xestión da caché de garantía estática + compartición dinámica debería implementarse en función das características do servizo NPB. Co fin de minimizar o impacto das microrráfagas de NPB baixo a limitación actual do entorno de hardware do chip.
Implementar a xestión de enxeñaría de tráfico clasificado- Implementar a xestión da clasificación de servizos de enxeñaría de tráfico prioritario baseada na clasificación do tráfico. Garantir a calidade do servizo das diferentes colas de prioridade baseada nos anchos de banda das colas de categoría e garantir que os paquetes de tráfico de servizo sensibles ao usuario poidan ser reenviados sen perda de paquetes.
Unha solución de sistema razoable mellora a capacidade de almacenamento en caché de paquetes e a capacidade de configuración do tráfico- Integra a solución a través de varios medios técnicos para ampliar a capacidade de almacenamento en caché de paquetes do chip ASIC. Ao dar forma ao fluxo en diferentes localizacións, a microráfaga convértese nunha curva de fluxo microuniforme despois da súa conformación.
Solución de xestión de tráfico de microrráfagas Mylinking™
Esquema 1: estratexia de xestión da caché optimizada para a rede + xestión de prioridades da calidade do servizo clasificado en toda a rede
Estratexia de xestión da caché optimizada para toda a rede
Baseándose no coñecemento profundo das características do servizo NPB e nos escenarios empresariais prácticos dun gran número de clientes, os produtos de recollida de tráfico Mylinking™ implementan un conxunto de estratexias de xestión da caché NPB de "garantía estática + compartición dinámica" para toda a rede, o que ten un bo efecto na xestión da caché do tráfico no caso dun gran número de interfaces de entrada e saída asimétricas. A tolerancia ás microrráfagas conséguese ao máximo cando se fixa a caché do chip ASIC actual.
Tecnoloxía de procesamento de microrráfagas: xestión baseada en prioridades empresariais
Cando a unidade de captura de tráfico se desprega de forma independente, tamén se pode priorizar segundo a importancia da ferramenta de análise de backend ou a importancia dos propios datos do servizo. Por exemplo, entre moitas ferramentas de análise, APM/BPC ten unha prioridade maior que as ferramentas de análise/monitorización da seguridade porque implica a monitorización e análise de varios datos indicadores de sistemas empresariais importantes. Polo tanto, para este escenario, os datos requiridos por APM/BPC pódense definir como de alta prioridade, os datos requiridos polas ferramentas de monitorización/análise da seguridade pódense definir como de prioridade media e os datos requiridos por outras ferramentas de análise pódense definir como de baixa prioridade. Cando os paquetes de datos recollidos entran no porto de entrada, as prioridades defínense segundo a importancia dos paquetes. Os paquetes de prioridades máis altas reenvíanse preferentemente despois de que se reenvíen os paquetes de prioridades máis altas e os paquetes doutras prioridades reenvíanse despois de que se reenvíen os paquetes de prioridades máis altas. Se os paquetes de prioridades máis altas continúan chegando, os paquetes de prioridades máis altas reenvíanse preferentemente. Se os datos de entrada superan a capacidade de reenvío do porto de saída durante un longo período de tempo, o exceso de datos almacénase na caché do dispositivo. Se a caché está chea, o dispositivo descarta preferentemente os paquetes de orde inferior. Este mecanismo de xestión priorizada garante que as ferramentas de análise clave poidan obter de forma eficiente os datos de tráfico orixinais necesarios para a análise en tempo real.
Tecnoloxía de procesamento de microrráfagas: mecanismo de garantía de clasificación da calidade do servizo de toda a rede
Como se mostra na figura anterior, a tecnoloxía de clasificación do tráfico utilízase para distinguir diferentes servizos en todos os dispositivos na capa de acceso, na capa de agregación/núcleo e na capa de saída, e as prioridades dos paquetes capturados volven marcarse. O controlador SDN entrega a política de prioridade do tráfico de forma centralizada e aplícaa aos dispositivos de reenvío. Todos os dispositivos que participan na rede están mapeados a diferentes colas de prioridade segundo as prioridades transportadas polos paquetes. Deste xeito, os paquetes de prioridade avanzada de tráfico pequeno poden lograr unha perda de paquetes cero. Resolve eficazmente o problema de perda de paquetes da monitorización de APM e os servizos de tráfico de omisión de auditorías de servizos especiais.
Solución 2: caché do sistema de expansión a nivel de GB + esquema de configuración do tráfico
Caché estendida do sistema de nivel GB
Cando o dispositivo da nosa unidade de adquisición de tráfico ten capacidades avanzadas de procesamento funcional, pode abrir unha certa cantidade de espazo na memoria (RAM) do dispositivo como o búfer global do dispositivo, o que mellora considerablemente a capacidade do búfer do dispositivo. Para un único dispositivo de adquisición, pódese proporcionar polo menos unha capacidade de GB como espazo de caché do dispositivo de adquisición. Esta tecnoloxía fai que a capacidade do búfer do noso dispositivo da unidade de adquisición de tráfico sexa centos de veces maior que a do dispositivo de adquisición tradicional. Coa mesma taxa de reenvío, a duración máxima das microráfagas do noso dispositivo da unidade de adquisición de tráfico faise máis longa. O nivel de milisegundos que admiten os equipos de adquisición tradicionais actualizouse ao segundo nivel e o tempo de microráfagas que pode soportar aumentou miles de veces.
Capacidade de conformación de tráfico multicola
Tecnoloxía de procesamento de microrráfagas: unha solución baseada no almacenamento en caché de búfer de gran tamaño e na configuración do tráfico
Cunha capacidade de búfer extragrande, os datos de tráfico xerados polas microrráfagas almacénanse na caché e a tecnoloxía de configuración do tráfico utilízase na interface de saída para lograr unha saída fluída dos paquetes á ferramenta de análise. Mediante a aplicación desta tecnoloxía, o fenómeno de perda de paquetes causado polas microrráfagas resólvese fundamentalmente.
Data de publicación: 27 de febreiro de 2024