Que é exactamente unha rede espiña-folla? A rede espiña-folla das redes subxacentes

Para satisfacer as necesidades dos servizos na nube, a rede divídese gradualmente en Underlay e Overlay. A rede Underlay é o equipo físico, como o enrutamento e a conmutación, no centro de datos tradicional, que aínda cre no concepto de estabilidade e proporciona capacidades fiables de transmisión de datos de rede. Overlay é a rede empresarial encapsulada nela, máis preto do servizo, a través do encapsulamento do protocolo VXLAN ou GRE, para proporcionar aos usuarios servizos de rede fáciles de usar. A rede Underlay e a rede Ooverlay están relacionadas e desacopladas, e están relacionadas entre si e poden evolucionar de forma independente.

A rede subxacente é a base da rede. Se a rede subxacente é inestable, non hai SLA para o negocio. Despois da arquitectura de rede de tres capas e a arquitectura de rede Fat-Tree, a arquitectura de rede do centro de datos está a transicionar cara á arquitectura Spine-Leaf, que marcou o comezo da terceira aplicación do modelo de rede CLOS.

Arquitectura de rede de centros de datos tradicionales

Deseño de tres capas

De 2004 a 2007, a arquitectura de rede de tres niveis foi moi popular nos centros de datos. Ten tres capas: a capa central (a rede troncal de conmutación de alta velocidade da rede), a capa de agregación (que proporciona conectividade baseada en políticas) e a capa de acceso (que conecta as estacións de traballo á rede). O modelo é o seguinte:

Modelo de 3 capas

Arquitectura de rede de tres capas

Capa central: Os conmutadores principais proporcionan reenvío de paquetes de alta velocidade dentro e fóra do centro de datos, conectividade coas múltiples capas de agregación e unha rede de enrutamento L3 resistente que normalmente serve a toda a rede.

Capa de agregación: o conmutador de agregación conéctase ao conmutador de acceso e proporciona outros servizos, como cortafuegos, descarga de SSL, detección de intrusións, análise de rede, etc.

Capa de acceso: Os conmutadores de acceso adoitan estar na parte superior do rack, polo que tamén se denominan conmutadores ToR (Top of Rack), e conéctanse fisicamente aos servidores.

Normalmente, o conmutador de agregación é o punto de demarcación entre as redes L2 e L3: a rede L2 está debaixo do conmutador de agregación e a rede L3 está enriba. Cada grupo de conmutadores de agregación xestiona un punto de entrega (POD) e cada POD é unha rede VLAN independente.

Bucle de rede e protocolo de árbore de expansión

A formación de bucles débese principalmente á confusión causada por rutas de destino pouco claras. Cando os usuarios constrúen redes, para garantir a fiabilidade, adoitan usar dispositivos e ligazóns redundantes, de xeito que inevitablemente se forman bucles. A rede de capa 2 está no mesmo dominio de transmisión e os paquetes de transmisión transmitiranse repetidamente no bucle, formando unha tormenta de transmisión, que pode causar bloqueos de portos e paralización do equipo nun instante. Polo tanto, para evitar tormentas de transmisión, é necesario evitar a formación de bucles.

Para evitar a formación de bucles e garantir a fiabilidade, só é posible converter dispositivos e ligazóns redundantes en dispositivos e ligazóns de copia de seguridade. É dicir, os portos e ligazóns de dispositivos redundantes están bloqueados en circunstancias normais e non participan no reenvío de paquetes de datos. Só cando o dispositivo de reenvío actual, o porto ou a ligazón fallen, o que provoca conxestión na rede, abriranse os portos e ligazóns de dispositivos redundantes para que a rede poida restaurarse á normalidade. Este control automático impleméntase mediante o protocolo Spanning Tree (STP).

O protocolo Spanning Tree opera entre a capa de acceso e a capa de sumidoiro, e no seu núcleo hai un algoritmo Spanning Tree que se executa en cada ponte habilitada para STP, que está deseñado especificamente para evitar bucles de ponte en presenza de rutas redundantes. STP selecciona a mellor ruta de datos para reenviar mensaxes e non permite as ligazóns que non forman parte do Spanning Tree, deixando só unha ruta activa entre dous nodos de rede e a outra ligazón ascendente quedará bloqueada.

Arquitectura de rede de 3 capas

O STP ten moitas vantaxes: é sinxelo, plug-and-play e require moi pouca configuración. As máquinas dentro de cada pod pertencen á mesma VLAN, polo que o servidor pode migrar a localización arbitrariamente dentro do pod sen modificar o enderezo IP nin a porta de enlace.

Non obstante, o STP non pode usar rutas de reenvío paralelo, xa que sempre desactivará as rutas redundantes dentro da VLAN. Desvantaxes do STP:

1. Converxencia lenta da topoloxía. Cando cambia a topoloxía da rede, o protocolo Spanning Tree tarda entre 50 e 52 segundos en completar a converxencia topolóxica.

2, non pode proporcionar a función de balanceamento de carga. Cando hai un bucle na rede, o protocolo Spanning Tree só pode bloquear o bucle, de xeito que a ligazón non pode reenviar paquetes de datos, o que malgasta recursos da rede.

Virtualización e desafíos do tráfico leste-oeste

Despois de 2010, co fin de mellorar a utilización dos recursos informáticos e de almacenamento, os centros de datos comezaron a adoptar a tecnoloxía de virtualización e un gran número de máquinas virtuais comezaron a aparecer na rede. A tecnoloxía virtual transforma un servidor en varios servidores lóxicos, cada máquina virtual pode executarse de forma independente, ten o seu propio sistema operativo, aplicación, o seu propio enderezo MAC e enderezo IP independentes, e conéctanse á entidade externa a través do conmutador virtual (vSwitch) dentro do servidor.

A virtualización ten un requisito complementario: a migración en directo de máquinas virtuais, a capacidade de mover un sistema de máquinas virtuais dun servidor físico a outro mantendo o funcionamento normal dos servizos nas máquinas virtuais. Este proceso é insensible aos usuarios finais, os administradores poden asignar recursos do servidor de forma flexible ou reparar e actualizar servidores físicos sen afectar o uso normal dos usuarios.

Para garantir que o servizo non se interrompa durante a migración, é necesario que non só se manteña o enderezo IP da máquina virtual, senón que tamén se manteña o estado de execución da máquina virtual (como o estado da sesión TCP) durante a migración, polo que a migración dinámica da máquina virtual só se pode levar a cabo no mesmo dominio de capa 2, pero non a través da migración do dominio de capa 2. Isto crea a necesidade de dominios L2 máis grandes desde a capa de acceso ata a capa central.

O punto divisorio entre L2 e L3 na arquitectura tradicional de rede de capa 2 grande está no conmutador central, e o centro de datos debaixo do conmutador central é un dominio de transmisión completo, é dicir, a rede L2. Deste xeito, pódese realizar a arbitrariedade da implementación de dispositivos e a migración de localizacións, e non é necesario modificar a configuración de IP e gateway. As diferentes redes L2 (VLans) enrutanse a través dos conmutadores centrais. Non obstante, o conmutador central baixo esta arquitectura necesita manter unha enorme táboa MAC e ARP, o que supón altos requisitos para a capacidade do conmutador central. Ademais, o conmutador de acceso (TOR) tamén limita a escala de toda a rede. Isto limita finalmente a escala da rede, a expansión da rede e a capacidade elástica, o problema do atraso nas tres capas de programación non pode satisfacer as necesidades dos negocios futuros.

Por outra banda, o tráfico leste-oeste que trae a tecnoloxía de virtualización tamén supón desafíos para a rede tradicional de tres capas. O tráfico dos centros de datos pódese dividir en termos xerais nas seguintes categorías:

Tráfico norte-sur:Tráfico entre clientes fóra do centro de datos e o servidor do centro de datos ou tráfico desde o servidor do centro de datos a Internet.

Tráfico leste-oeste:Tráfico entre servidores dentro dun centro de datos, así como o tráfico entre diferentes centros de datos, como a recuperación ante desastres entre centros de datos ou a comunicación entre nubes privadas e públicas.

A introdución da tecnoloxía de virtualización fai que o despregamento de aplicacións sexa cada vez máis distribuído, e o "efecto secundario" é que o tráfico leste-oeste está a aumentar.

As arquitecturas tradicionais de tres niveis están deseñadas normalmente para o tráfico norte-sur.Aínda que se pode usar para o tráfico de leste a oeste, pode que finalmente non funcione como se require.

 Arquitecturas tradicionais de tres niveis

Arquitectura tradicional de tres niveis vs. arquitectura de follas de lombo

Nunha arquitectura de tres niveis, o tráfico leste-oeste debe ser reenviado a través de dispositivos nas capas de agregación e central. Pasa innecesariamente por moitos nodos. (Servidor -> Acceso -> Agregación -> Conmutador central -> Agregación -> Conmutador de acceso -> Servidor)

Polo tanto, se unha gran cantidade de tráfico leste-oeste se executa a través dunha arquitectura de rede tradicional de tres niveis, os dispositivos conectados ao mesmo porto de conmutación poden competir polo ancho de banda, o que resulta en tempos de resposta deficientes para os usuarios finais.

Desvantaxes da arquitectura de rede tradicional de tres capas

Pódese observar que a arquitectura de rede tradicional de tres capas ten moitas deficiencias:

Desperdicio de ancho de banda:Para evitar bucles, o protocolo STP adoita executarse entre a capa de agregación e a capa de acceso, de xeito que só unha ligazón ascendente do conmutador de acceso transporta realmente tráfico e as outras ligazóns ascendentes serán bloqueadas, o que resultará nun desperdicio de ancho de banda.

Dificultade na colocación de redes a grande escala:Coa expansión da escala da rede, os centros de datos distribúense en diferentes localizacións xeográficas, as máquinas virtuais deben crearse e migrarse a calquera lugar e os seus atributos de rede, como os enderezos IP e as portas de enlace, permanecen sen cambios, o que require o soporte da capa 2. Na estrutura tradicional, non se pode realizar ningunha migración.

Falta de tráfico leste-oeste:A arquitectura de rede de tres niveis está deseñada principalmente para o tráfico norte-sur, aínda que tamén admite o tráfico leste-oeste, pero as deficiencias son obvias. Cando o tráfico leste-oeste é grande, a presión sobre os interruptores da capa de agregación e da capa central aumentará considerablemente, e o tamaño e o rendemento da rede estarán limitados á capa de agregación e á capa central.

Isto fai que as empresas caian no dilema do custo e a escalabilidade:O soporte de redes de alto rendemento a grande escala require unha gran cantidade de equipos de capa de converxencia e capa central, o que non só supón custos elevados para as empresas, senón que tamén require que a rede se planifique con antelación ao construíla. Cando a escala da rede é pequena, provocará un desperdicio de recursos e, cando a escala da rede continúa expandíndose, é difícil expandirse.

A arquitectura da rede Spine-Leaf
Que é a arquitectura de rede Spine-Leaf?
En resposta aos problemas mencionados,Xurdiu un novo deseño de centro de datos, a arquitectura de rede Spine-Leaf, que é o que chamamos rede de cristas foliares.
Como o nome indica, a arquitectura ten unha capa Spine e unha capa Leaf, incluíndo interruptores spine e interruptores leaf.

 Arquitectura de rede Spine-Leaf

A arquitectura da espiña dorsal e a folla

Cada interruptor de folla está conectado a todos os interruptores de crista, que non están conectados directamente entre si, formando unha topoloxía de malla completa.
En spine-and-leaf, unha conexión dun servidor a outro pasa polo mesmo número de dispositivos (Servidor -> Leaf -> Spine Switch -> Leaf Switch -> Servidor), o que garante unha latencia predecible. Porque un paquete só necesita pasar por unha spine e outra leaf para chegar ao destino.

Como funciona Spine-Leaf?
Conmutador Leaf: É equivalente ao conmutador de acceso na arquitectura tradicional de tres niveis e conéctase directamente ao servidor físico como TOR (Top Of Rack). A diferenza co conmutador de acceso é que o punto de demarcación da rede L2/L3 agora está no conmutador Leaf. O conmutador Leaf está por riba da rede de 3 capas e o conmutador Leaf está por debaixo do dominio de transmisión L2 independente, o que resolve o problema BUM da gran rede de 2 capas. Se dous servidores Leaf precisan comunicarse, necesitan usar o enrutamento L3 e reenvialo a través dun conmutador Spine.
Conmutador Spine: Equivalente a un conmutador central. ECMP (Equal Cost Multi Path) úsase para seleccionar dinamicamente varias rutas entre os conmutadores Spine e Leaf. A diferenza é que Spine agora simplemente proporciona unha rede de enrutamento L3 resistente para o conmutador Leaf, polo que o tráfico norte-sur do centro de datos pode enrutarse desde o conmutador Spine en lugar de directamente. O tráfico norte-sur pode enrutarse desde o conmutador perimetral en paralelo ao conmutador Leaf ata o enrutador WAN.

 Arquitectura de rede Spine-Leaf VS. Arquitectura de rede tradicional de tres capas

Comparación entre a arquitectura de rede Spine/Leaf e a arquitectura de rede tradicional de tres capas

Vantaxes da folla de espiña dorsal
Plano:Un deseño plano acurta a ruta de comunicación entre os servidores, o que resulta nunha menor latencia, o que pode mellorar significativamente o rendemento das aplicacións e dos servizos.
Boa escalabilidade:Cando o ancho de banda é insuficiente, aumentar o número de conmutadores de crista pode estender horizontalmente o ancho de banda. Cando aumenta o número de servidores, podemos engadir conmutadores folla se a densidade de portos é insuficiente.
Redución de custos: Tráfico en dirección norte e sur, xa sexa saíndo dos nodos folla ou saíndo dos nodos de crista. Fluxo leste-oeste, distribuído por múltiples rutas. Deste xeito, a rede de crista folla pode usar conmutadores de configuración fixa sen necesidade de conmutadores modulares caros e, polo tanto, reducir o custo.
Baixa latencia e evitación de conxestión:Os fluxos de datos nunha rede Leaf ridge teñen o mesmo número de saltos a través da rede independentemente da orixe e do destino, e dous servidores calquera son accesibles en tres saltos Leaf ->Spine ->Leaf. Isto establece unha ruta de tráfico máis directa, o que mellora o rendemento e reduce os colos de botella.
Alta seguridade e dispoñibilidade:O protocolo STP úsase na arquitectura de rede tradicional de tres niveis, e cando un dispositivo falla, reconverxe, o que afecta o rendemento da rede ou mesmo pode provocar un fallo. Na arquitectura leaf-ridge, cando un dispositivo falla, non hai necesidade de reconverxer e o tráfico continúa a pasar por outras rutas normais. A conectividade da rede non se ve afectada e o ancho de banda só se reduce nunha ruta, con pouco impacto no rendemento.
O balanceo de carga mediante ECMP é axeitado para entornos onde se empregan plataformas de xestión de rede centralizadas como SDN. SDN permite simplificar a configuración, a xestión e o redireccionamento do tráfico en caso de bloqueo ou fallo da ligazón, o que fai que a topoloxía de malla completa de balanceo de carga intelixente sexa unha forma relativamente sinxela de configurar e xestionar.

Non obstante, a arquitectura Spine-Leaf ten algunhas limitacións:
Unha desvantaxe é que o número de conmutadores aumenta o tamaño da rede. O centro de datos da arquitectura de rede de crista foliar necesita aumentar os conmutadores e os equipos de rede proporcionalmente ao número de clientes. A medida que aumenta o número de hosts, necesítase un gran número de conmutadores foliar para conectarse ao conmutador de crista.
A interconexión directa dos interruptores de crista e de folla require coincidencia e, en xeral, a relación de ancho de banda razoable entre os interruptores de folla e de folla non pode superar os 3:1.
Por exemplo, hai 48 clientes cunha velocidade de 10 Gbps no conmutador folla cunha capacidade total de portos de 480 Gb/s. Se os catro portos de enlace ascendente de 40 G de cada conmutador folla están conectados ao conmutador de crista de 40 G, terá unha capacidade de enlace ascendente de 160 Gb/s. A proporción é de 480:160, ou 3:1. Os enlaces ascendentes dos centros de datos adoitan ser de 40 G ou 100 G e pódense migrar co tempo desde un punto de partida de 40 G (Nx 40 G) a 100 G (Nx 100 G). É importante ter en conta que o enlace ascendente sempre debe funcionar máis rápido que o enlace descendente para non bloquear o enlace do porto.

 Relación de ancho de banda do conmutador Spine-Leaf

As redes Spine-Leaf tamén teñen requisitos de cableado claros. Debido a que cada nodo folla debe estar conectado a cada interruptor spine, necesitamos tender máis cables de cobre ou fibra óptica. A distancia da interconexión aumenta o custo. Dependendo da distancia entre os interruptores interconectados, o número de módulos ópticos de gama alta que require a arquitectura Spine-Leaf é decenas de veces maior que o da arquitectura tradicional de tres niveis, o que aumenta o custo global de despregamento. Non obstante, isto levou ao crecemento do mercado de módulos ópticos, especialmente para módulos ópticos de alta velocidade como 100G e 400G.


Data de publicación: 26 de xaneiro de 2026