http://blog.csdn.net/xkarl/article/details/6546250
Broadcom以太网交换芯片培训
----
目录
1、 交换芯片架构
2、 L2转发流程
2.1 L2转发原理
2.2 L2转发相关的表项
2.2.1 port表
2.2.2 egress port表
2.2.3 L2地址表
2.2.3 VLAN表
3、 L3转发流程
4、 L2组播转发流程
5、 L3组播转发流程
6、 流分类处理流程
本文以broadcom56504/56300交换芯片为重点,先容一下交换芯片的工作原理。
1、 交换芯片架构
交换芯片由GE/XE接口(MAC/PHY)模块、CPU接口模块、输入输出匹配/修改模块、MMU
模块、L2转发模块、L3转发模块、安全模块、流分类模块等模块组成,其结构如图1所示:
图1 交换芯片的组成
56504包含24个GE端口,4个10G端口,10G端口既可以用于堆叠,也可以用于上联/级联。
56504交换芯片与CPU的接口称为CMIC接口。交换芯片与CPU通过PCI总线连接。其他类型交
换芯片与CPU的接口可以是:SPI+MII、I2C+MII、系统总线+MII、SMI+MII等。交换芯片的包处
理流程如图2所示:
图2 交换芯片的包处理流程简图
包由端口进入交换芯片之后,首先进行包头字段匹配,为流分类做准备;然后经过一个安全引
擎进行包过滤;符合安全的包进行L2交换或者L3路由,并经过流分类处理器对匹配的包做相关动
作(比如丢弃、限速、修改VLAN等);对于可以转发的包根据802.1P或DSCP放到不同队列的buffer
中,调度器根据优先级或者WRR等算法进行队列调度,在端口发出该包之前实行流分类修改动作,
最终从相应端口发送出去。
2、 L2转发流程
2.1 L2转发原理
对于交换芯片来说,L2转发是一个最基本的功能。L2功能主要包括ingress过滤、MAC学习
和老化、根据MAC+VLAN转发、广播与洪泛、生成树控制等基本功能。
L2转发的具体流程如图3所示:
从端口进入交换芯片的包首先检查TAG,对于tagged包,判断是否是802.1p的包,(802.1p
的包vid为0),对于untagged的包和802.1p的包,根据系统配置加上tag(这些配置包括:基于MAC
的vlan、基于子网的vlan、基于协议的vlan和基于端口的vlan)。经过这一步以后,到交换芯片内部
的包都变成802.1Q的tagged包了(vid为1-4094,4095保留),如果设置了ingress过滤,就会检
查本端口是否在该vid对应的VLAN中,对于本端口不在该vid对应的VLAN中的包就丢弃。对于
没有设置ingress过滤,或者设置ingress过滤但本端口在该vid对应的VLAN中的包进行STP端口
状态检查,对于BPDU以外的包,只有端口处于forwarding状态,才允许包进入。然后进行原MAC
地址检查,以原MAC+VID的哈希为索引查找L2 TABLE,如果没有找到,就把这个表项(原MAC+VID)以及对应的端口写到L2 TABLE中,这个过程称为MAC地址学习。当然地址学习的方法有
很多种,可以是硬件学习,也可以是App学习,可以根据PORT表中的CMI字段的配置来进行。
图3 L2转发流程
下一步进行目的MAC地址检查:目的MAC地址为广播地址(0xffffffff)的包,在vlan内广
播出去;目的MAC地址为组播地址的包,进行组播流程的处理;对于单播包,查找L2 TABLE,如
果没有找到,就在vlan内进行洪泛;如果找到,检查表项中的L3 bit是否设置,如果设置了L3 bit,
就进行L3流程的转发;否则就转发到L2 TABLE表项中的端口去,在egress方向,也有egress过滤
设置(默认是使能的),如果egress端口不在vlan中也是不能转发的。至此,L2转发流程完成了。
与地址学习相反的过程是地址老化。地址老化的机制是:ASIC内部有个定时器,称为age timer,
命令行可以对这个寄存器进行设置,每次查找L2 TABLE时(包括原地址查找和目的地址查找,可
以配置),如果命中,就会设置hit标志。当老化时间到后,ASIC把hit标志清除,当下一个老化时
间到后,ASIC把hit为0的地址设置为无效,这就是为什么实际地址老化的时间为1~2倍agingTime
的原因。
2.2 L2转发相关的表项
2.2.1 port表
图4 port表
Port表是一个非常重要的表,有很多与端口相关的控制都在这里设置。每个端口对应一个表项,
按端口号进行索引。下面先容一下重要的设置:
1) PVID:设置PORT_VID
2) 缺省优先级:设置PORT_PRI
3) 流分类使能:设置FILTER_ENABLE
4) VLAN转换使能:设置VT_ENABLE和VT_MISS_DROP
5) Ingress过滤使能:设置EN_IFILTER
6) 信任COS还是信任DSCP:对于IPV4:TRUST_DSCP_V4=0:信任COS;
TRUST_DSCP_V4=1:信任DSCP,对于IPV6:同样设置TRUST_DSCP_V6。
7) Ingress方向mirror使能:设置MIRROR
8) MAC地址学习方式:设置CML
9) IP组播是否使用VLAN信息:设置IPMC_DO_VLAN
10) L3转发使能:设置V4L3_ENABLE和V6L3_ENABLE
11) 是否丢弃BPDU:设置DROP_BPDU
12) 控制是否转发带tag和不带tag的包:设置PORT_DIS_TAG和PORT_DIS_UNTAG
13) Pause帧控制:设置PASS_CONTROL_FRAMES
14) 基于子网的VLAN使能:设置SUBNET_BASED_VID_ENABLE
15) 基于MAC的VLAN使能:设置MAC_BASED_VID_ENABLE
16) 设置堆叠口:HIGIG_PACKET
17) 设置NNI口:NNI_PORT
18) 修改优先级使能:MAP_TAG_PACKET_PRIORITY
19) 堆叠口modid设置:MY_MODID
20) Out tpid设置:OUTER_TPID
21) 基于MAC和基于子网的VLAN优先级设置:VLAN_PRECEDENCE
22) 是否允许单臂桥功能:PORT_BRIDGE
23) IP组播位图设置:IGNORE_IPMC_L2_BITMAP和IGNORE_IPMC_L3_BITMAP
2.2.2 egress port表
图5 egress port表
EGR_PORT是一组寄存器,每个端口一个,用于EGRESS方向的控制,有几个重要设置先容
如下:
1) 设置egress端口类型:PORT_TYPE=0,UNI端口;PORT_TYPE=1,NNI端口
2) 设置egress过滤:EN_EFILTER=1
2.2.3 L2地址表
图6 L2地址表
56504的L2地址表大小为16K,5630X的L2地址表大小为8K,地址表使用MAC+VID的hash
值作为索引查表。实际上56504的L2地址表hash值为4K,每个hash值对应4条地址,这样最多
可以保存4条hash冲突的地址。地址表中每个表项都保存了MAC_ADDR和VLAN_ID。MAC学习
的时候使用原MAC+VID的hash查表,把表中的MAC+VID与包中的MAC+VID进行比较,如果
|