IP測量探索(七)——利用交換機檢查IP系統狀態
大家好,很高興又見面了,相信這個系列能讀到這里的都是本公眾號的資深粉絲了,感謝大家一直以來的支持。前面我們用三期介紹了2110系統中的各項IP指標,希望大家對這些指標有一定了解。今天我們換個角度,通過交換機上的狀態顯示,輔助我們查看網絡情況,檢查IP系統是否出現了問題。本期的主要內容有:
交換機信號轉發原理簡析
哪些信息用來檢查交換機的狀態
哪些信息用來檢查網絡連接狀態
確認系統連通性時需要檢測哪些內容
交換機的同步狀態如何查看
1 交換機在IP系統中的重要性
1.1 交換機在IP系統架構中的作用
如下圖是一個專業媒體制作領域IP系統架構實例,可將交換機的作用類比SDI時代的大型矩陣,可以看出交換機在專業媒體系統中已然成為了架構中的核心:
相較于矩陣,IP交換機的一點區別是所有實時IP信號,以及PTP同步均需要進入交換機,且由交換機進行信號分發,而矩陣往往只收錄部分信號。
1.2 交換機信號轉發原理簡析
交換機對于信號的轉發方式,可以根據其所處的OSI模型中的位置,來簡單區分為兩個過程:
圖103 OSI七層模型
二層交換:
交換機自誕生之初就是為了解決二層信號交換的問題,這也是交換機名稱的由來。對于工作在OSI第二層(數據鏈路層)的交換機,其信號本身在交換機內部會根據設備MAC地址直接進行轉發,發送端和接收端知道雙方的MAC地址即可。
圖104 二層交換機信號交換
而由于網絡中常用三層的IP地址進行尋址,因此對于跨局域網的三層信號交換則需要在二層交換機的基礎上增加一個三層路由器,從而實現路由的功能。
三層路由:
隨著以太網技術的發展,交換機僅二層的功能已經逐漸不滿足復雜組網的需要,因此出現了將交換機和路由器合二為一的三層交換機,此時交換機本身即可實現信號路由的功能:
圖105 二三層交換機混合組網架構
可以看出,在專業媒體制作領域的IP系統中,IP交換機扮演著一個十分核心的作用,因此交換機的基本狀態、交換機中IP信號的狀態、以及交換機同步狀態等信息對系統運行狀態檢測十分關鍵。
2 確認交換機狀態時需要檢測哪些信息
2.1 檢查交換機配置
若需要快速了解系統狀態,需首先檢查交換機配置信息,以確認交換機配置等情況是否正常,這里以華為為例:
display current-configuration | no-more:
圖 106 檢查交換機配置
2.2. 檢查交換機溫度
現有系統中交換機由于功耗大,發熱大,因此其散熱情況很受考驗,尤其在轉播車等空間較為緊張的區域格外需要關注溫度情況,以華為為例:
display health | no-more
圖107 檢查交換機溫度
其中current為當前溫度,需注意不能超過major一項的警告溫度。
2.3 檢查交換機固件版本
交換機不同版本之間也有可能產生性能差異,因此在系統中還需要確認交換機版本以及補丁等信息。以華為為例:
display version | no-more
圖108 檢查交換機版本
如上圖即可得知交換機軟件版本為V200R005C10SPC800,patch為V200R005SPH012。
2.4. 檢查交換機CPU占用
若交換機出現廣播風暴等負載壓力過大的情況,有可能導致交換機CPU過載,系統癱瘓,此時需關注交換機CPU占用信息。以華為為例:
display cpu | exclude 0%
圖109 檢查交換機占用
如上圖即可看到交換機當前占用,歷史占用,以及最大占用率和最大占用率出現的時間,以協助系統排查。
2.5 獲取交換機診斷日志(常提供給廠商分析)
交換機廠商的診斷信息獲取均有一套固定命令,以華為為例:
display diagnostic-information diag.txt
diagnose
collect diagnostic information
運行該命令耗時很長,可以獲取到交換機的各類日志,狀態等信息,建議在廠商指導下進行,運行完成后導出diag.txt文件即可。
3. 確認設備連接狀態時交換機需要檢測哪些信息
3.1 端口簡略狀態
設備連接到交換機時,首先需確認交換機端口連接狀態,包括端口鏈路通斷,端口占用等,此時可以利用交換機進行檢測。以華為為例:
display interface brief
圖110 檢查交換機端口狀態
如上圖UP為端口連接狀態,輸入輸出為端口帶寬使用率,還可以看到端口輸入輸出的報錯計數。
3.2 端口數據包統計
針對端口收發的數據包,還可以展示交換機的端口統計數據。以華為為例:
display interface counters 25GE 1/0/1
圖111 檢查交換機端口計數
如上圖即為端口當前輸入輸出的組播,單播數據包計數,字節數等信息。
3.3 端口丟包信息統計
針對端口是否發生丟包以及報錯,還可以利用交換機進行查詢。以華為為例:
reset interface counters 25GE 1/0/1
display interface 25GE 1/0/1 | no-more
圖112 檢查交換機端口丟包
如上圖即可看出當前端口不存在報錯信息,且丟包數為0,若有報錯等信息需檢查端口物理連接,配置等情況。
3.4 端口光模塊連接信息
現有交換機常使用光纖光模塊進行連接,此時端口物理層連接狀態可以在交換機中查看,當模塊光纖出現故障時,常用來查看光功率等信息。以華為為例:
display interface 25GE 1/0/1 transceiver verbose | no-more
圖113 檢查光模塊信息
如上圖即可看到交換機該端口光模塊供應商為Huawei,RX光功率為-0.05dBm,TX光功率為0.57dBm,均未超出或低于警告值。若檢測出來發現超過或低于警告值需檢查物理鏈路以及硬件情況。
3.5 MAC地址信息
設備連接到端口后,其MAC地址會告訴交換機以進行二層數據交換,此時查詢交換機MAC地址表即可知道設備是否正確連接到相應端口。還可用來查看交換機是否有沖突的MAC地址,若有沖突則很有可能發生了系統環路。以華為為例:
display mac-address | no-more
圖114 檢查MAC信息
如上圖可看到交換機每個端口報告的MAC地址,若有相同的MAC地址出現在不同端口則系統有可能產生環路,需要排除,以防鏈路中斷。
4 確認系統連通性時交換機需要檢測哪些信息
4.1 Ping檢測
由于現階段我們實際使用的多為三層混合組網架構,因此三層IP的互通直接影響了系統是否正常連通,此時常用Ping命令去檢測設備和交換機的正常連接。以華為為例:
Ping 10.110.10.254
圖115 Ping檢測
如上圖即為在交換機ping 10.254這一地址,可以正常互通沒有丟包,且延時量很低且穩定。若系統出現無法ping通需要互通的地址或ping延時較大,需檢查物理鏈路和交換機配置。
4.2 Arp檢測
若系統中出現IP地址沖突時,可能常見某一地址時通時不通,常可利用Arp信息檢測三層IP和二層MAC地址之間的對應關系。以華為為例:
display arp
圖116 檢查交換機arp表
如上圖即為不同IP地址對應的MAC地址及報告該IP地址的端口,若同一IP地址對應不同的MAC地址,出現在不同的端口,則有可能系統中存在地址沖突,此時需要檢查設備配置。
4.3 Stp檢測
若系統中出現STP環路時,可能常見某一端口連接正常但是數據功能被禁用,無法傳輸任何數據包,此時可以利用交換機STP命令進行檢測:
以華為為例,若某一端口為discard狀態,則需要檢測系統是否發生環路:
display stp brief
圖117 檢查交換機環路信息
如上圖即可看到交換機各個端口的STP角色均為DEST,且狀態都是正常轉發狀態。若系統中出現端口狀態為discard阻止狀態,則需要檢查系統環路情況。
4.4 組播igmp snooping信息檢測
檢查系統二層組播信號是否正常傳輸,可以在交換機進行檢測:
以華為為例,紫色即為當前端口收到的IP流,如此IP流即為PTP:
display igmp snooping group interface 25GE 1/0/1 vlan 21| no-more
圖118 檢查組播igmp snooping情況
如上圖即可看到該端口該VLAN下存在224.0.1.129的PTP組播流,且已經傳輸5小時30分鐘。
4.5 組播接收狀態檢測
檢查交換機是否正常收到組播流,可以在交換機進行檢測。以華為為例:
display multicast routing-table
圖119 交換機組播路由表信息截圖
圖120 檢查交換機組播接收狀態
如上圖即可看到設備192.168.99.199發送了,224.0.1.129的PTP組播流到vlanif 10虛擬端口,downstream一項則可以看到該組播流分發到了其他各個vlanif端口。
4.6 端口鏡像檢測
有時系統中某一設備發送和接收IP流的信息常無法直接檢測,此時可以利用端口鏡像,將被測設備的端口鏡像到檢測設備的端口,以檢查設備是否正常收到組播流。以華為為例:
observe-port 1 interface 25GE 1/0/11
interface 25GE 1/0/7
port-mirroring observe-port 1 inbound
port-mirroring observe-port 1 outbound
圖121 端口鏡像檢測
如上圖,將25G 1/0/7端口輸入輸出均映射到25G 1/0/11端口,在7端口接上被測設備,在11端口接上測試設備,即可檢測被測設備的收發IP流狀態。
5 確認交換機同步狀態時需要檢測哪些信息
5.1 PTP狀態檢測
由于現有系統中交換機已經成為PTP分發的重要一環,因此檢查交換機的同步狀態可以幫助我們迅速確認系統狀態,如交換機可檢測每個開啟PTP的端口當前的狀態,domain等信息。以華為為例:
display ptp all | no-more
圖122 PTP狀態檢測
如上圖,可發現此時交換機100G端口1為從上游同步的端口,其他端口向下游分發,其中100G的49、52端口PTP狀態為失敗,需確認和系統設計架構是否一致,若不一致則說明系統PTP鏈路出現異常。
5.2 PTP上級時鐘檢測
由于交換機常從上游時鐘同步PTP,并向下游發送,此時需檢測交換機上游鎖定的情況。以華為為例:
display ptp all | no-more
圖123 檢查交換機PTP上級時鐘
如上圖,即可看到交換機上游時鐘的CLOCK ID、優先級等信息,且交換機當前鎖定狀態正常。如和系統設計同步架構、系統實際主時鐘信息不一致,則需要檢查PTP鏈路。
5.3 PTP數據包檢測
另外由于PTP是利用數據包進行分發,因此可以檢查交換機是否正常傳輸PTP數據包。以華為為例:
reset ptp statistics interface 25GE 1/0/1
display ptp interface 25GE 1/0/1
圖124 檢查交換機PTP數據包
如上圖即可發現25G端口1正常接收和發送的PTP各類報文數量,重新檢測一下需看到報文數量按照預定頻率正常增長,若出現PTP報文數量異常則需要檢查配置和PTP傳輸鏈路。
6 命令匯總
由于交換機品牌不同其各類命令也不一樣,這里還總結了HUAWEI、CISCO、ARISTA三家交換機的常用檢測配置,以便快速查閱:
表6 檢查交換機配置
總結: