
1.0到3.0的功能演進及創新突破
從誕生之日起,青云的SDN就沒走尋常路。在1.0時代,青云的切入點放在,讓IDC的各種網絡組件以虛擬化的形式放在云上,讓用戶自行組合,形成自己的網絡,并且做到100%二層隔離的私有網絡。
2.0時代,青云的思路是把以前樹型結構的網絡拓撲打散,變成分散的網狀結構。SDN 2.0主要的改變就是推出分布式網關,可以讓用戶虛擬機所在的物理節點,也就是計算節點上,有自己獨有的虛擬網關,可以直接跟其他節點連接在一起。SDN 2.0還提供了分布式多節點負載均衡器,這也是為了更大程度上提高用戶業務性能。
今天,SDN 3.0來了,不斷升級后的青云SDN 3.0相對上一個版本,又有哪些升級和改變?
“如果說2.0時代,所有的網絡組件都是虛擬的,由軟件實現的,那么3.0時代,青云QingCloud則更多利用了硬件路由器的能力。比如分布式網關在計算節點上,下一跳的路由器是物理路由器,不再是NFV。這樣做的好處是可以作為一個集中節點,承擔整個可用區的網絡流量,使其更高效的和其他機房連接在一起。同時,負載均衡器場景中,青云把LVS的功能也就是以前NFV的作用直接體現在硬件交換機上,通過發掘硬件交換機特有的功能,與SDN進行融合,讓產品性能更好、穩定性更好。”青云QingCloud云計算基礎平臺研發總監陳海泉在采訪中這樣介紹說。

另外,3.0版本相對于上一版本的區別還在于,用戶業務可以從一個可用區延伸到多個可用區之間,幫助用戶構建同城多活或者異地災備的業務。與2.0相比,3.0除了有分布式虛擬路由器,還有集中的硬件路由器。只有讓我們的SDN能與物理設備完美的結合在一起時,才有可能做到同城多活和異地災備。這就是為什么青云引入了集中式硬件路由器的原因,目的就是讓路由器承擔集中的節點,再用路由器接入青云的骨干網,把不同可用區之間的業務高效的連接在一起。
除了集中的硬件路由器,青云青云QingCloud還增加了以下功能:
一、任播公網IP,通過BGP AnyCast的方式,把一個IP部署在多個可用區之間,達到多活的效果。如果有一個可用區光纖中斷,它可以自動把業務切換到其他可用區,這在很大程度上保證了用戶業務的可靠性。
二、基于任播IP,SDN 3.0提供了多活負載均衡器,可以讓用戶自己的業務部署在不同區的同一個VPC中,不同VPC之間的業務也可以高效互相連接。不同組件的互相連接之間都可以通過硬件集中路由器實現。
SDN 3.0給用戶帶來的價值
基于以上這些功能,青云QingCloud能為用戶提供多活業務。以青云北京3區舉例,北京3區包含三個可用區(B、C、D),三個區之間共享一套負載均衡器集群,實際上是部署在每個區之間的路由器。為什么他們能夠多活呢?因為每個路由器上的IP地址都是以任播的方式配置在一起。對于用戶來說,他離哪個可用區近,這個區的路由器就能到達它的業務集群。假設某一個可用區的光纖被挖斷,這時候BGP會把用戶流量自動切換到其他區,在用戶看來幾乎沒有影響,它的業務可以繼續被使用。
除了對公網的負載均衡器集群可以做到多活,用戶自己的業務也可以做到多活。這是因為青云給用戶提供虛擬網絡,可以在不同可用區之間漂移虛擬IP。部署過高可用業務的用戶可能深有體會,那就是假如有3個MySQL節點可以共享同一個IP對外提供服務。一旦這個IP所在的節點死掉,IP可以通過keepalived的方式直接遷移到其他節點,在客戶端這個IP始終是可用的,只是中間斷了一下,業務基本沒有太大的影響?;谶@種方式,用戶仍然可以在可用區之間部署他的數據庫節點集群。即使某個區整體故障,用戶的其他區仍然可以工作。
如何讓用戶部署其高可用業務?青云采取的措施是,在不同的可用區之間都有完全相同的一套SDN軟件,以及硬件部署設施。對用戶來說,他的虛擬主機運行在計算節點上,每個計算節點上有自己獨有的分布式網關,可以讓虛擬機直接路由到其他的各種網絡設備。除了SDN 2.0已有的VPC網絡、基礎網絡、公網隧道以及負載均衡器,這一系列的虛擬網絡單元外,SDN 3.0最重要的一點是讓分布式網關能夠跟物理邊界路由器直接相連,它可以通過路由器進入青云的骨干網,之后通過BGP路由轉發到其他可用區之間。從青云的基礎設施來看,可用區A、可用區B獨立工作,并且互相連通。當他們部署在同一區域時,就適合組建同城多活的業務;當他們部署在異地時,就比較適合異地災備。這樣用戶可以根據實際需求以及IDC部署的位置,自己選擇做多活還是災備。
青云QingCloud SDN3.0和目前其他商用SDN的最大區別則在于:青云可以把NFV與硬件網絡設備融合在一起,取長補短,使用各自優點。對于軟件來說,好處是部署靈活、功能強大,用戶的數據表可以無限大,配置規模沒什么限制,成本不高;硬件交換機的特點是性能好、很穩定,可以高可用部署。硬件交換機的缺點也很明顯,表象非常少,如果在公有云上直接以硬件SDN的方式使用,面臨的問題是表象不夠。所以,我們把二者結合起來,能分散的用軟件NFV設備;分散不了的就放在硬件SDN交換機上,用硬件的能力實現需要的功能。
負載均衡器將適用于更多場景
在陳海泉看來,負載均衡器的改變也是此次升級版3.0的價值所在。通過對比你會發現,使用LVS的方式,主要轉發率大概是2Mpps,而SDN 3.0使用交換機實現,其轉發率可提升到1Gpps,而且這只是青云諸多節點中的一個。
陳海泉對此解釋說:“因為LVS部署必須是主備的方式,給用戶提供的虛擬IP部署在一個LVS節點上。我們架構升級之后,每臺交換機以多活的方式運行。青云在一個區域一共部署了四臺交換機來組成負載均衡器,它的總轉發率變成4Gpps,與以前相比提升了2000倍,同時成本下降成零。”因此陳海泉也建議用戶無論是否有LVS,交換機也一定要買,這是青云負載均衡器的全新升級。
青云也希望負載均衡能在更多的場景被使用,今年青云會將負載均衡器3.0做成開源項目放在社區。并且計劃將其用在同樣開源的容器平臺KubeSphere產品上。
責任編輯:李麗





