計世網

云原生數據基礎設施,釋放數據要素價值
2021-12-21
作為全新的數據載體,云原生數據基礎設施將緊隨時代發展作出反應變化。

 

2021年是中國十四五計劃的開局之年,在《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標的建議》中明確提出:“要推進數據要素市場化改革、加快數字化發展”,從而將數據要素提升到一個全新的戰略地位。

如何激活數據要素潛能,推進網絡強國建設,加快建設數字經濟、數字社會、數字政府,以數字化轉型整體驅動生產方式、生活方式和治理方式變革,是數字中國最為艱巨的任務。而推動數據要素價值轉換自然離不開云原生數據基礎設施的支持。其中,以存算分離、支持多協議的彈性文件存儲、高效的近數據計算技術為代表,新技術應用將助力不同行業企業用戶最大程度釋放數據價值。

存算分離釋放無盡算力

大數據技術最初的形式是計算和存儲捆綁,強調的就是數據貼近計算,技術核心是HDFS+MapReduce數據管理方式,如今,大數據技術有了進一步發布,從計算和存儲捆綁走向了存算分離設計,從而讓Hive、HBase等大數據應用迎來新的發展契機。

以華為云Big Data Pro大數據離線分析解決方案為例,計算、存儲單獨擴容,因此會減少不必要的資源浪費。華為云Big Data Pro通過存儲無感擴容,可消除預留容量浪費,多種協議支持也減少數據多次復制的現象。存算分離,分布式存儲跨可用區容災,使得數據持久度高達12個9,數據可靠性更有保障。

從數據貼近計算到如今存算分離,這種截然相反的變化,大家是不是也會感到奇怪呢?劇情“反轉”背后的主要原因是什么?

或者說,存算分離還能夠滿足近數據計算的要求嗎?

為此,我也詢問了華為云文件存儲服務總經理崔林威。

崔林威表示:存算分離仍然能夠滿足類似近數據計算的需求,其中很重要的原因是網絡技術突飛猛進的發展,這同時也為存算分離提供了基礎。不論是近數據計算,還是存算分離并不改變上層HDFS+MapReduce的結構。相比傳統方式,華為云BigData Pro在計算存儲分離基礎上,提供了多協議互通、高可靠等優勢。

多協議彈性文件存儲沖破傳統協議局限

SFS(Scalable File Service)是一種彈性文件服務,不僅可以提供大數據、文件接口,例如與云內的MRS、DLI等數據分析服務提供存儲服務,也可以通過NFS/CIFS協議或者POSIX客戶端為云內部署的視頻編輯、基因分析、油藏模擬、設計仿真等軟件提供數據。

“可以把數據理解為一瓶礦泉水,跨協議訪問就可以理解為多幾根吸管兒。” 崔林威說。

SFS是業界首個支持NFS/CIFS/對象/大數據等多協議接口的存儲服務,是一種高性能文件存儲(NAS),為基因分析、視頻制作/渲染、地球物理、文件共享、內容和Web服務等業務場景提供共享數據訪問存儲服務。SFS沖破傳統NAS只有私有數據存儲協議的局限。

例如在視頻制作/渲染場景中,華為云與芒果TV探索出了一條更低成本、更實用的制播方案,打造出業界首個基于云服務打造的4K綜藝節目——“乘風破浪的姐姐”第二季。

借助SFS混合云解決方案能夠兼容對象接口特性,直接將拍攝視頻通過對象存儲上傳到華為云,在云上通過文件接口對視頻進行轉碼、合成、調色、渲染等系列處理后,直接分發到對應播放平臺進行播放。節目制作時間縮短了50%,按需付費的云上資源,相對于自建IT系統,節省了90%的初始投資。作為電視機前的觀眾,可以看到姐姐們清晰的服裝細節和每一根睫毛,讓電影的質感得以在周期要求高、成本管控嚴的綜藝節目中呈現。

近數據計算有效縮短數據處理時間

華為面向公有云用戶提供數據工坊(Data Workroom)近數據處理服務,可將圖像水印、圖像轉碼、視頻轉碼、內容審核、火點發現等數據處理業務,通過數據處理算子市場或者數據處理工作流編排實現近似流水線的操作,如此可大大縮短互聯網客戶業務開發周期,通過簡單的托拉拽即可,也降低了開發/運維難度,效率提升90%。

如今,數據工坊開放算子庫中有大量高質量的華為自營算子,也有海量第三方算子,無論是進行圖片轉碼還是視頻截幀,你都能輕松找到適用的算子來完成數據處理工作流。 通過算子下推技術,在近數據的地方進行數據處理,省去數據在存儲與計算直接的傳遞,數據處理時間縮短50%。

小結

我們即將迎來數據4.0時代,更進一步推動數字經濟發展,其特點是從物聯網時代的物產生數據升級為將人腦構想、世界里大多并不存在的虛擬空間構成數據,映射到信息空間,數據存儲需求將噴涌而出,作為全新的數據載體,云原生數據基礎設施將緊隨時代發展作出反應變化,在算力、彈性存儲為關鍵指標的元宇宙時代,期待華為云的精彩表現!

責任編輯:劉沙