大數據一體機趨勢解讀|軟硬結合,固化大數據、AI能力

2015-10-19 21:39:15

 2017年,業界已經有企業開始推廣人工智能(AI)+大數據+云計算三種能力整合的一體機產品。有觀點認為這類的一體機產品或許更加適合互聯網行業的應用屬性,但至少能讓我們感覺到:在云、大數據、AI時代,一體機會是一個趨勢。Gartner 曾預測:“到2018年,35%的服務器都將以集成系統方式交付”。這里的集成系統就包括超融合、軟硬一體機等多種形態。

      所謂一體機,是軟件與硬件相結合的集成系統產品,其一般集數據處理、數據傳輸、數據存儲三方面于一體。一體機通過預先集成、測試、優化,能夠實現快速部署、簡化IT基礎架構,節省資源,提升系統高可用性和可擴展性。

而在應用一體機、中間件一體機、數據庫一體機等等中,目前市場上接受度較高的就是數據庫一體機,其主要原因是:

      1.數據庫加速,為取得更好的數據庫性能,會在硬件層、彈性存儲層做垂直深入的調優,例如采用讀寫更快的SSD盤,采用面向數據庫獨特的讀寫算法。

      2.數據庫加固,為保證數據庫數據不丟失、不損壞,會在中間件服務層增加數據庫的備份/恢復、容災、定期校驗等服務,提高數據的可用性。

      這兩點優勢,在大數據一體機上得以延續。除此之外,大數據一體機還將在以下幾個層面帶來獨特的優勢:

     (1)簡化(預集成)、優化的基礎設施,降低部署管理難度;

     “話說天下大勢,分久必合,合久必分”,縱觀基礎設施的發展,從一體化大型機,到各計算、網絡、存儲系統逐漸分離,再到重新走向融合。歷史總是如此反復的前進。而從IT基礎設施發展角度看,復雜的系統集成模式已經成為業務創新的“絆腳石”。簡化(預集成)、優化的基礎設施才能為數據驅動“智能化”提供更好的保障,解放IT人員的部署運維工作,真正有精力關注業務創新、數據智能等領域。

    (2)大數據處理軟件的設計原則是“本地化計算”,“計算與存儲一體”;

u 計算與存儲一體,計算向數據靠攏,高效專用存儲模式。

u 為程序員屏蔽通性、并發、同步與一致性等問題。

u 任務之間無依賴(share-nothing),具有高系統延展性(scale-out)。

      以Hadoop、Spark為代表的大數據處理框架,架構設計原則之一就是:本地化計算。這摒棄了傳統計算和存儲系統分開的架構,而采用服務器的CPU和硬盤作為計算存儲能力。本地化計算(計算隨數據分布)是指并行計算框架智能地將計算任務指派到存儲著該任務所需數據的節點,從而避免傳統分布式計算中嚴重的數據傳輸瓶頸。

     (3)深度學習、神經網絡算法需特殊硬件

      2017年,是人工智能的元年,Alphago的走紅隨之帶來的是對GPU、TPU、FPGA等并行計算專用硬件的關注。

      以大家耳熟能詳的卷積神經網絡CNN 為例,感受一下目前訓練深度學習模型需要多少計算力?;贗mageNet數據集訓練CNN,數據集一共大約120萬張圖片,訓練算法需要對這個數據集掃描100遍(epoch),這意味著10^18次浮點計算,即1exaFlops。簡單演算一下,基于一個主頻為2.0GHz的CPU core來訓練這樣的模型需要好幾年的時間。而采用GPU(NVIDIA Tesla P40),單塊只需50小時。按照一臺2U服務器裝載4塊GPU計算,只需要12.5小時。這也就是GPU比CPU在人工智能上的侵略性優勢、而谷歌的TPU處理性能號稱比GPU快百倍。

      因此,大數據一體機加入GPU、TPU、FPGA等專有硬件,就形成了特有的競爭力。(上訴神經網絡算法只是這類專有硬件應用的冰山一角,其他例如:數據庫加速、語言識別、視頻處理等,都需要大量專有硬件)

    (4)數據驅動:客戶最終都需要有一個自己的“大腦”

      數據資產正變得越來越重要,因此誰也不希望自己的數據被某幾個云巨頭存儲和分析。因此未來各行各業的客戶勢必需要一個自己的“大腦”,而大數據一體機是很好的承載平臺。一方面保證數據資產留在自己的IDC機房,另一方面也具備便捷運維、高效分析的能力。

      綜上所述,大數據一體機的市場需求較為明確,可提供領先的、更易部署和管理、更高性能和更低TCO的大數據解決方案,為客戶的數據管理提供更強有力的支持。


引自新華三技術有限公司官網


欧美成人刺激a片多人,制服丝袜自拍另类第1页,免费观看成人网站黄页在线大全,国产成人aa在线视频