
Cloudera 技術總監 劉隸放
一個做AI的創業者說:數據越陳越像酒,應用越陳越像魚。從應用角度來講,應用有自己的生命周期,每個應用3-5年會下線更新。
現在是機器學習崛起的時代,這是由兩方面因素帶來的,一是隨著計算成本不斷降低,為大規模計算帶來可能,另一方面是大量數據為企業內部和外部做數據分析帶來基礎。
Cloudera 在三個方面幫助企業客戶工作:一是幫助客戶在業務洞察力方面提升企業價值,二是對于聯網的產品提供更優化的服務,三是通過機器學習保護企業的業務。中國聯通、中聯重工、中國銀聯都是Cloudera在中國最重要的客戶。
面向機器學習的企業平臺可以在三個方面幫助企業客戶:一是驅動客戶洞察力,幫助客戶做流失分析和預防;二是保護業務,包括網絡安全、欺詐、反洗錢、風控建模和評估、SPAM檢測;三是聯網產品和服務 (IoT),能夠檢測出所有的網絡問題、業務欺詐問題,幫助客戶做預測性維護。
很多大型企業都選擇Cloudera CDH 平臺作為大數據平臺,Cloudera在垂直行業中有超過1000個客戶,在財富8000中有超過500個客戶。
我們在很多領域都有案例,如在疾病控制中心,用機器學習可以跟蹤感染性疾病的傳播、識別具有嚴重公共衛生問題的社區、查看顯示感染傳播的數據模式。數據包括患者調查,病毒遺傳數據,實驗室檢測結果等。如幫助戴爾每天分析約2萬個潛在的惡意軟件,調查有可能出現的潛在安全事故,推送給客戶,大規模改善客戶的威脅防護,讓存儲成本從每GB 17美元降低到每GB 0.21美元。
我們為機器學習提供企業級開放平臺:一是滿足企業管理需求:安全、性能、合規;二是具有良好的擴展性,可以長期發展;三是可以在任何場景下運行,包括公有云、私有云、混合云和本地部署。
我們為機器學習提供三類解決方案:針對數據孤島問題提供Platform + SDX +C6;針對模型開發問題提供Cloudera Data Science Workbench;針對技術選型問題提供Fast Forward Labs。
數據管理是機器學習的基礎,Cloudera數據科學家工作臺是從模型開發到生產部署的端到端的工具,首先,它是統一平臺,能夠打破分析和信息孤島,支持企業內部、虛擬化部自助式分析,通過瀏覽器方式訪問,同時滿足企業級安全需求。其次,它可以實現彈性部署,支持GPU,提供數據科學家需要的計算能力數據,應對日益增多的資源需求。第三,支持Python、R、Scala,為數據帶來開源機器學習的靈活性,創新性和價值。第四,可用在容器化環境,提供簡單的協作開發,結果共享,代碼重用和依賴性管理。最后,可以進行本地部署或者云端部署。
我們相信:數據可以讓今天的不可能,在明天成為可能。
責任編輯:焦旭





