
近日,愛爾蘭利默里克大學電子與計算機工程博士,IEEE計算機協會高級會員,中國計算機學會大數據專家委員劉政做客深圳市民文化大講堂,給市民朋友帶來了主題為《新經濟與大數據》的演講。在講座前,記者采訪了劉政老師,他與記者暢聊了大數據給人們生活帶來的影響,大數據與新經濟的關系,大數據給我們帶來的機遇和挑戰,大數據與個人隱私保護的平衡,大數據人才需要掌握的核心技能等大家普遍關心的問題。
記者:新經濟與大數據是大家關注的熱門話題,什么是新經濟?
劉政:新經濟是指信息技術革命以及由此帶動的以高新科技產業為龍頭的經濟。我們過去買東西都是到商店里去,現在我們從淘寶上買東西,這是互聯網給我們帶來的新經濟。那大數據給我們帶來的新經濟是什么?隨著大數據的出現,誕生了許多新興行業。這些新興的行業就是新經濟。物聯網、人工智能、金融科技、生命科學,等等。這些建立在數據分析基礎之上的新業態也是新經濟。
記者:大數據有哪些特點?
劉政:第一,容量大,非常大的容量。第二,種類多,有各種不同類型的數據,包括視頻的數據,圖片的數據,語音的數據,文本的數據,還有各種其他形式的數據,它的數據形式是多種多樣的。第三,它的增長速度非常快,每天上億人在使用手機上網,就會產生非常多的數據。這些數據中有很多有價值的東西,我們可以去挖掘。
記者:大數據的數據分析方式和傳統數據分析方式有何不同?
劉政:在大數據出現之前,我們運用傳統的數據分析方式,例如統計分析、運籌學、計量經濟學來做數據分析,這些數據分析方式只能處理比較小、比較短的字節,處理的數據范圍也十分有限。大數據出現之后我們可以處理一些過去處理不了的數據,比如大數據可以進行文本分析,它可以從用戶對某一產品的評價反饋中分析出用戶對該產品的情感取向,我們可以第一時間了解到產品的哪些方面是用戶喜歡的,哪些方面是用戶不喜歡的,從而改善產品的功能與設計。除了文本分析,大數據還能進行圖片分析,包括現在很火的人臉識別,這些都是傳統數據分析無法完成的。
記者:大數據的數據分析方式,會替代或者顛覆傳統的數據分析方式嗎?
劉政:它不是一種替代,應該說是一種補充。其實有時候新的方法不一定比傳統方法好。比如說我們給這個銀行做模型的時候,我們可以用統計分析的方法去做,也可以用機器學習的方法去做,然后你比較兩個結果,會發現相差不多,但是統計分析結果的過程更簡單,速度也更快。
記者:政府、企業怎樣才能利用好大數據?
劉政:政府可以利用大數據技術推動公共安全治理,我國傳統犯罪預防主要以已發生的案件類型作為預防對象,常常忽視事前對犯罪相關因素的調查或跟蹤,預防效果并不明顯。而大數據可以分析各級各類政府部門在社會治理中積累的數以億計的公共服務大數據,比如出行記錄、犯罪記錄、法院記錄,等等,公安機關可以根據數據分析的結果更快地鎖定犯罪嫌疑人。
另外大數據在社保體系的建立中也起著至關重要的作用。通過數據分析,我們可以提高社保的針對性和有效性,從而幫助更多人解決問題。另外,大數據可以對重復領取待遇、死亡冒領養老金、違規提前退休等問題進行有效監管,篩查社保基金欺詐違法行為,提高基金安全監管的針對性和精確性。其他還包括智慧交通、國家人口統計,等等。有了大數據的加持政府的決策會更加高效、更加科學。
對于企業來講,金融行業應用大數據是最多的。大數據能幫助企業提高工作效率,提高決策的精準度。企業能不能利用好大數據,關鍵是看企業決策者的重視程度。
記者:在大數據概念隨處可見的當下,作為個人,我們應該如何提高“數”商以適應大數據時代?
劉政:在現在這個時代,其實我們每個人跟數據都脫不開關系了。數據現在就相當于生產資料,它是可以買賣的。商家掌握了你的數據后就可以根據你的喜好不斷地給你推銷產品;電話號碼泄露后會有許多的騷擾電話。于是如何保護個人隱私?個人隱私數據的所有權,如何去界定?我們也應該主動去了解。
記者:大數據是否在改變著我們看待世界的角度和思考生活的方式?
劉政:可以這么說,過去我們做決策不會考慮數據的因素,現在我們可能會更多的要去考慮用數據做分析,參考數據分析的結果,來評估風險,大數據的確會對我們的思維決策過程產生影響。
記者:如何理解大數據是一把雙刃劍?
劉政:其實很多技術都是雙刃劍,就是說既對人有幫助也對人有傷害,大數據也是一樣,關鍵看你怎么用。企業用大數據可以挖掘出很多有價值的東西,但也有人會用大數據去做一些壞事。大數據現在很大的一個缺失就是在立法上。比如說數據的所有權問題,數據隱私保護問題,數據交易問題,數據分析的結果在法院能不能作為證據來使用等問題都需要立法來明確。但是因為大數據是一個以前從未有過的概念,在立法上也沒有可以參考的東西,所以會有一些無從下手。我認為,應該先草擬一個版本,通過模擬的方式對其進行修正和補充,等待它成熟之后再正式頒布。
記者:大數據人才需要掌握的核心技能是什么?您對大數據人才培養有哪些建議?
劉政:大數據人才要掌握的核心技能就是數學。在計算機時代,美國企業找人,就首選數學專業,到今天大數據時代,還是首先選學數學的人才。學數學的人思維能力強,容易理解各種算法和數學模型,加上計算機編程能力,可以寫出高深的程序。所以,我們的高等院校一定要加強數學教育。其次,要掌握的技能包括計算機、網絡技術、編程、行業知識等。在人才培養方面,大部分學校都還缺少合格的師資,缺少教案。我覺得弱校應該多向強校取經,交換資源,向社會開放引入資源。我們現在就在做大數據方面的教案,還有SAS免費捐贈的軟件,希望能幫助一些高校做好大數據人才培養。
記者:前一段時間,換臉軟件Zao一夜爆紅隨即遭遇滑鐵盧,大數據和個人隱私又成為了輿論的焦點,您如何看待?
劉政:新產品的上市銷售都經過國家的審批過程,軟件產品是否也應該經過審批才可以上市?如果不是這樣,就難免會出現魚龍混雜,違反法律和倫理道德的問題。Zao獲取私人數據,讓用戶未經許可擅自修改別人的照片、侵犯他人權利,濫用技術給當事人造成名譽損害和精神傷害,甚至包括經濟損失,理應受到懲罰。
記者:有人曾經發表過:“中國人愿意用隱私換取便利”的言論,您如何看待?
劉政:數據的概念,個人數據隱私對大部分中國人來說,還都是一個比較新穎的概念,對其缺乏充分的認識。我覺得不能說是“中國人愿意用隱私換取便利”,而是大部分人對此沒有清楚的認知,不知道其危害性。如果商家利用人們的無知和善良獲取、甚至騙取私人數據,就太不善良了。當人們明白過來的時候,就會向商家討公道。商家做生意一定不要短視,看重眼前利益。前面應該是都吃過教訓的。國家應該盡快進入立法程序,在大數據時代保護人們的合法權益和商家的正當權益。
(本文作者 劉政,愛爾蘭利默里克大學電子與計算機工程博士,IEEE計算機協會高級會員,中國計算機學會大數據專家委員,清華大學大數據碩士項目教育指導委員會主任,中科院深圳先進技術研究院碩士研究生導師,中國軟件行業協會理事,北京大學、清華大學、中國科學技術大學客座教授,北京賽仕軟件研究開發有限公司總經理。著有《可視化分析與SAS實現》《統計分析實用教程》。)
責任編輯:張旖旎





