日前,《華爾街日報》的一篇華為和騰訊正因用戶數(shù)據(jù),產(chǎn)生沖突的文章在業(yè)內(nèi)流傳,并經(jīng)國內(nèi)部分媒體的發(fā)酵(夸張的翻譯及再加工),演繹出了諸多不同的版本。但有一點(diǎn)可以確認(rèn)的是,此前工信部所屬的國內(nèi)權(quán)威的泰爾實(shí)驗室已經(jīng)檢測確認(rèn)榮耀Magic并不存在侵犯用戶數(shù)據(jù)隱私,而諸多第三方的測試也顯示,榮耀Magic也不存在侵犯用戶數(shù)據(jù)隱私。我們這里需要強(qiáng)調(diào)的是,為了更好提升用戶的體驗和提供更多、更好的服務(wù),用戶數(shù)據(jù)的搜集、利用與侵犯用戶數(shù)據(jù)隱私完全是兩個不同的概念。
其實(shí)通過此次《華爾街日報》的報道,我們更關(guān)心的是AI時代下,相關(guān)企業(yè)到底該不該搜集和利用用戶的數(shù)據(jù)信息以及為何要搜集和利用用戶的數(shù)據(jù)信息。
熟悉AI的業(yè)內(nèi)人士知道,在當(dāng)下,如果把AI看成一個嗷嗷待哺、擁有無限潛力的嬰兒,某一領(lǐng)域?qū)I(yè)海量的深度數(shù)據(jù)就是喂養(yǎng)這個天才的“奶粉”。奶粉的數(shù)量決定了嬰兒是否能長大,而“奶粉”的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。正是基于此,在進(jìn)入AI時代,數(shù)據(jù)搜集及基于數(shù)據(jù)的分析已經(jīng)是業(yè)內(nèi)大佬的共識。
眾所周知,亞馬遜的大數(shù)據(jù)分析系統(tǒng)在電商行業(yè)獨(dú)領(lǐng)風(fēng)騷,其會追蹤用戶在電商網(wǎng)站和APP上的一切行為,盡可能多地收集數(shù)據(jù)。只要看一下亞馬遜的“賬戶”部分,就會發(fā)現(xiàn)其強(qiáng)大的賬戶管理,這也是為收集用戶數(shù)據(jù)服務(wù)的。主頁上有不同的部分,例如“愿望清單”、“為你推薦”、“瀏覽歷史”、“與你瀏覽過的相關(guān)商品”、“購買此商品的用戶也買了”,亞馬遜保持對用戶行為的追蹤,為用戶提供卓越的個性化購物體驗。而作為亞馬遜最大對手的沃爾瑪,其也通過店內(nèi)的Wi-Fi搜集了將近1.45億美國客戶(相當(dāng)于美國成年人的60%)的詳盡數(shù)據(jù),包括他們購買的物品、住的地方,以及喜歡的產(chǎn)品等。與此同時,其還通過分析用戶在Walmart.com的點(diǎn)擊行為,消費(fèi)者在店內(nèi)和線上購買的物品以及推特上的趨勢,判斷當(dāng)?shù)氐幕顒雍吞鞖庾兓瘜⑷绾斡绊懹脩舻馁徺I模式等。根據(jù)大數(shù)據(jù)分析出的結(jié)果,沃爾瑪可以靈活調(diào)控倉庫中的貨物存儲,動態(tài)調(diào)整價格,以短信和直郵的形式對用戶進(jìn)行精準(zhǔn)營銷,同時實(shí)現(xiàn)自身銷售利潤的最大化。
再如傳統(tǒng)IT企業(yè)的IBM,其知名AI系統(tǒng)沃森,從2015 年 4 月進(jìn)入醫(yī)療領(lǐng)域至今,為了讓沃森商業(yè)化,IBM先后花了40 多億收購其他公司,而并購的目的是這些公司擁有大量的醫(yī)療數(shù)據(jù)資源,比如記帳記錄,患者病史,X 射線和 M.R.I 圖片等。與沃森類似,谷歌著名的AI系統(tǒng)DeepMind目前也已經(jīng)進(jìn)入醫(yī)療行業(yè)。去年11月,公司獲得了首個付費(fèi)項目,與NHS公立醫(yī)院皇家自由倫敦醫(yī)院(Royal Free London)簽下五年的合同,為其處理170萬份病歷。此外,DeepMind還獲得了訪問其它倫敦醫(yī)院兩個數(shù)據(jù)庫的權(quán)限,即DeepMind利用AI軟件分析了約100萬份視網(wǎng)膜掃描報告成功找到了退行性眼疾的早期征兆,或通過頭頸部癌癥圖像讓AI軟件學(xué)會區(qū)分健康和癌組織之間的不同。
從上述沃森、DeepMind的商業(yè)化看,均需要首先獲取現(xiàn)實(shí)世界的大數(shù)據(jù),即使擁有大量數(shù)據(jù)的可供挖掘的谷歌,運(yùn)用AI及機(jī)器學(xué)習(xí)技術(shù)改進(jìn)醫(yī)院、電網(wǎng)及工廠等系統(tǒng)時,獲取其詳細(xì)的數(shù)據(jù)也非常重要。
最后是目前業(yè)內(nèi)熱炒和效仿的亞馬遜智能音箱Echo和其對手Google Home,在某種意義上,購買 Echo 或 Google Home 表示消費(fèi)者已經(jīng)接受了購買互聯(lián)網(wǎng)設(shè)備的事實(shí):通過內(nèi)建的麥克風(fēng),這些設(shè)備的工作方式就是 24 小時不停地監(jiān)聽周遭環(huán)境,以便及時對用戶的呼叫做出反應(yīng);同時相應(yīng)公司會收集用戶數(shù)據(jù)進(jìn)行分析以不斷提高自己的服務(wù)質(zhì)量。
由上述我們不難看到,無論是傳統(tǒng)企業(yè)還是全球的科技大佬,在AI時代來臨之際,都在千方百計獲得用戶的數(shù)據(jù)或者信息(搜集和利用用戶的信息是充分發(fā)揮AI不可或缺的重要一環(huán),否則AI將成為無水之源,無本之木),更好地服務(wù)于用戶。
當(dāng)然,我們在此并非否認(rèn)數(shù)據(jù)安全和用戶數(shù)據(jù)隱私的重要,只是不能因噎廢食,即為了所謂安全和隱私而忽視,甚至放棄獲取數(shù)據(jù),而是如何在獲取數(shù)據(jù)的同時,利用協(xié)議、技術(shù)等手段告知和保證用戶的數(shù)據(jù)和隱私安全,盡量做到獲取和利用數(shù)據(jù)與安全的平衡。而提到平衡,我們不得不提及蘋果。
業(yè)內(nèi)知道,蘋果在AI 領(lǐng)域的研究進(jìn)程要晚于競爭對手,根本原因就是他們不想像谷歌和Facebook 那樣“侵犯”用戶的個人數(shù)據(jù)。為此,蘋果擁有大型的隱私保護(hù)項目。該項目使用了在學(xué)術(shù)領(lǐng)域被稱為差分隱私的概念,并且將這個概念用在了iPhone 上的AI 程序上。差分隱私的工作方式是在好數(shù)據(jù)中插入噪音或是壞數(shù)據(jù),一次來混淆那些試圖侵犯個人隱私的人。例如,為了讓蘋果的軟件將所有含有狗的照片放在同一個相冊里,它需要收集大量狗的圖片。蘋果會收集這些圖片,但是在收集之前,他們會對數(shù)據(jù)進(jìn)行加密,然而將這些數(shù)據(jù)和其他一些無關(guān)的數(shù)據(jù)放在一起,這樣一來,如果有人試圖恢復(fù)原始數(shù)據(jù),他們也無法得知哪些數(shù)據(jù)來自哪些用戶。這個技術(shù)被認(rèn)為是最好的隱私保護(hù)技術(shù),其防護(hù)程度要高于現(xiàn)有的其他數(shù)據(jù)保護(hù)方式。
對此,業(yè)內(nèi)分析認(rèn)為,蘋果在隱私保護(hù)方面的嘗試,盡管可能會拖慢他們的產(chǎn)品開發(fā)速度,但是這樣的犧牲卻能夠獲得用戶的信任。蘋果正在使用一些非常艱深的技術(shù)來保護(hù)用戶的隱私,這使得谷歌和Facebook 將會在未來某一天感到壓力,因為蘋果提供了能和他們的產(chǎn)品匹敵的產(chǎn)品,而且更安全。
與蘋果類似,榮耀在信息獲取層面,不僅嚴(yán)格遵循必須通過用戶授權(quán)的原則,即Magic Live系統(tǒng)以及APP在獲取或者使用用戶的個人數(shù)據(jù):日歷、短信、電話、通訊錄、提醒事項、照片和位置等之前,都必須要得到用戶的許可。其次,在數(shù)據(jù)處理層面,遵循信息本地化處理原則。就地分析,不上傳云端,也不對第三方開放。此外,在這兩個原則之上,其還設(shè)置了兩層防護(hù),即在榮耀Magic搭載的海思麒麟芯片內(nèi)部,設(shè)有TEE安全區(qū),用戶敏感數(shù)據(jù)基于芯片進(jìn)行加密。秘鑰的保存和加解密過程都是在芯片內(nèi)部完成的,Android側(cè)無法接觸到秘鑰和加解密過程。Magic Live還增加了防root及入侵檢測功能。一旦發(fā)現(xiàn)Android系統(tǒng)異常,例如異常獲取用戶數(shù)據(jù)的行為等,Magic Live會拒絕執(zhí)行用戶隱私數(shù)據(jù)的解密功能,確保安全。
綜上所述,我們認(rèn)為,此次《華爾街日報》報道的華為與騰訊因用戶數(shù)據(jù)之爭,從一個側(cè)面反映出數(shù)據(jù)搜集和利用對于AI和用戶的重要價值,同時也提醒業(yè)內(nèi),保護(hù)用戶數(shù)據(jù)和信息隱私的重要性,且不能因噎廢食,即過分強(qiáng)調(diào)一方,忽視,甚至放棄另一方,對于AI的發(fā)展及其給用戶帶來的價值都是弊大于利。