Google Now, Siri…人工助理的預測是如何實現的?

完成一個預測需要多少數據?
人工助理越來越具有“侵略性”,即她/他會在你做事之前作出預測,當然這樣的侵略性也更有“助理”的價值。比如,Google會在我即將奔赴機場時提醒我航班信息,在這個案例中,Google需要知道以下幾個數據:
我預訂了航班以及航班信息;
我要去哪個機場,至少北京上海都有兩個機場;
我現在的位置;
Siri、Cortana同樣需要這些數據,所不同的是,Google默認用戶同意抓取并整合這些零散數據,從而形成一份提醒。而Siri和Cortana則更多局限在用戶行為習慣的收集方面,以iOS 9中的Siri升級版智能預測為例,她通過分析你在iOS設備中的操作習慣,從而為你預測出下一個可能聯系的人以及可能使用的App,如下圖:
相比于iOS的設備鎖定,Google Now野心更大,它基于云端,可跨平臺使用,用戶只需一個Google賬號,在下載Google應用后,就能通過各個平臺釋放Google Now的神奇魔法,下面讓我們看看實現魔法的要素。
郵件
人工助理應用最需要郵件里的數據,Google最在行。過去十年間,Gmail日漸成長為世界上最受歡迎的郵件服務之一,但幾乎沒有人知道Google其實一直在默默地掃描你的郵件內容,在 Google后臺的數據庫中,它已經默默地為你的每一封郵件打了標簽,比如一封封航班信息郵件放在一起,而信用卡消費信息則放在其它地方。如果你對這個還沒有概念,不妨去試試Google推出的Inbox。
Siri也會使用郵件內容。舉個例子,當你在iOS系統郵件里接受了一個會議邀請,自帶的日歷會自動建立一個日程,同時生成一系列前往會場的交通信息。而如果你收到一個電話,恰好這個電話也是你某封郵件內容里某個人留下的電話,那么Siri會自動識別這個人。
另一方面,由于Gmail的廣泛使用,很多使用 iOS設備的人,比如我,也在iOS設備上設置了gmail郵箱,這也將同時“喂養”Siri和Google now,好吧,我一下子養了兩個助理。
搜索
如今,用戶的每一項搜索都會被記錄下來,隨著記錄的增多,當你下一次搜索時,搜索引擎則為你準備了你可能感興趣的話題……這從某個角度說明人類其實很不善變。
Google 與Cortana基本一個套路,前者借助無處不在的Google搜索欄,而后者則利用bing搜索,從而積累了大量用戶行為數據。
蘋果的Siri并不擅長整合搜索,長期以來,iOS上的Siri與spotlight毫無關系,很多人并不知道其實spotlight是個搜索工具,而在最新的iOS 9中,蘋果正在將其整合,這也是上文所看到的那個場景。
瀏覽
Google和微軟很擅長做這個。Chrome、IE瀏覽器的瀏覽記錄都會成為Google Now和Cortana預測的重要依據,與搜索記錄相比,瀏覽記錄對于用戶習慣的計算和建模更具參考價值。
但蘋果的Siri做不到這一點。對Siri來說,Safari里瀏覽記錄根本無法獲取,如果你真的在意自己的隱私,那么千萬別在Safari上使用Google賬號登陸。
日歷
人類助理需要日歷,人工助理也需要日歷。Google會時刻“監控”你日歷(當然也是Google 日歷)的變化,任何一件事都會成為Google Now預測數據。
Cortana也做一樣的事情,它在Windows系統中隨時檢測日歷變化,不過到了Android系統,則無法讀取日歷數據,考慮到Windows手機的普及率,咳咳…
Siri對于日歷數據也非常重要。它能讀取iOS系統日歷的事件,哪怕這個日歷是來自Google日歷的同步數據。
位置
在我看來,日歷構成了人工助理最重要的數據來源。當我前往上海出差,入住外灘某個酒店后,Google Now推送來一條離酒店不遠的幾個景點以及咖啡館。另一個日常的場景,當我告訴Google Now我的家庭位置和工作場所后,它每天早上8點告訴我上班的路線規劃,而到了下午5點后,下班的路線規劃自動推送過來。
這一切的一切都可以這樣解釋:Google Now知道我的位置,嗯,任何時間的位置。
如果說Cortna與Google Now類似,那么Siri怎么做呢?Siri的做法有點獨特,Siri會收集你在多個地方的位置數據,從而自動判斷并預測一些事情。比如,我就發現,Siri會經常告訴我上班路上的交通信息,然而我從來沒告訴她我的家庭位置和工作場所,這部分的位置數據是Siri自動計算并推斷出來的。
最后不妨做個小結,Google Now是目前最成熟的人工助理,她聰明文靜,默默注視你的一切,當你卸下最后的隱私防備時,Google Now的預測更準確。Cortana也類似,只是她的用戶群體還很小,相對來說,預測準確性也不高。而Siri,她似乎有意和你保持距離,時而給你帶來驚喜,時而又犯傻……
評論