個人電腦及互聯(lián)網(wǎng)是更為普及的算法承載體
相比商用的超級電腦、內(nèi)置芯片設(shè)備,個人電腦及互聯(lián)網(wǎng)是更為普及的算法承載體。早期門戶網(wǎng)站時代,信息是由網(wǎng)絡(luò)編輯整理提供,用戶看到的那些新聞都是網(wǎng)編基于對用戶口味和新聞專業(yè)判斷選擇出來的。而門戶之后以Google為代表的搜索則顛覆了這個信息提供模式。搜索是用戶輸入關(guān)鍵字來主動獲取信息,在搜索框背后則凝聚了大量的程序和算法。
Google搜索引擎的爬蟲機器人,實際上是一種搜集互聯(lián)網(wǎng)海量信息的程序,爬蟲到各種網(wǎng)站網(wǎng)頁上將信息收集回來進(jìn)行編碼處理,根據(jù)算法將網(wǎng)頁標(biāo)上PageRank等級,分?jǐn)?shù)值高的網(wǎng)頁將會在關(guān)鍵字搜索結(jié)果中顯示在優(yōu)先的位置上。目前有250億的網(wǎng)頁可以被檢索,可以想象,這將是一個多么龐大的信息網(wǎng),利用搜索引擎,我們已經(jīng)能在短時間內(nèi)找到結(jié)果,是不是需要的答案則另外考慮。評價一個網(wǎng)頁的好壞,不憑人的主觀印象,而是將其數(shù)學(xué)化。算法正在以它特有的形式拆解和重組我們生活的世界。
當(dāng)然,如何在這250億的網(wǎng)頁中挑選出最應(yīng)該推薦給你的,依然是一個難題。如果你會抱怨搜索引擎給出的答案還是太過冗雜、不夠準(zhǔn)確,那有理由相信未來會產(chǎn)生更精準(zhǔn)的算法。在未來,一個25歲、此前搜索過如何減肥的女性,與一個45歲、數(shù)天之內(nèi)在谷歌地圖中搜索過不同城市機場到酒店路線的男性,搜索“午餐吃什么”得到的結(jié)果會是不同的。
在社交網(wǎng)站中,通過記錄、挖掘大量用戶的數(shù)據(jù),這樣精準(zhǔn)的推薦將更容易實現(xiàn)。在個性化推薦引擎的算法上,一部分是基于用戶個人行為數(shù)據(jù)積累挖掘來向用戶推薦,另一部分是基于一群用戶的共同行為來向用戶推薦。也許你沒有注意到,個性化推薦引擎已經(jīng)運用到很多互聯(lián)網(wǎng)網(wǎng)站中,比如視頻推薦、網(wǎng)絡(luò)電臺對音樂的推薦、購物推薦直到好友推薦等。
在亞馬遜或者淘寶上,當(dāng)你購買了某一商品,系統(tǒng)會根據(jù)相關(guān)性算法,向你推薦與該商品相關(guān)的其他商品。比如你曾經(jīng)購買了很多本村上春樹的作品,基于用戶個人數(shù)據(jù)的算法會為你推薦村上春樹其他的作品,而基于其他用戶購買行為的社會化推薦則向你推薦村上龍的作品,也許是因為和你有同樣喜好購買了前者作品的用戶特別多,系統(tǒng)才會推測你喜歡后者的概率比較高,將其顯示出來。
從機器到芯片到程序中的算法,人工智能正在從各個方面滲透到我們的生活中,過去你也許沒有發(fā)現(xiàn),但將來它們會以更加人性化的面貌出現(xiàn),即使你面對它也不一定能認(rèn)出它。而商業(yè)也將隨之而改變。