近日,今日頭條上線了自己的搜索服務 “頭條搜索”,網(wǎng)頁版目前已經(jīng)開始投入使用。一直以來,中國的互聯(lián)網(wǎng)搜索業(yè)務都是由一家名叫百度的公司把持著,在移動互聯(lián)網(wǎng)紅利已經(jīng)逐步走向萎縮的今天,“搜索”究竟是不是一門好生意,今日頭條現(xiàn)在入局搜索業(yè)務還能有怎樣的發(fā)展呢?
百度在搜索上的優(yōu)勢在哪?
互聯(lián)網(wǎng)上所有的網(wǎng)頁都存在無數(shù)個服務器,搜索引擎想要實現(xiàn)搜索就要將這些網(wǎng)頁存到自己的服務器上,這就要依靠“爬蟲(網(wǎng)頁蜘蛛)”來實現(xiàn): 這些爬蟲會一直向想被發(fā)現(xiàn)的網(wǎng)站發(fā)送請求,并將得到的網(wǎng)頁存在自己的服務器上。
接下來要對歸類好的文件建立索引,這就需要對爬好的網(wǎng)頁進行關鍵詞分析并建立索引列表。 用戶進行搜索時就可以通過索引列表來在服務器中搜索相關頁面,并通過不同的加權方式將搜索結果按照先后進行排序,最終呈現(xiàn)給用戶。
聽起來雖然簡單,但是實際上搜索引擎要面對數(shù)以億計的網(wǎng)頁時,每一次搜索都是一次對算力的考驗。大家如果對搜索引擎的工作原理感興趣可以查看Google 官方出品的“How Google Works”視頻。只需三分鐘就能讓你大概明白搜索引擎。
而百度和谷歌,差不多壟斷了當代互聯(lián)網(wǎng)有關搜索引擎的所有技術專利。
前段時間“李彥宏當院士”的事情鬧得沸沸揚揚,雖然最后因為群眾反對意見比較大草草收場,但也印證了李彥宏在專業(yè)領域出色的能力:作為中國互聯(lián)網(wǎng)領域少有的技術型 CEO,李彥宏曾經(jīng)在搜索引擎領域創(chuàng)建超精準搜索(ESP)技術和圖像搜索引擎技術。 而他所持有的“超鏈分析”技術專利,是現(xiàn)代搜索引擎領域的重要基礎發(fā)明之一,這項技術專利,在一定程度上奠定了整個現(xiàn)代搜索引擎的發(fā)展趨勢和方向。
而搜索作為百度最重要的業(yè)務,盡管這幾年百度確實是丟人,但從搜索技術這個角度來講,百度確實是中國最好的。不過百度的市場占有量已經(jīng)從巔峰時期的85%下降到了70%左右,而且還有進一步下降的趨勢。