近日,今日頭條上線了自己的搜索服務(wù) “頭條搜索”,網(wǎng)頁(yè)版目前已經(jīng)開(kāi)始投入使用。一直以來(lái),中國(guó)的互聯(lián)網(wǎng)搜索業(yè)務(wù)都是由一家名叫百度的公司把持著,在移動(dòng)互聯(lián)網(wǎng)紅利已經(jīng)逐步走向萎縮的今天,“搜索”究竟是不是一門(mén)好生意,今日頭條現(xiàn)在入局搜索業(yè)務(wù)還能有怎樣的發(fā)展呢?
百度在搜索上的優(yōu)勢(shì)在哪?
互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都存在無(wú)數(shù)個(gè)服務(wù)器,搜索引擎想要實(shí)現(xiàn)搜索就要將這些網(wǎng)頁(yè)存到自己的服務(wù)器上,這就要依靠“爬蟲(chóng)(網(wǎng)頁(yè)蜘蛛)”來(lái)實(shí)現(xiàn): 這些爬蟲(chóng)會(huì)一直向想被發(fā)現(xiàn)的網(wǎng)站發(fā)送請(qǐng)求,并將得到的網(wǎng)頁(yè)存在自己的服務(wù)器上。
接下來(lái)要對(duì)歸類好的文件建立索引,這就需要對(duì)爬好的網(wǎng)頁(yè)進(jìn)行關(guān)鍵詞分析并建立索引列表。 用戶進(jìn)行搜索時(shí)就可以通過(guò)索引列表來(lái)在服務(wù)器中搜索相關(guān)頁(yè)面,并通過(guò)不同的加權(quán)方式將搜索結(jié)果按照先后進(jìn)行排序,最終呈現(xiàn)給用戶。
聽(tīng)起來(lái)雖然簡(jiǎn)單,但是實(shí)際上搜索引擎要面對(duì)數(shù)以億計(jì)的網(wǎng)頁(yè)時(shí),每一次搜索都是一次對(duì)算力的考驗(yàn)。大家如果對(duì)搜索引擎的工作原理感興趣可以查看Google 官方出品的“How Google Works”視頻。只需三分鐘就能讓你大概明白搜索引擎。
而百度和谷歌,差不多壟斷了當(dāng)代互聯(lián)網(wǎng)有關(guān)搜索引擎的所有技術(shù)專利。
前段時(shí)間“李彥宏當(dāng)院士”的事情鬧得沸沸揚(yáng)揚(yáng),雖然最后因?yàn)槿罕姺磳?duì)意見(jiàn)比較大草草收?qǐng)?,但也印證了李彥宏在專業(yè)領(lǐng)域出色的能力:作為中國(guó)互聯(lián)網(wǎng)領(lǐng)域少有的技術(shù)型 CEO,李彥宏曾經(jīng)在搜索引擎領(lǐng)域創(chuàng)建超精準(zhǔn)搜索(ESP)技術(shù)和圖像搜索引擎技術(shù)。 而他所持有的“超鏈分析”技術(shù)專利,是現(xiàn)代搜索引擎領(lǐng)域的重要基礎(chǔ)發(fā)明之一,這項(xiàng)技術(shù)專利,在一定程度上奠定了整個(gè)現(xiàn)代搜索引擎的發(fā)展趨勢(shì)和方向。
而搜索作為百度最重要的業(yè)務(wù),盡管這幾年百度確實(shí)是丟人,但從搜索技術(shù)這個(gè)角度來(lái)講,百度確實(shí)是中國(guó)最好的。不過(guò)百度的市場(chǎng)占有量已經(jīng)從巔峰時(shí)期的85%下降到了70%左右,而且還有進(jìn)一步下降的趨勢(shì)。