搜索引擎到底會(huì)不會(huì)抓取圖片、js、fhash內(nèi)容?
來源:昆明多彩網(wǎng)絡(luò)公司 日期:2010-08-18 閱讀: 發(fā)表評(píng)論
網(wǎng)頁組成內(nèi)容無非就是文字,圖片,js,動(dòng)畫flash,視頻元素,早在幾年前,在搜索引擎發(fā)展初級(jí)階段的時(shí)候,搜索引擎的抓取內(nèi)容方式是及其原始和簡陋的,而且只能抓取網(wǎng)頁的title等頁頭部分。
當(dāng)時(shí)站長群也很少,而且做一個(gè)關(guān)鍵詞也非常容易,主要隨便修改一下網(wǎng)頁的標(biāo)題就可以達(dá)到很好的排名,隨著搜索引擎數(shù)據(jù)發(fā)掘技術(shù)的發(fā)展,搜索引擎慢慢會(huì)嘗試去抓取更多的東西,比如網(wǎng)頁的其他文字內(nèi)容,并且不再將網(wǎng)頁標(biāo)題作為唯一的排名標(biāo)準(zhǔn),并且加入了很多其他的算法來給一個(gè)網(wǎng)站在搜索引擎上綜合的排名。
目前來說,百度能夠很好的識(shí)別和把握中文內(nèi)容,不然也不會(huì)對(duì)外號(hào)稱自己是全球第一大中文搜索引擎,對(duì)圖片能夠有一定程度的識(shí)別,而對(duì)flash動(dòng)畫和視頻抓取技術(shù)還比不上google;谷歌雖然不主張站長使用動(dòng)畫來作為網(wǎng)站主要展示內(nèi)容的方式,但是經(jīng)過大家試驗(yàn),一些簡單的flash動(dòng)畫內(nèi)的問題google能夠很好的識(shí)別,并將該元素內(nèi)抓取的內(nèi)容作為網(wǎng)站綜合排名的依據(jù),而百度似乎還是停留在文字和圖片基礎(chǔ)上。
谷歌對(duì)于一些單色背景圖片能夠很好的識(shí)別,比如黑色背景上打上白色的字,谷歌的識(shí)別幾乎達(dá)到了100%。
發(fā)表評(píng)論評(píng)論列表(有 條評(píng)論)