了解信噪比:區(qū)別有用和攪擾信息 |
發(fā)布時(shí)間:2020-01-19 文章來(lái)源:本站 瀏覽次數(shù):2840 |
關(guān)于信噪比的界說(shuō),網(wǎng)上廣泛流傳的界說(shuō)是:指網(wǎng)頁(yè)中的文本內(nèi)容部分與生成這些文本而發(fā)生的html標(biāo)簽內(nèi)容的比率;小鵬以為應(yīng)該更廣義的了解是:網(wǎng)頁(yè)中的文本以及各種因素(包含圖片,flssh,css等鏈接 )和網(wǎng)頁(yè)html標(biāo)簽內(nèi)容的比率. 那么針對(duì)上面這兩種界說(shuō),我仍是以為非常的不恰當(dāng),沒有抓住本質(zhì)的東西.不管是聲學(xué)方面關(guān)于信噪比的界說(shuō)仍是數(shù)據(jù)通信范疇里的信噪比,在界說(shuō)概念的時(shí)候,都強(qiáng)調(diào)了有用信息跟攪擾信息之間的比較.比方數(shù)據(jù)通信范疇關(guān)于信噪比(S/N)的界說(shuō)便是信息與噪聲之比。那么類比到查找引擎檢索范疇,網(wǎng)頁(yè)內(nèi)容信噪比的界說(shuō)應(yīng)該依然是網(wǎng)頁(yè)有用信息跟攪擾信息之比。 以有用信息跟攪擾信息之比這種界說(shuō)來(lái)看,之前說(shuō)到的兩種界說(shuō),都以為網(wǎng)頁(yè)中的文本(或加上其他因素如包含圖片,flssh,css等)成了有用信息,而發(fā)生的html標(biāo)簽內(nèi)容減去這些有用信息的為廢物信息。這顯然太過(guò)于牽強(qiáng)。難道查找引擎能辨認(rèn)的文本信息就一定是有用信息???而之外的其他信息便是攪擾信息? 所以了解信噪比的要害就在于什么是有用信息,什么是攪擾信息。 而關(guān)于這一點(diǎn),我了解的是:查找引擎關(guān)于其所抓取的內(nèi)容會(huì)有一個(gè)基本的判別,判別該頁(yè)面內(nèi)容對(duì)應(yīng)的主題及所有或許的要害詞并將其進(jìn)行排序。是否為有用信息和無(wú)用信息,關(guān)于查找引擎來(lái)說(shuō),是針對(duì)詳細(xì)要害詞而言的。所以網(wǎng)頁(yè)的信噪比跟詳細(xì)某一要害詞的信噪比應(yīng)該有所區(qū)別。詳細(xì)要害字的信噪比是網(wǎng)頁(yè)中對(duì)該要害字檢索有利的信息和攪擾信息之比。而網(wǎng)頁(yè)的信噪比為該頁(yè)面中心要害字的信噪比。 網(wǎng)頁(yè)中假如存在查找引擎以為與某一查找詞沒有任何相關(guān)性的內(nèi)容(即查找引擎無(wú)法判別該段內(nèi)容與查找要害詞之間的聯(lián)系),那么這些內(nèi)容既為該要害詞的攪擾信息。這些攪擾信息或許包含flash,圖片,及與要害詞沒有相關(guān)、卻十分冗長(zhǎng)的階段文本等。同理,網(wǎng)頁(yè)的攪擾信息即為網(wǎng)頁(yè)中心要害詞的攪擾信息。 關(guān)于flash,圖片,js等查找引擎不能辨認(rèn)的東西來(lái)說(shuō),關(guān)于任何要害詞都被列入了攪擾信息。而且,關(guān)于文字內(nèi)容比較多的站點(diǎn)來(lái)說(shuō),信噪比跟要害詞密度的概念比較挨近。至于詳細(xì)的html的代碼句子符號(hào),我覺得關(guān)于查找引擎來(lái)說(shuō),其關(guān)于網(wǎng)站排名的影響,更多是影響了網(wǎng)站代碼的合理和正確性,影響了網(wǎng)站的拜訪速度。而不是被查找引擎列為攪擾信息,影響排名的。所以,我也能夠預(yù)言,假如多余的代碼不是太過(guò)分,導(dǎo)致網(wǎng)頁(yè)出錯(cuò)或不符合某些規(guī)范或使得網(wǎng)頁(yè)文件太大。對(duì)排名的影響幾乎是能夠不考慮的。一般情況下,查找引擎都直接忽略了這些代碼符號(hào)句子,也從來(lái)沒有在哪個(gè)查找引擎的查找成果中看到html里邊的那些句子界說(shuō)符號(hào)出現(xiàn)過(guò)。 上面所討論的信噪比概念,體現(xiàn)在詳細(xì)查找引擎優(yōu)化操作中,便是需重視網(wǎng)頁(yè)中心要害詞的信噪比,而不或許考慮所有或許要害詞的信噪比。關(guān)于一個(gè)比較合理的站點(diǎn)來(lái)說(shuō),查找引擎能夠經(jīng)過(guò)網(wǎng)站的Title,Meta等去辨認(rèn)網(wǎng)頁(yè)的中心主題,那么網(wǎng)頁(yè)的階段中出現(xiàn)與Title和Meta相呼應(yīng)的內(nèi)容就非常重要,這些內(nèi)容或許會(huì)列為有用信息,那么其他的一些信息,雖然也是文本,但假如冗長(zhǎng)而與標(biāo)題Meta不相關(guān),就應(yīng)該果斷放棄,或使其相關(guān)。不然則直接增加了網(wǎng)站中心要害詞的信噪比。 還有一個(gè)需要注意的是,規(guī)劃網(wǎng)頁(yè)需要考慮怎么讓查找引擎辨認(rèn)中心要害詞和主題。假如查找引擎連主題都很難了解,那么談網(wǎng)頁(yè)信噪比也沒有含義。詳細(xì)怎么讓查找引擎辨認(rèn)中心要害詞和主題,則是另一個(gè)話題,擇日再論。 當(dāng)然本文的想法嘗未經(jīng)實(shí)踐證明,提出來(lái)引導(dǎo)大家思考罷了。 |
|