網(wǎng)站內(nèi)容是否為原創(chuàng)?百度是這樣判斷的 |
發(fā)布時間:2018-12-16 文章來源:本站 瀏覽次數(shù):3290 |
一篇文章被抓取后會和數(shù)據(jù)庫里面相關(guān)的主題-----再到相關(guān)的分類下,再細分最終和庫里存在的文章相比照沒有的話,就是原創(chuàng);蛘咧貜妥x不超越多少百分比;最直接的說就是說假如百度數(shù)據(jù)庫里沒有的它以為就是原創(chuàng)。 一、原創(chuàng)是有條件的,即百度收錄之后的比照。 比方一個小網(wǎng)站發(fā)布了一篇原創(chuàng)文章,被新浪等權(quán)重較高的網(wǎng)站直接復制粘貼,標題內(nèi)容一點點不改新浪等高權(quán)重網(wǎng)站收錄了而你的文章卻沒有收錄。這時,你說哪個網(wǎng)站是原創(chuàng)。 二、回到題目,百度是怎樣辨認文章是原創(chuàng)的? 百度抓取你的文章之后,會將你文章的每個關(guān)鍵詞生成一個相應的指紋與之前相似主題的文章關(guān)鍵詞指紋進行比照。當發(fā)現(xiàn)中心關(guān)鍵詞偏差比較大的時候,便會以為是原創(chuàng)。因而要注意在文章中布局自己的方針關(guān)鍵詞,相關(guān)關(guān)鍵詞在文章中也要多次呈現(xiàn)。(此段純屬本人臆斷) 三、原創(chuàng)的就必定好嗎? 百度沒有說你的文章必須要原創(chuàng),只需契合用戶體會的文章就是好文章。百度的字庫通過對一些常用詞的過濾后然后看主關(guān)鍵字呈現(xiàn)的頻率。應該在一點百分比比較合適就像關(guān)鍵字的百分比在百分之2-百分之8相同。當然必定還會有相關(guān)文章比照假如其相識度超越百分60估計示為做弊。另外原創(chuàng)是作用不錯,但是哪有這么多相關(guān)原創(chuàng)。 百度也沒有說原創(chuàng)的就是最好的。要不國內(nèi)最大的網(wǎng)站應該頒發(fā)給那些盜版小說網(wǎng)站(因為他們的小說收費都是手打出來的)這么多原創(chuàng)沒有理由不上第一。 周明個人覺得百度關(guān)于原創(chuàng)的辨認還需要完善的當?shù)剡有很多百度還有很長的一段路要走。 |
|