您的位置:首頁>>網絡講堂>

百度蜘蛛如何判斷原創文章

日期:2010/1/16 &光雨nbsp;   閱讀:10513     發(fā)布者日畫:撇捺電子商務有限公司
 原創文章在百度排名中要比爲原創和網摘的效果好(h那化ǎo)很多,對(duì)于網站整體權呢玩重的提升也有很大的幫助,而什麼(me)是原創性的文章,就作師(jiù)要求我們的seo對(duì)這(請鐘zhè)個有一個清楚的認識,正确了解百度蜘蛛如何辨别原創作妹内容就(jiù)可以更好(hǎo)的加以利用,以最少的工作物資量達到我們想要的效果。 

 一、首先要明确一個概念:原創 僞原創

  原創:簡單地理解就(jiù)是第一次在網絡上發(fā)表的内容,現影以前沒(méi)有出現過(guò)的内容。

  僞原創:就(jiù)是從網站找來資料進(jìn)行二次加工,二次修改之光聽後(hòu)的内容,如修改标題,修改内容,增加些文字或者減少樹拍一些文字等。

  那麼(me)搜索引擎對(duì)于原創的判斷是如何進(j校去ìn)行的呢?

  一般來講有以下幾個方面(miàn)的因素決就問定:

  1、快照日期。

  2、蜘蛛抓取日期。

  3、頁面(miàn)外鏈的多少。

  4、文章修改的程度。

  二、舉個例子如果你在www.yuanwa.com這(zhè)個網站上好快發(fā)布了一片文章内容。搜索引擎來到這(zhè)個網站并還裡且抓取到了這(zhè)篇文章,放到數據庫,并且在收錄數據庫中沒(méi)有聽票發(fā)現類似内容,那麼(me)就(j那城iù)會(huì)被(bèi)認爲是原創。

  在這(zhè)點上有個細節需要注意:

  1:文章必須被(bèi)收錄,如果沒(méi)有被(bèi)收為化錄,肯定是在搜索數據庫中石找不到的,搜索引擎根本就(jiù)找不到這(zhè)大間篇文章,更談不上什麼(me)原創了。

  2:文章被(bèi)轉載

  如果剛發(fā)表的一篇文章被(bèi)其它轉載了,那麼(me)多友誰是原創呢?那要看誰更先被(bèi)搜索引擎抓取到雪城,也就(jiù)是更新周期的問題了。如果a站發(fā)表,b站轉載,如果先抓取湖做到a站,那麼(me)歸a,如果先抓取b站,那麼(me)原創得員就(jiù)歸b站了,所以不是說(shuō下鐵)你先發(fā)表了,原創就(jiù美照)是你的,這(zhè)個得看搜索引擎什麼(me)時學訊(shí)間收錄了你的内容。

  3、訪問時(shí)間

  如果蜘蛛先訪問了B站呢?

  1、當然權重給B站,一般的情況下都吧道(dōu)會(huì)這(zhè)樣(yàng)!

  2、如果B站轉載的文章帶了A站的原文章頁面(miàn)鄉黑鏈接呢?

  3、這(zhè)就(jiù)很明白了相廠,剛收錄的時(shí)候,如果排名,兩(liǎng)條結果一起(qǐ們睡)出現,有可能(néng)還(hái)是B站的排名北她好(hǎo)一點。

  當然,文章轉載次數多了以後(hòu)從著,A站的鏈接越多,對(duì)A站的文章越有醫門好(hǎo)處,排名會(huì)慢慢變成(chéng)A站在前面(miàn)。裡女

  如果另外轉載的文章帶的是B站頁面(miàn)的鏈接呢?

  它們如果判斷不好(hǎo),就(jiù好民)變成(chéng)了一個鏈接流行度的比賽了。

  不過(guò),如果都(dōu)劇我有很多外部鏈接,并且相差不大,那麼(m紙吧e)判斷的規則應該回到原點,誰先被(哥讀bèi)收錄誰就(jiù)是原創。

  4、快照日期

  快照日期顯示時(shí)間玩秒最早的,一般就(jiù)是原創了吧!

  不一定,這(zhè)個說(shuō)姐女法要在一個更新周期之内,比如說(shuō)文章發(fā)表後(hòu)一頻相周内,快照時(shí)間越早的地址將(jiāng)越有被(bèi)認請到可爲原創的可能(néng)。

  但如果文章都(dōu)發(fā)表了幾個月了資子,說(shuō)不定搜索引擎已經(jīng)重新獲取過(guò)快地爸照了,快照的日期就(jiù)變了!

  還(hái)有其它的可能(néng)嗎?

  有,一般比如百度收錄,他可能(néng)會(huì)有靜得一個收錄的數據庫,經(jīng)過西窗(guò)過(guò)濾後(hòu),收錄的來區内容才會(huì)到搜索結果裡(l如人ǐ)來。在這(zhè)個期間就(j文女iù)有一些問題了,比如A站首次發(fā)表,B站轉載。蜘蛛先訪問A站再訪問我笑B站。而後(hòu)可能(néng)先把B站的結果放出來了,而A站還得章(hái)在數據庫裡(lǐ)。

  所以說(shuō)搜索引擎沒(méi)有收小視錄并不表示搜索引擎蜘蛛沒(méi)有訪問過(g間不uò)這(zhè)些内容,也許在搜制草索引擎的庫存裡(lǐ)已經(jīng)有記錄了,隻是你查的時(請術shí)間沒(méi)有放出來而已,就(jiù)像25号才放出來低河的内容,但是快照是20号的,這(zh請妹è)就(jiù)是搜索引擎的庫存内容,同時(shí)這(對個zhè)也是檢驗原創的核心時(shí)間點。

  這(zhè)種(zhǒng腦還)情況一般出現在新站與老站之間,A理站站發(fā)表,B站轉載,但A站在搜索引擎的信任度并不機校高的時(shí)候。不過(guò)隻要是A站先被(bèi)開人訪問到的,原創權還(hái)是A站的,這(z機黑hè)是最難分出來的情況,因爲我們不知道(dào)蜘蛛先訪問哪個站,除非你文市知道(dào)兩(liǎng)個站的網站空間日志内容,少銀能(néng)看到搜索引擎對(duì)兩(liǎng)個頁面(mi白還àn)的訪問時(shí)間。

  5、僞原創

  僞原創也會(huì)被(bèi)認爲銀關是原創?

  大多時(shí)候是這(zhè)樣(yàn物上g)的,搜索引擎蜘蛛不能(néng)明确分别這(zhè)些東西信電,因爲它的思維太程式化了。如果你的标題改過(guò),文章輛商的段落改過(guò),那麼(m慢玩e)蜘蛛將(jiāng)很難确定這(zhè)篇文章是懂花否有過(guò)收錄,也許它可以确定有部分樂紙内容是重複的,但它也不能(néng)因爲這(zh妹外è)些而將(jiāng)這(zhè)篇樹如文章确認爲是轉載!當然,随著(zhe)搜索引擎程式設計的提通拿高,應該會(huì)有一個相似度的東西出來,比如文字内容相似度超過(guò)百路爸分之幾就(jiù)會(huì)被(bèi)認爲是轉載。

網站制作

0635-8899346 / 18106357068動懂

我要建設網站
更多>>成(chéng)功案例