【成創網絡】
公司固話:024-24851400
聯系手機:15041255464
本網站由WWW.LDWU.COM提供搜索引擎優化服務
復制網頁(或者叫重復內容網頁)指的是兩個或多個網頁內容相同,或非常相似。
一般來說,搜索引擎不喜歡復制內容網頁,他們會盡量判斷哪一個是原始版本,然后把其他的復制網頁忽略不計。
有兩點值得注意:
1)復制網頁的判斷并沒有一個比例。比如說一個網頁上有60%或80%的內容和其他網頁相同,就被列為復制網頁,如果真有一個比例那就簡單多了。
2)復制網頁并不會帶來懲罰。搜索引擎會丟掉其他的復制網頁,但不會懲罰搜索引擎認為的原始出處。
不過這就有可能對真正原始出處產生懲罰。比如搜索引擎判斷錯誤,把原始出處當成復制的,而把復制的當成原始出處。
復制內容網頁的出現一般有這些可能性:
1)網址規范化問題所產生的。
2)代理商和零售商的網站經常從產品生產商的網站上抄下產品信息。這倒沒什么不對,一般產品生產商也都同意,但是絕大部分代理商,零售商,批發商都會直接copy,而不做改動。所以這些電子商務網站上充斥著大量復制內容網頁。
3)打印版本。很多網站提供更適于打印的版本,如果沒有用robots.txt文件,那么這些打印版本網頁就可能會變成復制網頁。
4)網頁內容由RSS生成。有很多網站,尤其是新聞類網站,都是用其他網站的RSS feed來生成網站內容的,這些內容在原始出處和很多其他網站上都已經出現了。
5)電子商務網站使用Session ID。搜索引擎蜘蛛在不同時間訪問網頁的時候,被給了不同的Session ID,但實際上網頁內容是一樣的。不過由于Session ID的參數不同,就被當成了不同的網頁。
6)網頁實質內容太少。每個網頁上都不可避免的有通用的部分,比如導航條,版權聲明等等。如果網頁的正文部分太少,數量還抵不上這些通用部分,就有可能被認為是復制內容網頁。
7)文章抄襲轉載等。有的時候是其他人抄襲了你的網站內容,有的時候是善意的轉載,有的時候是作者自愿的向不同的網站發送文章,這些都有可能造成復制內容網頁。
8)鏡象網站。鏡象網站曾經很流行,當一個網站太忙太慢的時候,用戶可以通過替代鏡象來看內容或下載,這也有造成復制內容網頁的風險。
9)產品或服務類型之間區別比較小。比如有的網站把自己的產品或服務按地區進行分類,但實際上提供給每個地區的產品或服務都是一樣的。在這些按地區分類的網頁上,只是把地名改了改,其他內容全都一樣。