網(wǎng)站建設中怎么避免被搜索引擎誤會“抄襲網(wǎng)頁” | ||||
發(fā)布者:admin | 添加時間:2017/10/14 | 瀏覽次數(shù):2933 | ||
“抄襲網(wǎng)頁”是被搜索引擎極其反感的搜索引擎作弊手段之一。百度和google均對復制網(wǎng)頁的做法有明確的說明: 百度:如果你的站點上的網(wǎng)頁,大量都是復制自互聯(lián)網(wǎng)上的高度重復性的內(nèi)容,那么,你的站點也有可能被百度丟棄。 Google:請不要創(chuàng)建包含大量重復內(nèi)容的多個網(wǎng)頁、子域或域……不要采用如聯(lián)屬計劃 (affliate programs) 這類原創(chuàng)內(nèi)容很少或幾乎沒有原創(chuàng)內(nèi)容的"餅干模子 (cookie cutter)"方式。 那么,除了部分作弊者為了欺騙搜索引擎而故意復制網(wǎng)頁的情況之外,還有哪些情況是網(wǎng)站在無知的情況下被搜索引擎認定為復制網(wǎng)頁? 紐約舉行的搜索引擎戰(zhàn)略大會SES上,很多與會者就復制網(wǎng)頁的問題進行了討論。以下是各位搜索引擎專家的見解: Anne Kennedy:復制網(wǎng)頁的情況包括不同URL下?lián)碛型瑯拥木W(wǎng)站內(nèi)容,或同一首頁下有同樣的內(nèi)容,如index.htm, index.html等后綴下都是同樣的內(nèi)容。 Shari Thurow:搜索引擎對于復制網(wǎng)頁的識別和判斷也做了大量努力,如搜索引擎在比較兩個網(wǎng)頁時會排除一些干擾因素如導航區(qū)域,headers等,直接分析正文內(nèi)容部分,其次搜索引擎還會通過分析網(wǎng)頁內(nèi)部和外部鏈接以判斷是否每個站點的鏈接都不同。 Jake Baillie:很多網(wǎng)站為了方便用戶對每篇文章都有一個“打印友好頁”的相同內(nèi)容頁面,還有很多產(chǎn)品介紹頁面只有產(chǎn)品圖片沒有文字介紹的內(nèi)容,都有可能被搜索引擎視為復制網(wǎng)頁。 解決復制網(wǎng)頁的辦法除了簡單地不要復制相同內(nèi)容,還可以在不得已需要復制的網(wǎng)頁上通過robots.txt文件讓搜索引擎不要索引該頁面,或使用301重定向?qū)椭频木W(wǎng)頁轉(zhuǎn)化成“真實”的網(wǎng)頁。 在這次搜索引擎戰(zhàn)略大會上,兩大搜索引擎的代表也就復制網(wǎng)頁問題發(fā)表了他們的看法。 Yahoo的代表Rajat Mukherjee說yahoo不會輕易對復制網(wǎng)頁降級,而是盡力判斷誰是原始內(nèi)容的網(wǎng)頁。Google代表Matt Cutts說,誠實的網(wǎng)站管理員常常擔心他們是否不小心觸犯了復制網(wǎng)頁的禁忌,但他們大可不必擔心。Google也是盡力發(fā)現(xiàn)復制網(wǎng)頁中最原始的那個版本。Google不會對網(wǎng)頁的“打印友好”版進行懲罰,同時他還說也不必擔心同一頂級域名下不同后綴的網(wǎng)站擁有同樣內(nèi)容,如123.com或123.net。 盡管yahoo和google都表示他們能夠?qū)υ季W(wǎng)頁和復制頁面進行明確判斷,但專家們認為現(xiàn)實情況是如果某個內(nèi)容率先出現(xiàn)在一個普通網(wǎng)站上,隨后被“權(quán)威網(wǎng)站”所轉(zhuǎn)載,Google往往認定權(quán)威網(wǎng)站的內(nèi)容是原始內(nèi)容站,而真正的原始站點被認為復制網(wǎng)頁。不過Google通常情況下不會懲罰復制網(wǎng)頁,除非這個網(wǎng)站太過極端,比如做了N多的鏡像網(wǎng)站。 |