大部分人的SEO理念中,或多或少SEO從業(yè)者都會(huì)遇到一些在優(yōu)化中很糾結(jié)的問(wèn)題,而這些糾結(jié)的問(wèn)題中,‘收錄’是很多SEO從業(yè)者比較頻繁遇見(jiàn)的的。我今天不講外鏈和內(nèi)鏈,只講收錄與排名,下面會(huì)使用案例給大家展示案例效果,如圖所示:
SEO干貨,快速排名靠前你不得不看!
SEO干貨,快速排名靠前你不得不看!
該站上線是2016年11月中旬,文章截稿的時(shí)間大約一周左右,從整體站點(diǎn)頁(yè)面的收錄速度以及排名中可以看得出,蜘蛛的抓取頻率是非常給力的。揭秘內(nèi)頁(yè)實(shí)戰(zhàn)快速收錄并且做到頁(yè)面參與排名的方法之前,必須要告訴大家兩個(gè)點(diǎn):
第一、該站點(diǎn)所有文章均為抄襲,任意一篇文章的內(nèi)容百度上都出現(xiàn)了多次,這打破了傳統(tǒng)原創(chuàng)思維理念。
第二、這僅僅是一個(gè)剛上線的新站,并且沒(méi)有使用任何所謂的蜘蛛池去吸引蜘蛛。
有很多朋友會(huì)問(wèn)了:新站是如何做到快速收錄,并且可以建立部分頁(yè)面參與排名的?這個(gè)話題是本文的研究核心,如果大家也遇到了收錄問(wèn)題,那么至少有一點(diǎn)你沒(méi)有做好:你一直在所謂的外鏈、內(nèi)鏈、布局、原創(chuàng)內(nèi)容而忘記了核心點(diǎn)---搜索引擎排名原理。
首先要想做好頁(yè)面收錄并且參與排名,我們要先思考下搜索引擎工作原理,別小看這種最最基礎(chǔ)的東西,你領(lǐng)悟了核心要點(diǎn),那么操作收錄起來(lái)就會(huì)變得游刃有余,如下圖所示:
SEO干貨,快速排名靠前你不得不看!
百度百科中我們能看出,整個(gè)原理是從最初的爬行抓取--收錄--建立索引--搜索詞處理--排序,雖然就幾個(gè)步驟,但是每個(gè)步驟都有他的核心要點(diǎn)。下面我將把整個(gè)核心要點(diǎn)給大家一一剖析。
一、爬行和抓取
首先我們要知道到搜索引擎蜘蛛要想爬行和抓取一個(gè)頁(yè)面,你就必須要滿足兩個(gè)特點(diǎn):第一、足夠的外鏈;第二、網(wǎng)站更新頻率。在百度站長(zhǎng)平臺(tái)里面每個(gè)站點(diǎn)都會(huì)有一個(gè)抓取頻次,而抓取頻次我們可以特定的看作站點(diǎn)受蜘蛛的喜愛(ài)程度,也可以通俗的理解站點(diǎn)抓取頻次越高,那么你站點(diǎn)被蜘蛛喜愛(ài)程度就會(huì)越高,從而你的收錄就會(huì)加快。如果使用蜘蛛池這類(lèi)程序的同學(xué),我想就應(yīng)該非常清楚,但是很多朋友即使使用了蜘蛛池那也只是外部鏈接進(jìn)行吸引蜘蛛,如果配上站點(diǎn)更新頻率,效果更佳!
二、收錄和索引
通腸大家會(huì)認(rèn)為頁(yè)面收錄與頁(yè)面建立索引無(wú)太大區(qū)別,其實(shí)不是,在整個(gè)站點(diǎn)頁(yè)面文檔中會(huì)有兩種情況:
1、URL收錄---是,索引---否;代表已經(jīng)進(jìn)入了索引,只是這個(gè)網(wǎng)頁(yè)的“權(quán)重”非常非常低,可以視作是“無(wú)效索引”。
2、URL收錄---是,索引---是;代表已經(jīng)有資格參與排名,但是不保證100%能獲取排名,可以視作是“有效索引”。
我們可以簡(jiǎn)單的去理解site出來(lái)的站點(diǎn)頁(yè)面是被收錄的,但不代表site出來(lái)的頁(yè)面是被索引的。但是我們依然可以去檢測(cè)出頁(yè)面是否具備參與排名的資格,如下圖所示:
SEO干貨,快速排名靠前你不得不看!
Domain與Site最大的區(qū)別在于,Site可以統(tǒng)計(jì)頁(yè)面收錄,而Domain我們可以分析出站點(diǎn)外鏈域,而這里我們并不是去討論外鏈域,而是僅僅使用Domain命令來(lái)檢測(cè)站點(diǎn)能夠參與排名的有效數(shù)值。
不過(guò)大家可以用一種非常簡(jiǎn)單的方法去快速檢測(cè)你的頁(yè)面是否有參與排名的資格,如下圖所示:
SEO干貨,快速排名靠前你不得不看!
SEO干貨,快速排名靠前你不得不看!
SEO干貨,快速排名靠前你不得不看!
上面圖中我們可以把site出來(lái)的收錄頁(yè)面進(jìn)行搜索查詢,可以檢測(cè)到頁(yè)面是否被收錄,但是當(dāng)你搜索整個(gè)標(biāo)題卻沒(méi)有排名,也就是前面我提到過(guò)的url收錄---是 但是url索引---否,說(shuō)明網(wǎng)頁(yè)“權(quán)重”較低,并沒(méi)有參與排名,那么我們?cè)賮?lái)看幾張圖,如下圖所示:
SEO干貨,快速排名靠前你不得不看!
SEO干貨,快速排名靠前你不得不看!
SEO干貨,快速排名靠前你不得不看!
從上圖我們可以看得出,該頁(yè)面不僅被收錄還建立了索引,并且搜索整個(gè)標(biāo)題可以檢索到排名。從這點(diǎn)我們可以看出,索引的頁(yè)面無(wú)需做任何外鏈、內(nèi)鏈、甚至是抄襲的文章即可有參與排名的資格。那么問(wèn)題來(lái)了,該如何進(jìn)行有效的頁(yè)面進(jìn)行建立索引并建立起參與排名的資格?
很多人在思考一個(gè)問(wèn)題,文章要盡量原創(chuàng),滿足用戶需求,提高用戶體驗(yàn)等等。但是為何有些站點(diǎn)收錄非常好,排名也非常不錯(cuò),文章卻是采集或者偽原創(chuàng)。講到建立索引以前,我們繼續(xù)先把剩下的一個(gè)工作原理分析完畢。
三、檢索和排名
在整個(gè)檢索與排名中,會(huì)體現(xiàn)出最常用的兩個(gè)搜索引擎原理,一個(gè)就是倒排索引,另外一個(gè)就是TF-IDF算法,首先我們來(lái)了解下倒排索引的更新策略,如下圖所示(來(lái)自百度百科-倒排索引):
SEO干貨,快速排名靠前你不得不看!
在整個(gè)倒排索引結(jié)構(gòu)中,最常見(jiàn)的有四種更新策略,而上述的案例中就用到了其中兩種,如果大家仔細(xì)的去觀察我的每一個(gè)文章,就不難發(fā)現(xiàn)即使我的頁(yè)面是純抄襲文章,但是我抄襲的每一個(gè)標(biāo)題和原來(lái)標(biāo)題不相同,并且標(biāo)題會(huì)更加的去符合頁(yè)面內(nèi)容,提升頁(yè)面詞頻需求(TF-IDF)。其次則是抄襲的文章不會(huì)直接復(fù)制粘貼,我會(huì)進(jìn)行重新排版,重構(gòu)頁(yè)面從而達(dá)到頁(yè)面并非采集的作用。
在搜索引擎里面。有一個(gè)算法叫做TF-IDF算法,簡(jiǎn)單來(lái)說(shuō),TF-IDF算法,詳細(xì)公式參考:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html是用來(lái)檢索頁(yè)面文檔關(guān)鍵詞出現(xiàn)的頻次。并且可以通過(guò)該算法計(jì)算一個(gè)文件集合里面的詞頻出現(xiàn)的次數(shù)從而來(lái)評(píng)定一個(gè)頁(yè)面的重要程度。而該重要程度是結(jié)合頁(yè)面TITLE來(lái)計(jì)算,也就是大家常說(shuō)的文章內(nèi)容要符合頁(yè)面標(biāo)題的主題相關(guān)性,類(lèi)似作文寫(xiě)作中的緊扣主題。
看到這里,我相信很多朋友就會(huì)理解為何蜘蛛池程序可以快速提升收錄并且有部分頁(yè)面進(jìn)行參與排名,很大的一個(gè)特點(diǎn)就是蜘蛛的頻繁抓取,從而建立了索引,在短時(shí)間內(nèi)讓頁(yè)面“權(quán)重”提升,并且促進(jìn)排名,而新聞?wù)军c(diǎn)的原理也是因?yàn)橹┲胱ト☆l繁的特點(diǎn),幾乎無(wú)需發(fā)布任何的外鏈即可有很好的排名。
現(xiàn)在我們?cè)賮?lái)分析和思考整個(gè)頁(yè)面的抓取到最終的檢索排名我一共操作了是什么:
第一、大量的不定時(shí)更新,讓蜘蛛抓取頻繁抓取,建議給百度提交站點(diǎn)地圖,定時(shí)更新站點(diǎn)地圖。
第二、大量采集文章通過(guò)修改標(biāo)題與布局重構(gòu)讓頁(yè)面變得更新有新鮮度,滿足更符合頁(yè)面的用戶需求。
第三、每天保持大量的更新讓蜘蛛抓取形成習(xí)慣。
第四、由于該站是老域名,加上站點(diǎn)原始數(shù)據(jù)積累,可保持站點(diǎn)的權(quán)威度,從而相對(duì)新域名來(lái)說(shuō)站點(diǎn)更加具備抓取優(yōu)勢(shì)。
寫(xiě)在最后:
雖然最后只寫(xiě)四點(diǎn),也有很多SEO同學(xué)會(huì)覺(jué)得我說(shuō)的這些沒(méi)啥用,但是如果你真正領(lǐng)悟到我所提到的一些核心要點(diǎn),那么你就不難發(fā)現(xiàn)SEO建立索引的奧妙所在,做SEO思路決定出路,技術(shù)并不是最重要的,我更加建議seo同學(xué)們可以多去了解搜索引擎的一些基礎(chǔ)算法和百度官方優(yōu)化指南文檔,如果能夠把里面的任何一個(gè)核心點(diǎn)通過(guò)實(shí)戰(zhàn)的方式去吃透,會(huì)比你看任何所謂的SEO文章都要有價(jià)值!
該文章來(lái)自:知乎 作者:嗨賺族 https://zhuanlan.zhihu.com/p/23929372