当前位置: 当前位置:首页 > 焦点 > 2500页文档曝google搜查底细:用户数据被调用、设白名单机制、品牌主宰搜查排名 正文

2500页文档曝google搜查底细:用户数据被调用、设白名单机制、品牌主宰搜查排名

2024-10-16 20:23:56 来源:五月披裘网 作者:知识 点击:120次


智工具
编译 陈骏达
编纂 李水青

智工具5月29日音讯,克日,档曝底细单机据市场以及受众钻研公司SparkToro在官网博客宣告的搜查数据文章,一位匿名音讯人士(后证实为搜查引擎优化行业资深从业者Erfan Azimi)向SparkToro公司的被调白名CEO Rand Fishkin提供了来自google搜查API的少许激进文档,这些文档揭示了google搜查引擎外部排名算法的制品宰搜详尽信息。

本次激进文档中的牌主全副外容与google果然亮相的信息以及2023年的美国法律部起诉google的反操作案件中的证词相矛盾。好比,查排google曾经一再认可运用点击导向的页文用户用设排名机制,认可子域名在排名中被径自思考,档曝底细单机认可收集或者思考域名的搜查数据年限等等。但激进文档证实,被调白名这些因素都是制品宰搜google搜查引擎排名机制中的一环。

这次激进的牌主google搜查API文档共计2500余页,共包罗14014个属性特色。查排这些文档据称是页文用户用设google外部“Content API Warehouse”的一全副,并在代码托管平台GitHub上失慎果然了一段光阴。

博客作者Rand Fishkin在多位前google员工的相同中确认,激进的文档具备google外部API文档的特色。Rand Fishkin与以及技术SEO(搜查引擎优化)专家Mike King妨碍替换,并再次验证了这些文档的着实性。

这些文档的激进可能对于搜查营销畛域产生深远的影响,因为它们提供了对于google搜查引擎外部使命机制的亘古未有的洞察,包罗它若何运用点击数据、浏览器点击流、白名单、品质评估员反映以及链接品质来影响搜查服从排名。

一、激进文档3月尾便已经果然,google前员工确认文档着实性

5月24日,Rand Fishkin与爆料者Erfan Azimi妨碍了视频通话。Erfran Azimi一开始决定以匿名的方式爆料此事,但在5月28日他决定果然自己的身份。Erfan Azimi在通话中详尽展现了本次激进的google搜查API文档。依据文档的提交历史记实,这些文档于2024年3月27日上传到代码托管平台GitHub,直到2024年5月7日才被删除了。

这些文档是google“Content API Warehouse”的一全副,可能被视为google搜查引擎团队成员的指南,就像图书馆中的书籍清单或者卡片目录,看护需要清晰的员工有哪些资源可用以及若何获取这些资源。

可是与公共图书馆区别,google搜查是天下上最为神秘、保卫最涣散的黑箱之一。在以前的20多年里,google搜查部份里从未发生过规模如斯之大、内容如斯之详尽的激进事件。

需要留意的是,文档并不包罗搜查排名算法中特定元素的权重等内容,也不能证实排名系统中运用了哪些元素。可是,它确凿呈现了良多对于google收集的数据的详尽信息。如下是文档名指标示例:


在向Rand Fishkin介绍了其中的一些API模块后,Erfan Azimi讲明了他的念头。他愿望能降职google搜查排名机制的透明度,让google对于自己的行动担当责任。Erfan Azimi也愿望Rand Fishkin能宣告一篇文章分享这次激进,揭示其中包罗的良多幽默的数据,并品评一些google员工多年来不断在转达的“瞎话”。

为了验证激进文档的着实性,Rand Fishkin分割了一些前google员工,向他们分享了激进的文档,并问询了他们的想法。最终,有两位google前员工对于文档的着实性宣告了意见:

“当我在google使命时,我无奈拜候这些代码。但文档看起来未必是适宜google外部规范的。”

“它具备Google外部API的所有特色。”

“这是一个基于Java的API。可能看出,写这些文档的人花了良多光阴功能google外部对于文档以及命名的规范。”

“我需要更多光阴能耐判断,但这与我熟习的外部文档适宜。”

“从我扼要的魔难来看,不发现任何不适宜google外部规范的迹象。”

二、google搜查引擎底细曝光,民间亮相与激进文档言行纷比方

为进一步解读本次激进的文档,Rand Fishkin分割了驰名技术SEO专家,数字营销机构iPullRank的独创人Mike King。Mike King在iPullRank的官网博客上详尽合成了激进文件的内容,而Rand Fishkin综合爆料者泄露的信息以及Mike King的合成,总结出了如下5个早期发现:

一、google在排名算法中运用用户交互数据

2017年,google搜查关连团队(Search Relations team)的负责人John Mueller在一次采访中说道,google不间接在搜查排名算法中运用点击量数据以及用户行动数据。可是2023年9月,曾经在google搜查品质以及排名部份使命了17年的google前员工Eric Lehman却在google的反操作审核听证会上作证说:“简直所有人都知道咱们(google)正在搜查排名中运用点击量数据”。


本次激进的文档进一步坐实了这一点。文档内容呈现,google曾经将点击量数据在文档中妨碍了命名以及形貌,这诠释这些数据曾经成为了搜查排名算法中的掂量规范之一。

二、google建树Chrome正是为了少许收集数据,优化搜查排名

John Mueller在2022年的一场行动中被问到,google是否会运用Chrome收集用户数据并对于搜查服从妨碍排名。John Mueller的回应是据他所知,google不会这么做。

可是,Erfan Azimi宣称,早在2005年,google就愿望取患上数十亿互联网用户的全副点击流(clickstreams,即用户拜候网站时留下的轨迹数据)。而有了Chrome,他们如今曾经患上到了这些数据。激进的API文档呈现,google会合计多少种规范的指标,这些指标可能运用与单个页面以及全部域相干的Chrome视图来调用。

Rand Fishkin指出,google可能会运用Chrome浏览器中页面的点击次数,并运用它来判断网站上最受招待概况最紧张的URL,这些URL将用于合计要包罗在附加链接功能中的URL。


比喻,在上方的google搜查截图中,google会经由跟踪数十亿Chrome用户点击流,来对于网站外部的页面妨碍排序。


Mike King在他的合成文章中也指出,激进文件中一个与页面品质评分相干的模块包罗一个基于Chrome浏览量的站点级掂量规范。另一个彷佛与天生站点链接相干的模块也具备一个与Chrome相干的属性。


一份激进的google外部演示文稿也呈现,早在2016年5月Chrome数据就有妄想被引入google搜查。

三、google在某些畛域推广白名单机制,值患上置信的域名将取患上更高排名

在本次激进的文档中,有一个叫做低劣遨游网站的模块。这一模块诠释google在遨游畛域存在一个白名单,但当初的信息还不能证实这一白名单机制是特意针对于遨游相干的搜查,仍是加倍宽泛的网络搜查。本次激进的文档内尚有一些标签,好比“isCovidLocalAuthority”以及“isElectionAuthority”。这些标签进一步诠释google正在将特定域名参加白名单。这可能是为了在推广一些极具争议性的查问时,提供加倍精确的信息。

四、google雇佣的品质评估员规定接影响搜查服从排序

google临时以来不断有一个名为EWOK的品质评级平台。本次激进的文档表明,google在搜查系统中运用了品质评估器中的一些元素。EWOK的品质评估者天生的分数以及数据可能间接退出google的搜查系统,而不光仅是试验的磨炼集。这些数据在诠释以及模块细节中被特意提到了。


上方图片中的内容提到了“人类评级(比喻来自EWOK的评级)”,并指出它们“个别只填充在评估管道中”,这表明它们可能主若是该模块中的磨炼数据。

激进的文档中也呈现,google调用了“每一个文档的相干性评级”,该评级来自经由EWOK妨碍的评估。Rand Fishkin觉患上,尽管文档中不详尽的标注,但可能想见这些人类评级事实有多紧张。


五、google运用点击数据判断链接权重

Erfan Azimi指出,google遵照三个层级(低、中、高品质)来分类他们的链接索引。点击量数据被用于判断文档所属的链接图索引层。假如一个链接取患上的点击量很小,它将进入低品质索引,这象征着链接将被轻忽。但假如一个链接具备来自可验证配置装备部署的少许点击量,它就会被纳入高品质索引,这一链接也会呈现出高排名信号。来而自低品质链接索引的链接不会影响网站的排名。这些链接仅仅是会被轻忽。

三、激进文件倾覆传统搜查引擎优化模式,中小企业做SEO性价比很低

google本次激进的文档展现了google搜查排名算法中鲜为人知的一壁,这对于搜查引擎优化界的从业者有很好的借鉴意思。

Rand Fishkin指出,本次激进的文档表明,在google的搜查排名算法中,品牌比甚么都紧张。google有多种方式可能识别实体、对于实体妨碍排序、排名以及过滤。

这些实体包罗品牌,比喻品牌称说、品牌民间网站以及社交媒体账号。google当初正在将少许的流量传递给主导网络的大品牌,而非规模较小的自力网站以及企业。

对于大少数中小型企业以及较新的创作者与出书商来说,在建树信誉、导航需要以及在至关大的受众中建树优异的声誉以前,SEO的报答可能会很差。

此外,履历、业余常识、权威性以及可信度(E-E-A-T)在google的排名系统中并不那末紧张。

当初,激进的文档中仅有提到业余常识的畛域是google舆图品评贡献度中的一条诠释。此外波及E-E-A-T的符号都是潜在的、间接的,很难发现。这些因素概况并非google搜查排名系统中的特定元素。

激进的文档也呈现,google搜查中典型的排名因素,好比PageRank(google早期掂量网页的紧张性以及排名的算法)、锚文本链接以及文本立室的紧张性多年来不断在削弱,可是页面问题依然十分紧张。

PageRank尽管在搜查索引以及排名中占有一席之地,但简直可能未必的是,它是从1998年的原始论文蜕变而来的。激进的文档里包罗了多年来建树以及扔掉的多个版本的PageRank。锚文本链接尽管存在于激进文件中,但彷佛并无特意紧张。

此外,用户的交互(好比点击)在搜查排名中饰演主导性的浸染。当存在清晰的用户交互模式时,内容以及链接都是排名系统中的主要因素。

结语:激进文件揭秘google排名运作机制,透明度仍是google的软肋

尽管google一再强调其算法的公平性以及中立性,但这次激进的文件再次引起了人们对于google透明度的疑难。

Rand Fishkin指出,google是这个星球上信息以及商业转达中最细小、最有影响力的实力之一。

作为搜查引擎巨头,google的排名机制间接影响着互联网上的信息行动,关乎着行动从容以及公平相助。可是,google外部不透明的运作方式,无疑加剧了人们对于其中立性的怀疑。

google当初尚未对于这一激进事件作出任何回应,但这一事件曾经在SEO从业者群体中掀起了轩然大波。当初这些激进文档曾经被宣告在文件托管网站HexDocs上,概况之后会有更多细节浮出水面。

源头:SparkToro

作者:娱乐
------分隔线----------------------------
头条新闻
图片新闻
新闻排行榜