品牌主宰搜索排名 用户数据被挪用 2500页文档曝谷歌搜索黑幕 设白名单机制

智东西 编译 陈骏达 编辑 李水青

智东西5月29日消息,近日,据市场和受众研究公司SparkToro在官网博客发布的文章,一位匿名消息人士(后证实为搜索引擎优化行业资深从业者Erfan Azimi)向SparkToro公司的CEO Rand Fishkin提供了来自谷歌搜索API的大量泄露文档,这些文档揭示了谷歌搜索引擎内部排名算法的详细信息。

本次泄露文档中的部分内容与谷歌公开表态的信息以及2023年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

此次泄露的谷歌搜索API文档共计2500余页,共包含14014个属性特征。这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段时间。

博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,泄露的文档具备谷歌内部API文档的特征。Rand Fishkin与和技术SEO(搜索引擎优化)专家Mike King进行交流,并再次验证了这些文档的真实性。

这些文档的泄露可能对搜索营销领域产生深远的影响,因为它们提供了对谷歌搜索引擎内部工作机制的前所未有的洞察,包括它如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。

一、泄露文档3月底便已公开,谷歌前员工确认文档真实性

5月24日,Rand Fishkin与爆料者Erfan Azimi进行了视频通话。Erfran Azimi一开始决定以匿名的形式爆料此事,但在5月28日他决定公开自己的身份。Erfan Azimi在通话中具体展示了本次泄露的谷歌搜索API文档。根据文档的提交历史记录,这些文档于2024年3月27日上传到代码托管平台GitHub,直到2024年5月7日才被删除。

这些文档是谷歌“Content API Warehouse”的一部分,可以被视为谷歌搜索引擎团队成员的指南,就像图书馆中的书籍清单或卡片目录,告诉需要了解的员工有哪些资源可用以及如何获取这些资源。

但是与公共图书馆不同,谷歌搜索是世界上最为秘密、守卫最严密的黑箱之一。在过去的20多年里,谷歌搜索部门里从未发生过规模如此之大、内容如此之详细的泄露事件。

需要注意的是,文档并不包含搜索排名算法中特定元素的权重等内容,也不能证明排名系统中使用了哪些元素。但是,它确实显示了很多关于谷歌收集的数据的详细信息。以下是文档格式的示例:

在向Rand Fishkin介绍了其中的一些API模块后,Erfan Azimi解释了他的动机。他希望能提升谷歌搜索排名机制的透明度,让谷歌对自己的行为承担责任。Erfan Azimi也希望Rand Fishkin能发表一篇文章分享这次泄露,揭示其中包含的许多有趣的数据,并驳斥一些谷歌员工多年来一直在传播的“谎言”。

为了验证泄露文档的真实性,Rand Fishkin联系了一些前谷歌员工,向他们分享了泄露的文档,并询问了他们的想法。最终,有两位谷歌前员工对文档的真实性发表了看法:

“当我在谷歌工作时,我无法访问这些代码。但文档看起来肯定是符合谷歌内部规范的。”

“它具有Google内部API的所有特征。”

“这是一个基于Java的API。可以看出,写这些文档的人花了很多时间遵守谷歌内部关于文档和命名的标准。”

“我需要更多时间才能确定,但这与我熟悉的内部文档相符。”

“从我简要的审查来看,没有发现任何不符合谷歌内部规范的迹象。”

二、谷歌搜索引擎黑幕曝光,官方表态与泄露文档自相矛盾

为进一步解读本次泄露的文档,Rand Fishkin联系了知名技术SEO专家,数字营销机构iPullRank的创始人Mike King。Mike King在iPullRank的官网博客上详细分析了泄露文件的内容,而Rand Fishkin综合爆料者透露的信息和Mike King的分析,总结出了以下5个早期发现:

1、谷歌在排名算法中使用用户交互数据

2017年,谷歌搜索关系团队(Search Relations team)的负责人John Mueller在一次采访中说道,谷歌没有直接在搜索排名算法中使用点击量数据和用户行为数据。然而2023年9月,曾在谷歌搜索质量和排名部门工作了17年的谷歌前员工Eric Lehman却在谷歌的反垄断调查听证会上作证说:“几乎所有人都知道我们(谷歌)正在搜索排名中使用点击量数据”。

本次泄露的文档进一步坐实了这一点。文档内容显示,谷歌已经将点击量数据在文档中进行了命名和描述,这说明这些数据已经成为了搜索排名算法中的衡量标准之一。

2、谷歌创建Chrome正是为了大量收集数据,优化搜索排名

John Mueller在2022年的一场活动中被问到,谷歌是否会使用Chrome收集用户数据并对搜索结果进行排名。John Mueller的回应是据他所知,谷歌不会这么做。

然而,Erfan Azimi声称,早在2005年,谷歌就希望获得数十亿互联网用户的全部点击流(clickstreams,即用户访问网站时留下的轨迹数据)。而有了Chrome,他们现在已经得到了这些数据。泄露的API文档显示,谷歌会计算几种类型的指标,这些指标可以使用与单个页面和整个域相关的Chrome视图来调用。

Rand Fishkin指出,谷歌可能会使用Chrome浏览器中页面的点击次数,并使用它来确定网站上最受欢迎或者最重要的URL,这些URL将用于计算要包含在附加链接功能中的URL。

例如,在上方的谷歌搜索截图中,谷歌会通过跟踪数十亿Chrome用户点击流,来对网站内部的页面进行排序。

Mike King在他的分析文章中也指出,泄露文件中一个与页面质量评分相关的模块包含一个基于Chrome浏览量的站点级衡量标准。另一个似乎与生成站点链接相关的模块也具有一个与Chrome相关的属性。

一份泄露的谷歌内部展示文稿也显示,早在2016年5月Chrome数据就有计划被引入谷歌搜索。

3、谷歌在某些领域执行白名单机制,值得信任的域名将获得更高排名

在本次泄露的文档中,有一个叫做优质旅游网站的模块。这一模块说明谷歌在旅游领域存在一个白名单,但目前的信息还不能证明这一白名单机制是专门针对旅游相关的搜索,还是更为广泛的网络搜索。本次泄露的文档内还有一些标签,比如“isCovidLocalAuthority”和“isElectionAuthority”。这些标签进一步说明谷歌正在将特定域名列入白名单。这可能是为了在执行一些极具争议性的查询时,提供更为准确的信息。

4、谷歌雇佣的质量评估员正直接影响搜索结果排序

谷歌长期以来一直有一个名为EWOK的质量评级平台。本次泄露的文档表明,谷歌在搜索系统中使用了质量评估器中的一些元素。EWOK的质量评估者生成的分数和数据可能直接参与谷歌的搜索系统,而不仅仅是实验的训练集。这些数据在注释和模块细节中被特别提到了。

上方图片中的内容提到了“人类评级(例如来自EWOK的评级)”,并指出它们“通常只填充在评估管道中”,这表明它们可能主要是该模块中的训练数据。

泄露的文档中也显示,谷歌调用了“每个文档的相关性评级”,该评级来自通过EWOK进行的评估。Rand Fishkin认为,虽然文档中没有详细的标注,但可以想见这些人类评级到底有多重要。

5、谷歌使用点击数据确定链接权重

Erfan Azimi指出,谷歌按照三个层级(低、中、高质量)来分类他们的链接索引。点击量数据被用于确定文档所属的链接图索引层。如果一个链接获得的点击量很小,它将进入低质量索引,这意味着链接将被忽略。但如果一个链接拥有来自可验证设备的大量点击量,它就会被归入高质量索引,这一链接也会表现出高排名信号。来而自低质量链接索引的链接不会影响网站的排名。这些链接仅仅是会被忽略。

三、泄露文件颠覆传统搜索引擎优化模式,中小企业做SEO性价比很低

谷歌本次泄露的文档展现了谷歌搜索排名算法中不为人知的一面,这对搜索引擎优化界的从业者有很好的借鉴意义。

Rand Fishkin指出,本次泄露的文档表明,在谷歌的搜索排名算法中,品牌比什么都重要。谷歌有多种方法可以识别实体、对实体进行排序、排名和过滤。

这些实体包括品牌,例如品牌名称、品牌官方网站和社交媒体账号。谷歌目前正在将大量的流量传送给主导网络的大品牌,而非规模较小的独立网站和企业。

对于大多数中小型企业和较新的创作者与出版商来说,在建立信誉、导航需求和在相当大的受众中建立良好的声誉之前,SEO的回报可能会很差。

此外,经验、专业知识、权威性和可信度(E-E-A-T)在谷歌的排名系统中并不那么重要。

目前,泄露的文档中唯一提到专业知识的领域是谷歌地图评论贡献度中的一条注释。其它涉及E-E-A-T的标记都是隐藏的、间接的,很难发现。这些因素或许并非谷歌搜索排名系统中的特定元素。

泄露的文档也显示,谷歌搜索中经典的排名因素,比如PageRank(谷歌早期衡量网页的重要性和排名的算法)、锚文本链接和文本匹配的重要性多年来一直在减弱,但是页面标题仍然非常重要。

PageRank虽然在搜索索引和排名中占有一席之地,但几乎可以肯定的是,它是从1998年的原始论文演变而来的。泄露的文档里包含了多年来创建和丢弃的多个版本的PageRank。锚文本链接虽然存在于泄露文件中,但似乎并没有特别重要。

此外,用户的交互(比如点击)在搜索排名中扮演主导性的作用。当存在清晰的用户交互模式时,内容和链接都是排名系统中的次要因素。

结语:泄露文件揭秘谷歌排名运作机制,透明度仍是谷歌的软肋

尽管谷歌多次强调其算法的公平性和中立性,但这次泄露的文件再次引发了人们对谷歌透明度的质疑。

Rand Fishkin指出,谷歌是这个星球上信息和商业传播中最强大、最有影响力的力量之一。

作为搜索引擎巨头,谷歌的排名机制直接影响着互联网上的信息流动,关乎着言论自由和公平竞争。然而,谷歌内部不透明的运作方式,无疑加剧了人们对其中立性的怀疑。

谷歌目前尚未对这一泄露事件作出任何回应,但这一事件已经在SEO从业者群体中掀起了轩然大波。目前这些泄露文档已经被公布在文件托管网站HexDocs上,或许之后会有更多细节浮出水面。


谷歌浏览器怎么设置才能不被屏蔽?

方法一:

点击谷歌浏览器右上角的,选择设置

然后在设置列表的最下方,点击更多高级设置

点击更改代理服务器设置,如图箭头所示

然后再打开局域网设置

将自动检测设置的勾去掉,因为在谷歌浏览器加载页面是自动检测设置将会拖慢它访问网页的速度,非常不利于浏览网页

好了,设置完成点击确定按钮,开始极速体验谷歌浏览器网上冲浪吧

方法二:

打开谷歌 Chrome 浏览器,点击窗口右上角的汉堡菜单按钮,弹出浏览器设置菜单,点击菜单下方的“设置”。

进入设置界面后,有一个“登录 Chrome”的按钮,建议不要登录,国内大部分地方应该是登录不上,即使能登录上,因为网络状况原因,也会存在各种问题,因此不建议登录,以免登录进程拖慢浏览器响应速度。

Chrome 浏览器的默认搜索引擎是谷歌自己,它当然会这样设置,但是由于网络原因,这个搜索引擎的可用性太差。因此,这里需要改为国内的搜索引擎,首推网络。

滚动到设置页面的最底端,有个“显示高级设置”的链接按钮,点击打开此链接按钮。

在“隐私设置”一节,有许多使用谷歌网络服务的项目,建议都取消,否则因为网络连不上,Chrome 会频繁尝试,这是浏览器响应速度变慢的主要原因。因此,取消掉各个项目前面的复选框。

有些网站页面上的 JavaScript 脚本太多,而且有的还不太规范,导致整个页面响应速度降低。对于这样的页面,可以禁用其运行 JavaScript 脚本,这样会禁用大部分广告弹窗,同时也会使页面上的部分功能无法使用,需要根据情况分别设置。

在上一步骤图中,点击“隐私设置”一节中的“内容设置”按钮,会弹出新的对话框,在这里可以选择“不允许任何网站运行 JavaScript”来禁用全部网站的 JavaScript。

对于需要开启 JavaScript 的网站,可以将其网址加入白名单,方法是点击上一步骤图中的“管理例外情况”按钮,在新弹出的对话框中,加入需要运行 JavaScript 网站的地址。

如果觉得上述白名单机制对全部网站应用太过严格,还可以使用“黑名单”机制,比如有些网站页面,有价值的内容就那么一点,但是各种广告塞满了页面的各个角落,这时点击 Chrome 浏览器地址栏左侧的“查看网站信息”按钮,在弹出的小对话框中,点击“网站设置”链接按钮,即可直接进入上述设置页面,将其加入“例外情况”的黑名单即可。

接下来经过一些故障现象来推荐一些方法:

故障现象一:只有 Google Chrome 浏览器的网页载入速度比较缓慢

我们可以尝试在隐身窗口中打开网页。

如果在隐身窗口中打开网页时加载速度正常,则说明可能是您安装的某个扩展程序或您的浏览数据出现了问题,因为处于隐身模式时,浏览器会暂时停用这两项功能。我们可以采取如下方案来解决:

①着手查出可能引起该问题的具体扩展程序,逐个停用您的扩展程序,直到可以在标准的 Google Google Chrome

浏览器窗口解决网页加载慢怎么办的问题为止。

②关闭所有 Google Chrome 浏览器窗口并重启浏览器。

③清除 Cookie、缓存和浏览历史记录。

分析具体的错误提示:

在网页加载时是否显示了以下某条讯息?如果显示了,请点击相应讯息所对应的链接,查看具体的问题排查建议。

检查防病毒软件和防火墙设置。

确保这些程序不会阻止 Google Chrome 浏览器。

暂时停用预测网络功能。

具体操作步骤如下:

点击浏览器工具栏上的扳手图标。选择设置。点击显示高级设置。在“隐私设置”部分,取消选中“预测网络操作,以提高网页加载速度”。如果问题仍然存在,则建议您再次启用该功能。

检查是否存在恶意软件。

检查您的计算机上是否存在可能会阻碍 Google Chrome 浏览器连接到网络服务器的恶意软件。了解有关从计算机中删除恶意软件的详情。

故障现象二:所有浏览器的网页载入速度都很缓慢

这种情况我们可以尝试访问其他网站。有可能尝试访问的网站可能暂时出现了问题。您是否只是在 Internet Explorer 和 Google

Chrome 浏览器中遇到了网页载入问题,而在 Firefox

中没有遇到?如果是这样的话,则说明您的代理服务器设置可能存在问题。如果您使用了代理服务器,请尝试在 Windows 网络设置中将其关闭。

关闭您在计算机上打开的其他程序。这些程序可能占用了大量计算机内存,从而导致浏览器运行缓慢。重新启动您的计算机检查网页加载慢怎么办的问题是否解决。

其它原因造成网页加载慢

cpu的原因

CPU非常繁忙的工作,会直接影响网络和计算机速度。所以在网速慢的时候检查一下CPU运作情况是必要的

操作系统使用时间过长

开机很久后出现的网速突然减慢,不妨重新启动看看能不能解决问题。

蠕虫病毒的影响导致网速变慢

通过E-mail散发的蠕虫病毒对网络速度的影响越来越严重,危害性极大。这种病毒导致被感染的用户只要一上网就不停地往外发邮件,病毒选择用户个人电脑中的随机文档附加在用户机子的通讯簿的随机地址上进行邮件发送。成百上千的这种废品邮件有的排着队往外发送,有的又成批成批地被退回来堆在服务器上。造成个别骨干互联网出现明显拥塞,网速明显变慢,使局域网近于瘫痪,有时甚至造成无法打开网页。因此,我们必须及时升级所用杀毒软件;计算机也要及时升级、安装系统补丁程序,同时卸载不必要的服务、关闭不必要的端口,以提高操作系统的安全性和可靠性。

网线问题导致网速变慢

双绞线是由四对线按严格的规定紧密地绞和在一起的,用来减少串扰和背景噪音的影响。同时,在T568A标准和T568B标准中仅使用了双绞线的1、2和3、6四条线,其中,1、2用于发送,3、6用于接收,而且1、2必须来自一个绕对,3、6必须来自一个绕对。只有这样,才能最大限度地避免串扰,保证数据传输。在很多实践中发现不按正确标准(T586A、T586B)的网线水晶头接法,存在很大的隐患。表现为:一种情况是刚开始使用时网速就很慢;另一种情况则是开始网速正常,但过了一段时间后,网速变慢。后一种情况在台式电脑上表现非常明显,但用笔记本电脑检查时网速却表现为正常。实践发现,因不按正确标准制作的网线引起的网速变慢还同时与网卡的质量有关。一般台式计算机的网卡的性能不如笔记本电脑的,因此,在用交换法排除故障时,使用笔记本电脑检测网速正常并不能排除网线不按标准制作这一问题的存在。我们现在要求一律按T586A、T586B标准来压制网线,在检测故障时不能一律用笔记本电脑来代替台式电脑。

网站优化中文章锚文本到底有什么作用?

1、引导蜘蛛抓取。 这一点是所有人都知道的,甚至刚入行的新手也都知道,做好锚文本能让蜘蛛早日抓取页面。 2、传递权重。 锚文本还能够传递一部分权重给指向的页面,这一点估计很多人都不知道,否则也不会不管不顾的做友情链接,忽视规则。 锚文本不仅能够传递一部分权重给指向页面,还能够提升该页面的排名,因而在做优化的时候,一定要注意,不要轻易分权。 另外,锚文本分权是不分站内站外的,这就意味着,你做多少锚文本,就会有多少权重分出去。 3、分析竞争对手。 通过网站的结构以及锚文本的指向,能够很好的看出竞争对手主要优化的页面是哪些,从而了解竞争对手的优势和技术,增加自身的竞争优势。 4、提升用户体验。 锚文本的存在就好比一个推荐,让用户能够知道网站的重点是哪些。 所以,企业在做锚文本的时候,一定要慎重。 广州派点电子商务有限公司,简称:派点电商于2018年5月成立,总部设立在广州。 是一家专注为企业提供互联网营销服务的创新型企业,同时也是基于“互联网+”领先的互联网应用服务提供商。 公司旗下产品OCMS建站系统,是一个(CMS发布系统)为企业用户提供多元、高效、易用的互联网工具,同时配以成熟的运营优化服务体系,帮助企业有效地提升搜索引擎排名,同时提升企业用户消费者体验与互联网营销核心竞争力。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/13832.html
SHANGHAI模式再获肯定 WUXI入选中国报业创新案例
股权拍卖结果出炉! 知名基金公司