设白名单机制 用户数据被挪用 2500页文档曝谷歌搜索黑幕 品牌主宰搜索排名

智东西 编译 陈骏达 编辑 李水青

智东西5月29日消息,近日,据市场和受众研究公司SparkToro在官网博客发布的文章,一位匿名消息人士(后证实为搜索引擎优化行业资深从业者Erfan Azimi)向SparkToro公司的CEO Rand Fishkin提供了来自谷歌搜索API的大量泄露文档,这些文档揭示了谷歌搜索引擎内部排名算法的详细信息。

本次泄露文档中的部分内容与谷歌公开表态的信息以及2023年的美国司法部起诉谷歌的反垄断案件中的证词相矛盾。比如,谷歌曾一再否认使用点击导向的排名机制,否认子域名在排名中被单独考虑,否认收集或考虑域名的年限等等。但泄露文档证实,这些因素都是谷歌搜索引擎排名机制中的一环。

此次泄露的谷歌搜索API文档共计2500余页,共包含14014个属性特征。这些文档据称是谷歌内部“Content API Warehouse”的一部分,并在代码托管平台GitHub上不慎公开了一段时间。

博客作者Rand Fishkin在多位前谷歌员工的沟通中确认,泄露的文档具备谷歌内部API文档的特征。Rand Fishkin与和技术SEO(搜索引擎优化)专家Mike King进行交流,并再次验证了这些文档的真实性。

这些文档的泄露可能对搜索营销领域产生深远的影响,因为它们提供了对谷歌搜索引擎内部工作机制的前所未有的洞察,包括它如何使用点击数据、浏览器点击流、白名单、质量评估员反馈和链接质量来影响搜索结果排名。

一、泄露文档3月底便已公开,谷歌前员工确认文档真实性

5月24日,Rand Fishkin与爆料者Erfan Azimi进行了视频通话。Erfran Azimi一开始决定以匿名的形式爆料此事,但在5月28日他决定公开自己的身份。Erfan Azimi在通话中具体展示了本次泄露的谷歌搜索API文档。根据文档的提交历史记录,这些文档于2024年3月27日上传到代码托管平台GitHub,直到2024年5月7日才被删除。

这些文档是谷歌“Content API Warehouse”的一部分,可以被视为谷歌搜索引擎团队成员的指南,就像图书馆中的书籍清单或卡片目录,告诉需要了解的员工有哪些资源可用以及如何获取这些资源。

但是与公共图书馆不同,谷歌搜索是世界上最为秘密、守卫最严密的黑箱之一。在过去的20多年里,谷歌搜索部门里从未发生过规模如此之大、内容如此之详细的泄露事件。

需要注意的是,文档并不包含搜索排名算法中特定元素的权重等内容,也不能证明排名系统中使用了哪些元素。但是,它确实显示了很多关于谷歌收集的数据的详细信息。以下是文档格式的示例:

在向Rand Fishkin介绍了其中的一些API模块后,Erfan Azimi解释了他的动机。他希望能提升谷歌搜索排名机制的透明度,让谷歌对自己的行为承担责任。Erfan Azimi也希望Rand Fishkin能发表一篇文章分享这次泄露,揭示其中包含的许多有趣的数据,并驳斥一些谷歌员工多年来一直在传播的“谎言”。

为了验证泄露文档的真实性,Rand Fishkin联系了一些前谷歌员工,向他们分享了泄露的文档,并询问了他们的想法。最终,有两位谷歌前员工对文档的真实性发表了看法:

“当我在谷歌工作时,我无法访问这些代码。但文档看起来肯定是符合谷歌内部规范的。”

“它具有Google内部API的所有特征。”

“这是一个基于Java的API。可以看出,写这些文档的人花了很多时间遵守谷歌内部关于文档和命名的标准。”

“我需要更多时间才能确定,但这与我熟悉的内部文档相符。”

“从我简要的审查来看,没有发现任何不符合谷歌内部规范的迹象。”

二、谷歌搜索引擎黑幕曝光,官方表态与泄露文档自相矛盾

为进一步解读本次泄露的文档,Rand Fishkin联系了知名技术SEO专家,数字营销机构iPullRank的创始人Mike King。Mike King在iPullRank的官网博客上详细分析了泄露文件的内容,而Rand Fishkin综合爆料者透露的信息和Mike King的分析,总结出了以下5个早期发现:

1、谷歌在排名算法中使用用户交互数据

2017年,谷歌搜索关系团队(Search Relations team)的负责人John Mueller在一次采访中说道,谷歌没有直接在搜索排名算法中使用点击量数据和用户行为数据。然而2023年9月,曾在谷歌搜索质量和排名部门工作了17年的谷歌前员工Eric Lehman却在谷歌的反垄断调查听证会上作证说:“几乎所有人都知道我们(谷歌)正在搜索排名中使用点击量数据”。

本次泄露的文档进一步坐实了这一点。文档内容显示,谷歌已经将点击量数据在文档中进行了命名和描述,这说明这些数据已经成为了搜索排名算法中的衡量标准之一。

2、谷歌创建Chrome正是为了大量收集数据,优化搜索排名

John Mueller在2022年的一场活动中被问到,谷歌是否会使用Chrome收集用户数据并对搜索结果进行排名。John Mueller的回应是据他所知,谷歌不会这么做。

然而,Erfan Azimi声称,早在2005年,谷歌就希望获得数十亿互联网用户的全部点击流(clickstreams,即用户访问网站时留下的轨迹数据)。而有了Chrome,他们现在已经得到了这些数据。泄露的API文档显示,谷歌会计算几种类型的指标,这些指标可以使用与单个页面和整个域相关的Chrome视图来调用。

Rand Fishkin指出,谷歌可能会使用Chrome浏览器中页面的点击次数,并使用它来确定网站上最受欢迎或者最重要的URL,这些URL将用于计算要包含在附加链接功能中的URL。

例如,在上方的谷歌搜索截图中,谷歌会通过跟踪数十亿Chrome用户点击流,来对网站内部的页面进行排序。

Mike King在他的分析文章中也指出,泄露文件中一个与页面质量评分相关的模块包含一个基于Chrome浏览量的站点级衡量标准。另一个似乎与生成站点链接相关的模块也具有一个与Chrome相关的属性。

一份泄露的谷歌内部展示文稿也显示,早在2016年5月Chrome数据就有计划被引入谷歌搜索。

3、谷歌在某些领域执行白名单机制,值得信任的域名将获得更高排名

在本次泄露的文档中,有一个叫做优质旅游网站的模块。这一模块说明谷歌在旅游领域存在一个白名单,但目前的信息还不能证明这一白名单机制是专门针对旅游相关的搜索,还是更为广泛的网络搜索。本次泄露的文档内还有一些标签,比如“isCovidLocalAuthority”和“isElectionAuthority”。这些标签进一步说明谷歌正在将特定域名列入白名单。这可能是为了在执行一些极具争议性的查询时,提供更为准确的信息。

4、谷歌雇佣的质量评估员正直接影响搜索结果排序

谷歌长期以来一直有一个名为EWOK的质量评级平台。本次泄露的文档表明,谷歌在搜索系统中使用了质量评估器中的一些元素。EWOK的质量评估者生成的分数和数据可能直接参与谷歌的搜索系统,而不仅仅是实验的训练集。这些数据在注释和模块细节中被特别提到了。

上方图片中的内容提到了“人类评级(例如来自EWOK的评级)”,并指出它们“通常只填充在评估管道中”,这表明它们可能主要是该模块中的训练数据。

泄露的文档中也显示,谷歌调用了“每个文档的相关性评级”,该评级来自通过EWOK进行的评估。Rand Fishkin认为,虽然文档中没有详细的标注,但可以想见这些人类评级到底有多重要。

5、谷歌使用点击数据确定链接权重

Erfan Azimi指出,谷歌按照三个层级(低、中、高质量)来分类他们的链接索引。点击量数据被用于确定文档所属的链接图索引层。如果一个链接获得的点击量很小,它将进入低质量索引,这意味着链接将被忽略。但如果一个链接拥有来自可验证设备的大量点击量,它就会被归入高质量索引,这一链接也会表现出高排名信号。来而自低质量链接索引的链接不会影响网站的排名。这些链接仅仅是会被忽略。

三、泄露文件颠覆传统搜索引擎优化模式,中小企业做SEO性价比很低

谷歌本次泄露的文档展现了谷歌搜索排名算法中不为人知的一面,这对搜索引擎优化界的从业者有很好的借鉴意义。

Rand Fishkin指出,本次泄露的文档表明,在谷歌的搜索排名算法中,品牌比什么都重要。谷歌有多种方法可以识别实体、对实体进行排序、排名和过滤。

这些实体包括品牌,例如品牌名称、品牌官方网站和社交媒体账号。谷歌目前正在将大量的流量传送给主导网络的大品牌,而非规模较小的独立网站和企业。

对于大多数中小型企业和较新的创作者与出版商来说,在建立信誉、导航需求和在相当大的受众中建立良好的声誉之前,SEO的回报可能会很差。

此外,经验、专业知识、权威性和可信度(E-E-A-T)在谷歌的排名系统中并不那么重要。

目前,泄露的文档中唯一提到专业知识的领域是谷歌地图评论贡献度中的一条注释。其它涉及E-E-A-T的标记都是隐藏的、间接的,很难发现。这些因素或许并非谷歌搜索排名系统中的特定元素。

泄露的文档也显示,谷歌搜索中经典的排名因素,比如PageRank(谷歌早期衡量网页的重要性和排名的算法)、锚文本链接和文本匹配的重要性多年来一直在减弱,但是页面标题仍然非常重要。

PageRank虽然在搜索索引和排名中占有一席之地,但几乎可以肯定的是,它是从1998年的原始论文演变而来的。泄露的文档里包含了多年来创建和丢弃的多个版本的PageRank。锚文本链接虽然存在于泄露文件中,但似乎并没有特别重要。

此外,用户的交互(比如点击)在搜索排名中扮演主导性的作用。当存在清晰的用户交互模式时,内容和链接都是排名系统中的次要因素。

结语:泄露文件揭秘谷歌排名运作机制,透明度仍是谷歌的软肋

尽管谷歌多次强调其算法的公平性和中立性,但这次泄露的文件再次引发了人们对谷歌透明度的质疑。

Rand Fishkin指出,谷歌是这个星球上信息和商业传播中最强大、最有影响力的力量之一。

作为搜索引擎巨头,谷歌的排名机制直接影响着互联网上的信息流动,关乎着言论自由和公平竞争。然而,谷歌内部不透明的运作方式,无疑加剧了人们对其中立性的怀疑。

谷歌目前尚未对这一泄露事件作出任何回应,但这一事件已经在SEO从业者群体中掀起了轩然大波。目前这些泄露文档已经被公布在文件托管网站HexDocs上,或许之后会有更多细节浮出水面。


树精卫士 dota6.83 如何种视野

这是他的A杖效果 出了A杖 就会获得额外的强化技能 可以把一棵树变成守卫 并且自己释放大招时 树也会同步释放

我打我的世界指令我给op,为什么那上有无匹配搜索结果。

/gamemode 1 给予自己生存/创造模式/tp [id]强制飞到某个玩家的身边/tphere [id]让某个玩家强制飞到你身边/tpall [id]让所有玩家飞到你身边,包括op/tppos [x] [y] [z]传送到x,y,z/vanish隐身(人家最~~~~喜欢用的了~~)/fireball释放地狱轰炸机的火球,从op的口里吐出来/shock [玩家id]雷击某个玩家,如果直接/shock 就在你的准心对着的地方给予雷击/nuke [id]在某个玩家上方放核弹,其实就是一堆被激活的tnt从天上飞下来/antioch在准心所指的地方放一颗炸弹/butcher杀死附近的全部怪物/killall杀死附近的全部生物,包括人类/kill [id]杀死某个玩家,= =这个我没用过。 。 我只喜欢隐身背后放苦力怕娘~\(≥▽≤)/(炸飞)咳咳咳。 。 。 。 /suicide自杀。 。 。 /burn [id]让某个玩家起火/ext [id]给某个玩家灭火/jump直接跳跃到准心所指地方,长途旅行很实用/fly [id]给予某个玩家飞行的权限/up [数量]把自己提升到某个高度,最大256,脚下会生成一块玻璃垫着你/seen [id]查看某人最后退出的时间/weather [storm/sun]改变天气/rain off停雨,这个更简单/time set [xx:xx]设置时间,比如/time set 06:00就是设置时间为早上6点/eco [give/take/reset] [id] [数量]给予/拿走/重设,某个玩家的钱/heal [id]回复某个玩家的生命/invsee查看某个玩家的背包,并且可以移动【基本指令】游戏指令: /register 密码 注册。 。 。 。 。 。 /login 密码 登陆。 。 。 。 。 /sethome 设置你自己的家/home 回到你自己的家/money 查看你有的钱/back 回到死亡的位置/xpshop buylevel 数字(等级) 用钱买经验点/tp 玩家名字 传送到该玩家 op指令/gamemode 玩家姓名 给某玩家更换游戏模式/sethome 设置家/back 回到死亡点/home 回到家/ban 玩家名字 封ip/kick 玩家名字 t出玩家/setspawn 设置出生点/whitelist add 玩家名字 添加白名单/whitelist remove 玩家名字 移除白名单/op 玩家名字 给某人op/unban 玩家名字 解除玩家banban在minecraft中文包里解释为审判之锤

如何降低修改网站标题对网站排名带来的影响

你需要先知道网络知道是怎么运作的。 蜘蛛先去抓取网络白名单的网站或者一些信任度非常高的站点和页面(例如:一些高权重网站和网站的首页),在抓取这些网页的内容时发现一些指向另外一些一些页面的链接。 蜘蛛会把这些链接保存在自己的数据库里面,然后再根据抓取顺序依次来抓取这些网页。 1、蜘蛛抓取网页的规则:对于蜘蛛说网页权重越高、信用度越高抓取越频繁,例如网站的首页和内页。 蜘蛛先抓取网站的首页,因为首页权重更高,并且大部分的链接都是指向首页。 然后通过首页抓取网站的内页,并不是所有内页蜘蛛都会去抓取。 搜索引擎认为对于一般的中小型站点,3层足够承受所有的内容了,所以蜘蛛经常抓取的内容是前三层,而超过三层的内容蜘蛛认为那些内容并不重要,所以不经常爬取。 2、如何看蜘蛛的抓取?通过iis日志可以看蜘蛛爬取了哪些内容,iis日志有网络蜘蛛、谷歌蜘蛛等。 从iis日志里卖弄分析得出蜘蛛的类型、抓取时间、抓取的页面、抓取内容的大小以及返回的页面代码,200代表抓取顺利。 小熙SEO竭诚为你解答,最近是会有一些废品流量的网站掉排名的,改标题关键词的时候也需要注意

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/caijing/14202.html
法拉第未来 出租六辆 FF91去年卖了四辆 未来可能永远无法
18公里被收228元 滴滴司机私自加价被乘客发现 平台方回应