下载懂跨境APP
跨境出海,就找懂跨境
鲸享课
0
0
0

王炸!这才是亚马逊及互联网平台搜索排名算法的底层逻辑!!

王健
王健
我这个人很懒还没有签名哦!!
2022-04-04
王炸!这才是亚马逊及互联网平台搜索排名算法的底层逻辑!!

大家好,欢迎大家来到微信公众号: 白帽跨境,之前给大家说过,市面上起码有百分之八十以上的卖家对亚马逊的算法理解还停留在表面,缺少深刻理解。今天,白帽跨境总结了多年的seo经验,sns社交平台经验,跟亚马逊平台的算法相结合,由浅入深带大家学习理解下什么是互联网搜索引擎的排名算法,这套逻辑适用于任何有搜索框🔍框的地方!


我们先从日常生活中体验思考下,大家平时也经常也要养成爱动脑筋的习惯,多问是什么,为什么,怎么样。


首先看这个搜索框,我们每天是不是经常去百度,谷歌,搜狗,抖音,微博搜索信息或者视频,也会去淘宝,京东,拼多多搜商品对吧



你搜索心里想要找的东西或者答案,或者商品,或者信息

然后你输入几个词,点击搜索按钮





然后你会看到首页的头部位置就会有你最想要找的内容,然后大家一般都会懒得翻到后面去找信息。比如这里输入莫斯科,作为一个研究算法的人,我们现在也要考虑搜索这个词语人的意图,他搜索莫斯科这三个字到底是有什么需求呢,是在找什么呢?









OK,看到这里,你就要思考三连了:


是什么

为什么

怎么样


你会看到为什么搜索结果里面是有红色的“莫斯科”三个字?为什么有些是在标题里,有些是在文案文本位置里面?排在前面的这几个内容是什么?它们为什么不会重复?为什么它排在第一,它排在第二,它排第三?





同样思考下

为什么搜索结果里面是有红色的“莫斯科”三个字?排在前面的这几个内容是什么?它们为什么没有重复的信息?为什么它排在第一,它排在第二,它排第三?

另外你也可以去抖音,知乎,淘宝搜搜看,这里就不一一展示了

简单说下搜索引擎的排名逻辑:

首先,搜索引擎发明出来的目的是什么?它是为了最快,最匹配地满足互联网冲浪者的各种获取信息,资源等的需求,搜索引擎把网络上面所有用户的搜索习惯跟网站平台数据资源通过一种爬虫技术抓取数据回来起来形成自己的数据库。专业名词即“蜘蛛爬虫“,为什么叫spider,因为互联网都是很多站点之间连接的虚拟网络就跟蜘蛛网一样,然后搜索引擎会有一种看不见的抓取数据的动作去爬取各个网址的数据,这个动作就跟一只蜘蛛去爬网一样。(你也可以把它想象成孙悟空有一身的毫毛,每根毫毛都可以飞出去抓取外面世界的信息跟资源,然后回来收集给孙悟空本体,然后呢,孙悟空这边把猴子猴孙外面世界获取的信息数据等装进到自己的脑袋里面就形成了“数据库”)





那么问题来了,全世界这么多海量的数据,搜索引擎怎么匹配人类搜索的东西,并且按照什么依据顺序排列推送到他们面前呢?


ai机器算法都是人研究出来的, 那么它肯定就会有底层逻辑在,不要觉得这些东西很高深,学会底层的道理哪里都适用:

简单说下搜索引擎的运行顺序:


一, 检索,crawl


第一阶段,就是检索,简单来说就是爬虫去抓取互联各个网站的信息资料的过程






编辑


切换为居中

添加图片注释,不超过 140 字(可选)



二, 收录索引-index

将你的网页资料收录、建档到搜寻引擎里面的这个动作我们叫做索引(白话一点来说就是收录的意思)





三,排名,ranking

搜索引擎根据某个关键词下面对应它的数据库内容的匹配度跟表现好坏打分,我们暂且把抽象的东西量化,每个关键词的表现好坏用质量得分打分,quality score, 谁的匹配度越高,谁在人类的搜索页面上行为表现越好,算法就给这个词打高分,让它排在搜索引擎的最前面

再回答“莫斯科”搜索的案例,通过观察,我们可以看到搜索结果里面会有不同位置出现莫斯科这个词语,而且颜色是红色的。我们站在机器算法的角度思考:如果我通过爬虫建立的数据库里面的数据信息文本跟人类前台搜索框是一模一样的关键词匹配上,那么是不是可以判断它们之间是有 “相关性”?是不是就是可能对搜索者有效有价值的信息?


这个关键词的匹配程度跟出现的位置的不同也会跟相关性发生变化:


关键词匹配度:莫斯科,斯莫科, 莫斯科没有眼泪,科斯莫,这几个词语跟前台搜索的匹配程度是不是都不一样,而且会有强弱之分?


关键词出现的位置:关键词如果是出现在标题(抬头title)里面,跟文本内容里面,它们的相关性程度也是不一样的。就好像你让一个机器人判断你是不是人类,它肯定先扫描你的头对不对?再扫描你其他身体部位。

然后就是某个关键词下面的“表现”了,很好理解,哪个网站有用,大家就会点击,都会收藏备用,或者转发给朋友,这些动作都代表这个结果是很有用的,不然人们也不会有这些动作对不对?


我们再以图书馆为例详细说明 (可以把图书馆看成是亚马逊平台):






我们把图书馆看成是一个数据库或者是一个存储内容的平台(网络上的平台内容包括了文字,视频,商品,图片等等)

每个货架是不是要放很多书(这就是平台的内容)

而且每个书架都是有归类的,所以我们可以把书架看成是信息的分门别类(这里面又会有一级类,二级类目,三级类目等等。。。层级结构的划分是很有利于图书馆管理人迅速搜寻到想要的书籍,爬虫来到一个网站也最好事先这个网站的内容层级划分的很清晰,这样爬虫抓取信息效率越高)

一本书从上到某个类目的书架上面这个动作就相当于爬虫把外面的数据搬回来到自己的数据库,这个动作就叫 收录-index


只有你的内容被收录 indexed, 才有可能被来找书的人找到是不是?你都没有上架收录,数据库没有你的信息,搜索者是搜不到的

被收录之后,我们用静态质量得分,跟动态质量得分结合起来给某个关键词下面的某一本书打分(思考下静态质量得分跟动态质量得分哪个重要性程度更高?)


静态质量得分

可以简单理解为静态文本跟客户搜索关键词匹配的内容程度。

比如某一本书里面静态文本的内容包括了标题,文案内容里面的文字等信息。一本书的封面书名可以看成是标题,客户搜索“西游记” 这个关键词,是不是首先会直接匹配到封面是“西游记”这本书本身。而不会是“西游记后传,西游记外传”之类命名的书,但是这些相关性弱的肯定是往后排列。然后,比如你书里面的内容有“西游记” 这三个字出现次数再多,你书名封面不是“西游记” ,这相关性对比起来相关性哪个更强?

动态质量得分

为什么要引入动态的概念?因为文本是死的, 算法推荐的东西最终目的是要满足某个搜索关键词下的真实的客户搜索需求。所以核心是要以客户为中心的,客户觉得是就是,客户觉得不是就不是。听起来有点拗口,这样解释:比如一本书书名写的是桃子,但是有些人不专业,或者别有用心,书里面内容有大幅可能写的是李子相关的东西。或者说跟李子相关性的内容质量要比写桃子的质量要好很多。那么客户如果搜李子,它也会推送匹配到客户面前(不一定会优先先排到首要位置推送),然后可能有些因为好奇点进去,咦,李子的内容很吸引人,然后他把整本书看完,收藏了,买回去了。这样,系统就会把写桃子为书名的这本书跟搜索李子的关键词匹配形成强关联,也会在搜李子的关键词下面为这本书打很高的质量得分。为什么会这样?因为文本可能有些内容不一定百分之百准确描述,有些书可能书挂羊头卖狗肉。但是,搜索这个人他的行为不会有错,他自己有眼睛,可以阅读,可以判断,看完了好不好,他会收藏,借阅,或者直接买,这些行为是不是更能就代表某一本书的受喜欢程度?然后搜索引擎的目的就是把最优质内容,最受欢迎的书推送到最匹配的关键词展现的地方满足更多的客户需求并让他们满意,是不是这种逻辑?

动态匹配主要就通过客户搜索的行为来判断搜索的内容跟客户之间的相关性程度。

动态匹配的几个权重指标:(权重就是代表重要性的程度)

你看到一个视频封面很漂亮,吸引你点击进去,进来之后看了下内容,哇,内容好好,目不转睛享受从头看到尾,看完之后,点个赞,觉得还不够,嗯收藏下次再看,再评论,再分享,再打赏

以b站视频为例:大家看视频的时候,不知道是不是会留意到这些互动按钮,比如观看次数,点赞,点差,收藏数,评论数量,分享转发数量,打赏

这些按钮之间的关系反馈是不是能够代表观看者对这个视频内容的喜爱程度大小?

比如一个视频让我看完之后都出钱打赏了,这个动作反馈给算法的内容受欢迎程度的权重是不是最大?


为啥每个up主都喜欢在视频里面让你 “一键三连”?因为你打分越高,这条内容排名越靠前,它的关键词自然流量就会越多,就会形成一个正向的飞轮。看的人越多,up主的粉丝是不是越多?


咳咳,对了,插播下,这篇文章的最后也是可以“一键三连”的哦,不要忘记点赞,转发,评论哦







我们把这些逻辑对应到亚马逊之类的卖货平台:卖货平台的核心肯定是要满足客户某个搜索关键词下面最好的商品匹配需求,平台需要把最好的商品推荐给客户,让客户买了下次还想来这个平台买东西,这样这个平台才能持续生存下去对不对?

某个关键词下面的搜索结果中客户会有下面这些主要动作:

点击:一个关键词搜索结果下这么多链接,谁的点击越多,是不是这个链接受欢迎度越高?

页面停留时间:客户进去你的链接停留的时间,这个跟视频平台看内容的时长一个意思,你是进去之后从头到尾看完所有的内容呢, 还是一进去看了几秒钟就从页面跳到别到内容里面去。页面停留的时间越长,是不是能够代表喜爱程度?这就像你喜欢一个人,是不是会盯着她看,青睐的目光停留时间越长是不是代表越喜欢?

收藏:一个商品被客户收藏了,是不是代表他心动了,有购买的意思了?

加购:好了,决定购买了,直接放到购物车,就等付款了

转化购买:付钱下单完成销售,是不是得达到一定喜欢的程度才会埋单?

好评:买了之后回去用了,觉得好,尽然还有不嫌麻烦,找到链接留大段的文字视频内容的评价,给了五星好评。

转发:嗯这个商品链接很好,我转发给其他朋友亲戚也买,这么好的东西就应该好好分享(跟本篇公众号文章一样)

你看,上面这些动作的数据反馈是不是算法都能搜集,然后打分,来判断某个链接的真实的受欢迎程度?记住,数据不会说谎,这就是大数据为什么这么重要。为什么不要刷单,你刷单都是一厢情愿的虚假繁荣,不利于对自己卖的商品或者做的内容的真实认知。这些跟电影刷票房的,歌曲打榜一样。自己欺骗自己,何必呢。你只有正面自己的缺陷,可能会有负面的反馈,但这才是有价值的信息,是更加有利于你找对方向,进化成完美的自己。

具体这些质量等分到底怎么打只有每个平台算法他们自己知道,我们不妨可以量化出一个权重系数更加直观有利于大家理解:

比如某个链接都会有一个基础分,大家都差不多。

然后平台算法会根据用户行为反馈, 每触发一个,就会打一个权重分。


比如:(权重系数代表更直观的量化判断)

点击 x0.1的权重系数收藏,x 0.3的权重系数

购买 x0.8的权重系数

五星好评 x0.4的权重系数

然后静态匹配也会打分,跟动态质量分数加起来,某个关键词的质量得分综合,谁的分数越高,表现越好,系统算法就把它排在最前面,满足客户的需求获得正向反馈的概率是不是就最大?客户喜欢这个平台买东西,对这个平台的粘性是不是也越大?平台也是有竞争对手的,它们也是要服务好客户,留住客户并且提高客户满意度,平台才能持续运营下去的,如果整个平台都是刷单的虚假商品,客户还会在这个平台买东西吗?

另外亚马逊cpc广告系统也是有质量得分这个概念的,也会根据你的链接里面的静态,动态 质量等分去匹配打分,谁表现好,谁扣的广告费就越少,而且排名越高,这里插一句,后续会给大家在广告算法的文章会详细讲解。


身体其他部分。首先从头部这么重要的位置开始判断是不是就可以大概率判断你是什么?


为什么平台不喜欢同质化的东西: 一个图书馆有这么多书了,为什么还要重复出现同质化内容的书过来?如果有更多没有的新书来丰富内容库是不是会更加吸引消费者读者重复光顾,他们会有所期待?亚马逊也一样,它需要新的东西来扩展产品丰富度,来吸引客户平台购买。大家都卖一样同质化的东西,对亚马逊不好,对买家不好,对卖家也不好(同质化唯一能做的差异化就是降价亏本做慈善),对三方都不好的,平台为什么要分配给你流量?

为什么新书来了会优先摆在最显眼的位置:这个就跟亚马逊的新品期一样,一个新的东西上来了,平台肯定是要优先给它流量曝光测试受不受欢迎的,首先让得让读者/消费者看到,平台才能收集数据知道这些新书到底好不好卖,受不受欢迎对不对?如果给了你一个月的时间表现,你表现不好,那平台肯定不会重视你,直接给你打入冷宫放到某个角落吃灰。平台获取客户流量都是有成本的,为什么要花这么多时间跟成本在一些不受欢迎的内容上?

你看,这些逻辑涵盖了所有的平台,视频平台比如tiktok抖音, youtube, b站 ,文字类的知乎,日常生活类美团,商品卖货平台比如淘宝,亚马逊,京东,百度谷歌搜索引擎,社交类Facebook,微博,twitter,底层逻辑都是一样,只是这些算法的指标每个平台的叫法不一样而已,你只有了解了某个平台客户最想要的是什么,围绕客户的重要的考量维度量化出来一些指标很快就会上手熟悉的。但是需要注意,国内很多平台是把money的权重放到最大的,只要你充钱,其他都不是事,但是国外平台不是这样的,很多全球头部的科技公司他们会优先考虑客户的体验放在第一位,以此为基础尽可能优化自己的算法达到各方面的利益最大化。

说了这么多, 搜索引擎关键词排名的底层逻辑就两个


相关性 relevancy

表现 performance


这也是亚马逊运营的底层逻辑

今天主要给大家讲了搜索页关键词排名的算法,因为大家都习惯于去首页找到自己想要的信息,这部分流量占了大头。其实另外还会有推荐算法也是很重要的流量补充,如果后续有机会也会给大家一起探讨探讨。


Hello, 大家好,欢迎大家来到我的微信公众号: 白帽跨境


这是一个教你正规运营,理解底层逻辑助你跨境出海的频道


更多干货: 关注“白帽跨境” 微信公众号,或者添加作者微信 258750608 交流!

精选服务
亚马逊
懂跨境专属全球开店服务
立即查看
JungleScout
懂跨境专属软件工具服务
立即查看
店铺123
亚马逊店铺注册运营
立即查看
评论
0/300
请文明发言,友善交流。
懂跨境精准服务1v1
NIUKE国际物流
NIUKE国际物流
东南亚出海企业免费咨询
东南亚出海企业免费咨询
NIUKE鲸享课
NIUKE鲸享课
客优云ERP
客优云ERP
六崇越供应链
六崇越供应链
懂跨境展会顾问
懂跨境展会顾问
NIUKE 海外仓
NIUKE 海外仓