0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

啥是佩奇排名算法?通过动画来理解进行计算的具体流程

电子工程师 来源:lq 2019-01-28 09:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

佩奇排名介绍

佩奇排名是根据页面之间的链接结构计算页面的值的一种算法。下面我们通过动画来理解进行计算的具体流程。

假设一个正方形表示一个 WEB 页面,一个箭头表示一个页面之间的链接。

此图表明下面 3 页包含指向上面 1 页的链接

在佩奇排名算法中,网页指向的链接越多,页面被确定为越重要。

因此,在这里,确定首页最重要。

确定首页最重要

实际上,每个页面的重要性都是通过计算来量化的。

基本的计算方法思想

1.未链接的页面分数为 1

未链接的页面分数为 1

2.有链接的页面得分为正在链接的页面的总得分

有链接的页面得分为正在链接的页面的总得分

3.当有多个网页的链接时,链接分数均匀分布

链接分数均匀分布

4.来自高度链接网页的链接具有很高的价值

该图中心页面有三个独立页面指向它的链接,所以它的分数是 3 。

首页有一个很大的分数,因为链接是从分数为 3 的页面指向它的。

在动画中的六个页面中,判断最上面的页面是最重要的页面----这是佩奇排名的基本思想。

基本的计算方法思想的循环问题

如果按照顺序来计算每个页面的分数时,那么就会出现问题:以这种方式计算,它将无限循环,并且在循环中的页面得分在任何地方都会很高。

循环的问题可以通过“随机游走模型”的计算方法来解决。

随机游走模型

以小猪佩奇浏览网页为例。

小猪佩奇开始访问「五分钟学算法」中有趣的页面,那么从这个左下角页面开始。

它们跟随一个链接并移动到另外的一个页面,看了一些之后,发现不敢兴趣了,这样就停止了浏览。

然后,又一天,它在小吴的推荐下,在完全不同的页面进行浏览,跟随一个链接并移动到另外的一个页面,一旦失去兴趣就停止浏览。

像这样,重复从某个页面开始浏览,移动几页后便停止的操作,如果从互联网空间一侧进行观察,就像网页浏览的人:重复移动页面几次后传送到一个完全不同的页面。

量化随机游走模型

假设1 - α代表选择当前页面中的一个链接的概率。

α代表该人将传送到其他页面的概率。

现在用随机游走模型 处理上述的循环问题。

如果总页面访问次数达到1000次之后,使用百分比进行表示:那么这个值就表示“在某个时间点查看页面的概率”。

更实用的计算方法

如图所示,现在来尝试计算复杂的链接网络中每个页面的分数。

现在均匀设置分数,使总分加起来为 1 。而后根据网页浏览者的移动,来计算每个页面的概率。

移动 n次时出现在 A 中的概率表示未PAn,移动 n 次时出现在 B 中的概率表示未PBn。

举一个例子,在移动 1 次之后求在 A 的概率PA 1。

在 C 选择移动的概率是1-α。

其中,移动到 A 的一种场景是,C 中的佩奇选择了移动而不是传送。另外,这里选择了 A 而不是 B 作为目的地。

并且,根据上面的当有多个网页的链接时,链接分数均匀分布这条规则,从 A 或 B 选择 A 的概率是 0.5 。

因此,从 C 移动到 A 的概率是PC0 ✖️ (1-α) ✖️ 0.5。

A 被选为传送目标的概率是 0.25

A 被选为传送目标的概率是 0.25 ,根据前面的理论:在 A、B、C、D 中小佩奇选择传送的概率为α。因此,通过传送移动到 A 的概率为α ✖️ 0.25。 所以,移动一次后在 A 的概率为 PA1 = PC0 ✖️ ( 1 - α ) ✖️ 0.5 + α ✖️ 0.25

其中PC0 = 0.25,α = 0.15,代入计算后PA1 = 0.14375。

这样,通过计算后 B 、 C 、D 页的概率也更新了。

B 、 C 、D 页的概率也更新了

上面在移动 1 次之后这四个页面的概率更新情况,根据上述相同的方法计算 2 次后小佩奇浏览在每个页面的概率。

移动 2 次后

同样的,经过大量的移动,在每个页面上的概率逐渐趋于固定值。当数值固定是,计算也就完成了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Web
    Web
    +关注

    关注

    2

    文章

    1302

    浏览量

    73618
  • 算法
    +关注

    关注

    23

    文章

    4760

    浏览量

    97121
  • 计算方法
    +关注

    关注

    0

    文章

    16

    浏览量

    10387

原文标题:你知道“啥是佩奇”,却不一定了解佩奇排名算法

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    单片机如何进行加解密钥操作,一般使用哪种形式,具体流程是什么样子的?

    目前单片机如何进行加解密钥操作,一般使用哪种形式,具体流程是什么样子的?
    发表于 12-04 06:09

    RISC-V 算法原理及串口通信

    具体方法 算法原理: 由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧或三帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝
    发表于 10-28 06:16

    如何使用恢复算法实现开平方运算

    本文主要描述如何使用恢复算法实现开平方运算。 简介 开平方的恢复算法其实与除法的恢复算法十分相似。首先我们假设X为输入的操作数(它应该为正数),而他的平方根可以表示为Qn=0.q1
    发表于 10-24 13:33

    AES和SM4算法的可重构分析

    为:Y=A(AX+C)^-1+C 。 通过对比以上两个计算公式可以发现,它们都具有的仿射变换操作和求逆操作,于是可以通过以下流程图对AES和SM4
    发表于 10-23 07:26

    AES加密流程

    。 字节替代:通过查找S盒(Substitution Box)中的值替代输入数据的每个字节。S盒是一个由固定字节值组成的查找表,用于替代输入数据中的字节值,增加了加密算法的复杂性。 行移位:按照特定
    发表于 10-23 06:13

    数据滤波算法具体实现步骤是怎样的?

      数据滤波算法在电能质量在线监测装置中的具体实现,需围绕 “ 数据采集→预处理→算法执行→参数适配→效果验证→结果输出 ” 的全流程展开,核心是结合装置硬件特性(采样率、ADC 精度
    的头像 发表于 10-10 16:45 419次阅读

    如何利用AI算法进行装置数据的异常检测?

    利用 AI 算法进行装置数据异常检测,需结合工业装置的数据特性(如实时性、多源性、强时序性、噪声干扰)和业务需求(如故障预警、安全合规、工艺优化),通过 “数据预处理 - 算法选型 -
    的头像 发表于 09-05 15:27 1104次阅读
    如何利用AI<b class='flag-5'>算法</b><b class='flag-5'>进行</b>装置数据的异常检测?

    【M-K1HSE开发板免费体验】相关源码之阅读和分析1-使用XComponent + Vsync 实现自定义动画

    Native 层的 EGL/OpenGL ES 进行高性能的自定义图形渲染,并通过 Vsync (垂直同步) 信号驱动动画的刷新,最终解决UI卡顿问题,实现流畅的自定义
    发表于 09-03 16:05

    【EASY EAI Orin Nano开发板试用体验】使用和LVGL的anim(简易动画)和animimg(图像动画)控件组合实现复杂的动画功能

    ,还需要重新计算X轴和Y轴的起始位置,算法非常复杂,容易出错,因此如果想要用一个anim变量实现多个变化,需要等待官方后续代码更新。 引入坐标表,就可以让obj沿着设定路径进行anim动画
    发表于 08-09 21:37

    基于RV1126开发板的AI算法开发流程

    AI算法开发流程由需求分析到准备数据,然后到选取模型,训练模型,接着模型转换后进行模型部署
    的头像 发表于 04-18 14:03 2028次阅读
    基于RV1126开发板的AI<b class='flag-5'>算法</b>开发<b class='flag-5'>流程</b>

    基于RV1126开发板的AI算法开发流程

    AI算法开发流程由需求分析到准备数据,然后到选取模型,训练模型,接着模型转换后进行模型部署
    的头像 发表于 04-18 10:47 836次阅读
    基于RV1126开发板的AI<b class='flag-5'>算法</b>开发<b class='flag-5'>流程</b>

    DLPC3433的gain具体通过调整什么实现的?

    我看规格书说是能调整R、G、B颜色通道的gain,这个gain具体通过调整什么实现的?是每个颜色通道里面的DMD占空比吗?
    发表于 02-26 07:48

    人脸识别技术的算法理解

    基于人的面部特征,通过计算算法识别或验证个人身份。这项技术通常包括以下几个步骤:人脸检测、特征提取、特征比对和身份确认。 2. 人脸检测 人脸检测是人脸识别
    的头像 发表于 02-06 17:50 2935次阅读

    算法加速的概念、意义、流程和应用

    运算通常需要高并行度或专门逻辑。算法加速就是把这些计算密集、规律性高的部分从通用 CPU 中“提取”出来,交给一个专门设计的硬件模块完成。 类比:如果把 CPU 想象成一位“通才”工人,什么都能做但速度有限;那么
    的头像 发表于 01-15 09:34 1105次阅读

    特种计算机哪家强,阿普模块变化忙

    说到特种计算机,你能想到?外观单调、难看、性能单一、除了稳定性高、I/O口多就一无是处了? 特种计算机产品资料你能想到?一连串看着一头雾水的参数? 这就是你对特种
    的头像 发表于 12-18 11:24 293次阅读
    特种<b class='flag-5'>计算</b>机哪家强,阿普<b class='flag-5'>奇</b>模块变化忙