您好,欢迎来电子发烧友网! ,新用户?[免费注册]

您的位置:电子发烧友网>源码下载>数值算法/人工智能>

基于Web日志仿真生成WLSG算法

大小:0.84 MB 人气: 2017-12-08 需要积分:1

  大数据规模的激增,给数据处理的服务平台带来不可预知的后果。对Web服务日志的分析,不仅能够帮助服务平台有效预防网络异常的产生,也能对服务平台进行压力测试分析,有利于提升服务平台的可靠性。然而Web日志中包含用户隐私信息,企业及政府等机构极少愿意公开日志供研究人员使用;同时,现已公开的Web日志数据年代久远,其特征不符合当前大数据时代特征H1。如何仿真生成逼真的Web日志,是学术界的热点问题,也是本文研究的方向。以中国科学院的可伸缩大数据生成组件(Scalable Big Data Cenerator SuiteBDCS)为代表的Web日志生成器不仅能够用于Web服务器压力测试和性能研究,而且具有很高的扩展性。但有一个显著的缺点是:Web日志的时间依赖性表达能力很弱;以动态Web代理缓存负载生成器(Proxy Workload Generator.ProWGen)为代表的日志生成器能较好地以时间局部性拟合Web文件特征,却是采用静态分布模型。当前随着应用需求的日益扩大,要求生成器的仿真性能较高,这给Web日志生成方法带来了严重的挑战。事实上,当出现热点时,数据会表现为突发性地围绕热点动态变化。但当前已有的Web日志生成器主要是基于静态数据分布设计的,忽略了分布的动态性和用户行为的复杂性,虽然引入了Web文件的时间局部性,却没有站在时间角度来衡量Web文件的时间局部性。

  针对此问题,本文提出一种动态仿真模型——基于用户兴趣迁移的Web日志仿真生成(Web Log Simulation Ceneration based on user interest migration, WLSG)算法。该WLSC算法对用户属性、Web文件属性分别和时间的依赖关系进行建模,也融入了用户兴趣迁移以及自适应访问兴趣度高的Web文件,能够生成具有强的时间依赖性,用户访问顺序可调,且包含用户的个性化特征的逼真日志数据。

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

      发表评论

      用户评论
      评价:好评中评差评

      发表评论,获取积分! 请遵守相关规定!