0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

视达科用户画像精准定位,大数据为用户提供高质量服务

B8oI_iptvott 来源:未知 作者:胡薇 2018-04-16 08:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着互联网逐渐步入大数据时代,运营商和用户的行为不可避免的发生了改变和重塑。最为突出的变化是,大数据使得用户行为“可视化”。利用海量数据精准生成的“用户画像”,可以使营销推广更加的精准、高效,这也成为了视频营销不可或缺的技术手段之一。

相较于传统的用户画像,视达科用户画像基于用户行为轨迹的实时追踪和模型计算生成,用户画像更加细致,更注重细节拆分,进一步提高特征描绘的精准度,能够精准定位不同用户的观影需求,从而提升服务质量。

(视达科用户画像系统架构)

一、 使用改进的TF-IDF算法计算标签权重

在TF-IDF的基础上,考虑了不同行为有不同的权重,且标签会随着时间而变化衰减。为了提高用户标签的准确度,视达科用户画像采用改进的IF-IDF算法计算标签权重。

标签值上的weights字段值,代表着2层意义:这个用户的某标签,其多个标签值之间的重要程度;对于某标签的一个标签值,所有用户之间的重要程度。

例如:用户喜欢的影片类型这个标签来说,会有多个标签值:喜剧片、爱情片、恐怖片、科幻片...某用户A,这标签的几个值:科幻片的权重是0.5,喜剧片的权重是0.3,则说明这用户更喜欢“科幻片”。另一用户B,这标签的几个值:科幻片的权重是0.7,恐怖片的权重是0.1,则说明用户B比用户A更喜欢科幻片。

TF-IDF权重函数:

w(u, t, T) = TF(u, t, T) * IDF(t, T) * degree(u, t, T) * (1 / (1 + decay(T) ) ) + w(u, t, T-1) * (decay(T) / (1 + decay(T)))

一、 多重召回策略,对海量数据进行筛选过滤

如何在海量的视频内容中,筛选出一个模型组成内容库。视达科采用了多种召回策略,综合考虑视频的热度、相似度、动作等,根据用户兴趣标签对视频内容做截断,高效从庞大的内容库中筛选符合用户喜好的一小部分内容。

(1)协同过滤召回

包括基于视频、基于用户的协同过滤推荐,前者依照视频之间的相似性,将相似影片推荐给同一位用户。例如:影片A与影片B相似,用户喜欢影片A,则将影片B也推荐给用户;后者依照用户之间的相似性,将同一影片推荐给相似用户,例如用户A与用户B相似,用户A喜欢影片A,则将影片A也推荐给用户B。

(2)热榜召回

基于视频播放频率,形成视频热播榜单,将热门影片推荐给其他用户。例如:影片A在本时段内播放次数增多,成为热播榜影片,则将影片A推荐给其他用户。

(3)其他召回

除了上述两种常规召回策略,我们还使用了喜好召回、人工规则召回等多重召回策略,把一个海量、无法把握的内容库,变成一个相对小、可以把握的内容库,再进入推荐模型。这样能够有效平衡计算成本和效果。

三、精准排序模型,实现个性化推荐

在用户意图明确时,我们用搜索引擎来解决视频内容库太大的问题,但当用户的意图不明确或者很难用清晰的语义表达,搜索引擎就无能为力。视达科通过精准的排序模型,将筛选后的小型内容库进行重新排序,在用户完全没有需求目标的情况下给出的全局推荐,为其推送个性化的视频内容。

(1)GBDT+LR

GBDT(Gradient Boost Decision Tree)是非线性模型,会建立多棵决策树,但每棵树拟合的是上一棵树的残差。

LR是广义线性模型,速率快,对特征和特征组合要求高,在传统效果预测方面使用广泛。

使用GBDT结合LR进行推荐预测,facebook在2014年就进行了实践,取得了很好的效果。

我们使用用户画像出来的兴趣爱好、年龄、时段、时长等特征与用户实际播放的影片的标签属性、演员、导演等特征作为输入GBDT的输入,GBDT的叶子结点作为LR的输入进行训练。推荐时使用该模型对被推荐用户的召回集影片做预测排序,将靠前的推荐出去。

(2)深宽度模型

宽深度(Wide and deep)模型是谷歌2016年发布的,并在Google Play的应用推荐中实际使用,是经过检验的模型。

宽度模型用的是逻辑回归,形式如下:

,其中X是特征向量,W是特征权重,b是偏置。

深度模型通过DNN来提供泛化能力,每个隐层激活方式表示如下:

其中l表示第l个隐藏层,f是激活函数 。

深宽度模型最后的输出过程公式表示就是:

是sigmoid函数 ,是组合特征,是深度模型输出的权重,

宽深度模型结合传统线性模型和深度模型,能兼顾记忆和归纳。宽度模型能根据历史播放、浏览等行为相关性,推荐关联产品;深度模型用于发现历史行为中出现很少或未出现的特征组合。

四、智能调优,提高推荐准确度

采用智能调优技术,将推荐效果进行评估,系统根据评估结果自动对各种推荐算法进行比例调优,不断自动迭代,实现推荐准确度优化提高的技术。

通过调整各类推荐算法间的分配比例,每次推荐任务会将任务分配给不同的推荐引擎,最终通过结果评估观测哪种推荐引擎推荐效果更好,效果更好的下次自动分配更高比例任务。

基于改进的TF-IDF算法计算标签权重,采取多重召回策略并进行精准排序,利用智能调优技术,对用户画像进行精准刻画,我们得以实时、精确、全面的了解用户诉求,为用户的个性化服务提供及时有效的数据支撑,全方位提升用户体验,进一步提高视频运营服务质量。

企业简介

视达科,初灵信息(股票代码:300250)全资子公司,以“创造一流视频体验”为愿景,通过数据推动决策与运营,助力合作伙伴的视频业务不断增长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    55

    文章

    11321

    浏览量

    108894
  • 大数据
    +关注

    关注

    64

    文章

    9031

    浏览量

    143093
  • 用户画像
    +关注

    关注

    0

    文章

    7

    浏览量

    2541

原文标题:【深度】基于视达科用户画像,精准定位用户需求

文章出处:【微信号:iptvott,微信公众号:流媒体网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    巧用拼多多API,精准定位下沉市场,销量一路狂飙!

    ,如何精准服务好这部分用户群体,是提升销量的关键。本文将探讨如何利用拼多多开放平台提供的API,实现
    的头像 发表于 12-11 14:48 47次阅读
    巧用拼多多API,<b class='flag-5'>精准定位</b>下沉市场,销量一路狂飙!

    广电计量创新服务体系助力商业航天高质量发展

    显著增强的发展目标。以“技术平台+智能设备+产业协同”核心引擎,构建起覆盖卫星全生命周期的创新服务体系,商业航天高质量发展持续注入新动能。
    的头像 发表于 11-27 17:22 942次阅读

    京东:调用用户画像API实现千人千面推荐,提升转化率

    ​  引言 在电商领域,个性化推荐已成为提升用户粘性和转化率的核心引擎。京东通过深度整合用户画像API,实现了"千人千面"的精准推荐系统。本文将解析其技术逻辑与业务价值,揭示如何通过
    的头像 发表于 09-12 15:08 620次阅读
    京东:调用<b class='flag-5'>用户</b><b class='flag-5'>画像</b>API实现千人千面推荐,提升转化率

    标贝科技参编《人工智能高质量数据集建设指南》

    联盟数据委员会共同发布《人工智能高质量数据集建设指南》,旨在为业界建设高质量数据提供有实操价值的指导和参考。标贝科技深度参与指南的编制工作,将产业实践经验转化为标准框架,
    的头像 发表于 09-11 17:19 705次阅读

    易华录入选国家首批高质量数据集建设先行先试工作名单

    8月28日下午,在2025中国国际大数据产业博览会上,国家数据局发布了首批高质量数据集建设先行先试工作名单。经中国电推荐、国家数据局评审,
    的头像 发表于 09-04 09:04 814次阅读

    国创基础资源库正式开放:海量高质量国家级数据底座,企业降本增效持续赋能

    近日,国创基础资源库宣布正式开放。作为聚焦制造业基础数据共享的底座,该平台以海量高质量数据支撑,精准解决资源分散、信息壁垒等行业痛点,
    的头像 发表于 08-29 14:24 1322次阅读
    国创基础资源库正式开放:海量<b class='flag-5'>高质量</b>国家级<b class='flag-5'>数据</b>底座,<b class='flag-5'>为</b>企业降本增效持续赋能

    用小红书电商 API 实现小红书店铺商品用户画像精准构建

    ​ 在当今社交电商时代,小红书作为领先的内容电商平台,拥有海量用户数据和商品信息。店铺通过构建精准用户画像,能实现个性化推荐、提升转化率和用户
    的头像 发表于 08-28 15:57 440次阅读
    用小红书电商 API 实现小红书店铺商品<b class='flag-5'>用户</b><b class='flag-5'>画像</b><b class='flag-5'>精准</b>构建

    索尼重载设备的高质量远程制作方案和应用(2)

    索尼的远程制作可以被称之为制作级的高质量远程制作,或重载设备的高质量远程制作,远程设备结合常规系统设备,提供和本地制作类似的制作级高质量图像,延续电视台/制作公司的设备特点和优势。
    的头像 发表于 08-21 15:56 896次阅读
    索尼重载设备的<b class='flag-5'>高质量</b>远程制作方案和应用(2)

    大模型时代,如何推进高质量数据集建设?

    高质量数据集,即具备高价值、高密度、标准化特征的数据集合。 在AI领域,高质量数据集地位举足轻重,如同原油经炼化成为汽油驱动汽车,海量原始数据需转化为
    的头像 发表于 08-21 13:58 548次阅读

    Aisler 发布 Lovely Library:一个 KiCad 打造的高质量欧洲元器件库

    “  看到 Aisler 的推文,觉得挺搞笑的,原来元器件库也可以有地域之分; 不过对用户来说,更多的高质量器件库一定会让设计更高效。好东西还是要分享!  ”   以上的内容翻译如下: 我们很高
    的头像 发表于 08-04 11:13 644次阅读
    Aisler 发布 Lovely Library:一个<b class='flag-5'>为</b> KiCad 打造的<b class='flag-5'>高质量</b>欧洲元器件库

    还在凭感觉做画像?GWI 利用大数据精准绘制核心客户群

    当前企业构建客户画像常受限于滞后的人口统计数据和模糊标签(如“都市年轻人”),导致营销精准度不足。GWI 消费者洞察工具通过整合全球实时行为数据与AI分析能力(Spark),以四步法构
    的头像 发表于 07-29 13:28 573次阅读
    还在凭感觉做<b class='flag-5'>画像</b>?GWI 利用<b class='flag-5'>大数据</b><b class='flag-5'>精准</b>绘制核心客户群

    东风汽车积极推动汽车产业高质量发展

    东风汽车作为汽车央企,将继续坚持长期主义,坚守用户价值,筑牢安全底线,拒绝“内卷式”竞争,摒弃短期主义和功利思维,用户打造高品质汽车,以自身的高质量发展推动产业健康发展,推动汽车强国
    的头像 发表于 06-10 10:01 799次阅读

    UWB模块SKU609:精准定位与多功能融合的卓越之选

    ,减少盗窃行为的发生。同时,顾客提供导航服务,帮助他们迅速定位所需商品,从而提升购物体验。此外,通过分析顾客的行为轨迹,零售商能够深入了解顾客的购物习惯和需求,
    发表于 03-07 09:39

    广汽集团召开高质量发展大会

    春回大地,万象更新。近两日广东省、广州市聚焦“建设现代化产业体系”主题,相继召开“新春第一会”——高质量发展大会,吹响奋进号角。广汽集团党委书记、董事长冯兴亚作为省市重点产业高质量发展代表参加会议,与产学研各界代表共聚一堂,共绘广东、广州
    的头像 发表于 02-07 10:18 1028次阅读

    顶坚国产芯单北斗执法仪:精准定位铁路隐患,保障行车安全

    顶坚国产芯单北斗执法仪,是一款集成了北斗卫星导航系统和先进技术的执法设备,依托北斗卫星导航系统的高精度定位技术,精准捕捉铁路沿线隐患,行车安全筑起坚实防线,确保铁路交通顺畅无阻,它在铁路安全监控
    的头像 发表于 01-09 15:25 651次阅读
    顶坚国产芯单北斗执法仪:<b class='flag-5'>精准定位</b>铁路隐患,保障行车安全