0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文速览人岗匹配领域研究进展

深度学习自然语言处理 来源:RUC AI Box 2023-01-10 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文主要从文本匹配、历史行为偏好建模以及混合推荐三个角度介绍了当前人岗匹配中的主要模型与方法。

引言:随着互联网产业快速发展,网络招聘已经成为一种普遍的求职服务并从中衍生出了人岗匹配(Person-Job Fit,PJF)任务。与传统仅需关注用户兴趣偏好的商品或电影推荐不同,PJF这种双边场景下的推荐双方都存在主动行为及自身偏好,如求职者有自身的目标职位,工作职位也有对求职者的能力要求。正因这种双边建模需求,PJF涌现出了各种各样与传统推荐不同的模型与方法,其中,求职者简历与职位描述之间的文本匹配和从双方历史交互行为提取偏好信息成为了大家关注的重点。本文将主要从文本匹配、历史行为偏好建模以及混合推荐方法三个角度向大家介绍当前PJF中的主要模型与方法。欢迎大家批评指正,相互交流。

83dc9114-9011-11ed-bfe3-dac502259ad0.png

基于文本匹配的PJF

基于文本匹配的方法认为求职者与职位是否匹配主要依赖于求职者简历中的技能或工作经历与职位要求描述之间是否相对应,因此这种方法往往将PJF问题建模为一个简历与职位描述之间的文本匹配问题。早期的文本匹配方法中人们以一种无监督的方式创建文本的向量表示并计算相似度,如许多研究者使用具有TF-IDF权重的词袋,还有一些则基于Word2Vec方法。随着自然语言处理技术(NLP)的快速发展,CNN、RNN乃至Transformer等新型技术也开始应用于PJF问题并逐渐成为主流。本文选择了一小部分工作进行简单介绍。

【PJFNN】Person-Job Fit: Adapting the Right Talent for the Right Job with Joint Representation Learning (TMIS 2018)

https://dl.acm.org/doi/abs/10.1145/3234465

83ecd164-9011-11ed-bfe3-dac502259ad0.png

本文提出了一种基于卷积神经网络 (CNN) 的模型——PJFNN,PJFNN使用二分神经网络架构,对与职位要求描述以及求职者简历中的工作经历分别使用两个类似的CNN进行编码,它们之间唯一的不同是最后的pooling方法,职位要求使用Max-pooling,而求职者工作经历使用Mean-pooling。作者认为CNN最终输出的潜在表示的每个维度都可以反映专业知识的某些方面,职位的要求描述往往格式良好,不同要求项目通常独立的代表专业知识的不同方面。相比之下,求职者的每一项工作经历往往蕴含多种专业知识,因此更需要潜在表示之间的充分混合。

【APJFNN】Enhancing Person-Job Fit for Talent Recruitment: An Ability-aware Neural Network Approach (SIGIR 2018)

https://dl.acm.org/doi/abs/10.1145/3209978.3210025

与PJFNN基于CNN不同,本文中作者使用了LSTM+attention的方式进行求职者工作经历与职位要求的编码,在编码过程中两个部分的编码表示也不再相互独立,而是通过attention使得求职者工作经历与职位要求之间产生了充分的交互。整个模型的结构如下图:

84075dea-9011-11ed-bfe3-dac502259ad0.png

作者首先基于双向LSTM完成了单词级的表示(图中Word-level Representation),再通过两次attention完成了对职位要求的句子级表示以及全局表示(图中Job Requirement Representation),整个职位要求的编码表示过程与求职者部分独立。而对于求职者工作经历的编码则与职位要求息息相关,作者认为对于工作经历的编码过程应提取出与当前职位要求相关的信息,即工作经历中的某一项与当前职位的哪一个要求相匹配是关注的重点,因此在句子级以及全局表示的attention中都结合了职位要求表示完成(图中Candidate Experience Representation)。

【IPJF】Towards Effective and Interpretable Person-Job Fitting (CIKM 2019)

https://dl.acm.org/doi/abs/10.1145/3357384.3357949

841864c8-9011-11ed-bfe3-dac502259ad0.png

本文的亮点在于不仅仅考虑到了求职者与职位之间的双向匹配,还结合了求职者和职位双方各自的独立意图,提出了一个多任务框架。此外,作者不再将正例之外的所有目标都视为负例,而是将数据分为三种。以求职者为例,达成面试的职位为正例;求职者提出面试申请但遭到拒绝的职位为中性样本,代表单向意图;求职者没有提出面试申请的职位为负例。

【SCLPJF】Domain Adaptation for Person-Job Fit with Transferable Deep Global Match Network (EMNLP 2019)

https://aclanthology.org/D19-1487/

本文作者注意到了人岗匹配中带标签数据的稀缺问题,并希望通过领域适应(Domain Adaptation)的方法缓解这个问题。例如在招聘市场,科技领域的职位往往占比较大,数据较多,而设计相关的职位和数据较少,作者希望模型可以从具有足够标记数据的源域中获得的知识和信息来提高具有有限或很少标记数据的目标域中的预测性能。

8441818c-9011-11ed-bfe3-dac502259ad0.png

本文提出的模型主要分为Hierarchical Attention-based RNN Encoder和Global Match Representation两部分。前者基于双向GRU(BiGRU)对求职者简历和职位发布信息进行编码,并使用attention完成从单词级到句子级以及从句子级到全局表示的聚合,最终获得职位发布表示和简历表示。后者通过CNN建模职位发布与求职者简历之间的匹配信息。

为了实现模型在不同领域之间的可迁移性,作者首先使用文本领域自适应中的经典SCL算法得到相比于原始句子级表示更具可迁移性的SCL表示。其次将Global Match Representation中的匹配权重矩阵分解为两个矩阵的乘积,分别是多领域共享部分A和依托于特定领域的B;最后将卷积网络分为源域和目标域两部分实现了可迁移的匹配信息提取。

基于历史行为偏好的PJF

不同于基于文本匹配的方法,基于历史行为偏好的模型更注重于从求职者与职位双方的交互历史记录中提取出各自的偏好信息。虽然很多模型还会根据求职者简历与职位描述生成embedding,但不再通过各种复杂的方法进行简历文本与职位描述文本之间的匹配交互。

【DPGNN】Modeling Two-Way Selection Preference for Person-Job Fit (RecSys 2022)

https://dl.acm.org/doi/abs/10.1145/3523227.3546752

本篇文章获得了ACM RecSys 2022 Best Student Paper Runner-up。

85032ac6-9011-11ed-bfe3-dac502259ad0.png

本文提出了一种有别于单向选择推荐以及整体文本匹配建模的双视角图表示学习方法DPGNN。在双视角交互图中,作者为每个求职者(或职位)建模两个不同的节点,一个捕捉自己选择职位(或求职者)的偏好,是一种主动表示,另一个是被动表示,用于与对方的偏好进行匹配。作者使用BERT对求职者简历和职位描述进行编码,结合基于ID的embedding表示对双视角交互图中的节点进行初始化,之后使用GCN进行混合偏好传播,区别于原始的GCN,DPGNN为单向偏好边和双向匹配边的信息传播赋予了不同的权重。在最终匹配预测上,DPGNN结合了两个视角的意图(求职者选择职位和职位选择求职者)。此外,作者还针对性的设计了一种四元组损失,为每一对求职者—职位正例分别采样一个负例求职者和一个负例职位。

【JRMPM】Interview Choice Reveals Your Preference on the Market: To Improve Job-Resume Matching through Proling Memories (KDD 2019)

https://dl.acm.org/doi/abs/10.1145/3292500.3330963

8531db14-9011-11ed-bfe3-dac502259ad0.png

本文中作者提出了一种结合历史偏好的匹配网络(JRMPM),关键思想是从职位或求职者历史交互目标的文本信息中提取潜在偏好。具体来说,作者提出了一种基于记忆模块的偏好更新机制,以职位的偏好为例,JRMPM模型通过一个记忆矩阵M记录职位的句子级潜在偏好,并根据时间顺序,一步步根据职位历史交互求职者的简历信息更新记忆矩阵M。同理,对于求职者来说则是根据其历史交互职位的描述信息更新记忆矩阵。最终,通过Max-pooling将求职者与职位的句子级偏好记忆矩阵转换为全局偏好向量并输入MLP得到匹配预测结果。

【DPJF-MBS】Beyond Matching: Modeling Two-Sided Multi-Behavioral Sequences for Dynamic Person-Job Fit (DASFAA 2021)

https://link.springer.com/chapter/10.1007/978-3-030-73197-7_24

本文中,作者将关注点落到了求职者和招聘职位双方在实现匹配之前产生的丰富的辅助行为,如点击、申请、聊天等,不同于在PJF问题中非常稀疏的匹配行为,这些辅助行为往往更为密集且蕴含丰富的偏好信息。

8573f594-9011-11ed-bfe3-dac502259ad0.png

整个模型(DPJF-MBS)分为两个部分,Write Operation根据时间顺序将多种行为信息更新于记忆矩阵M中,Read Operation则从记忆矩阵中读出不同行为的偏好信息。具体来说,模型包含多个用户共享的全局键矩阵{,,,, },在Write Operation过程中,将当前行为对应的全局键矩阵当作key计算attention权重用于更新偏好记忆矩阵M,在Read Operation过程中也将根据不同的全局键矩阵计算不同的行为偏好权重,并根据权重聚合记忆矩阵M生成多个行为偏好向量。此外,作者还敏锐的注意到了多种行为之间的级联关系,例如在达成匹配的前提是经历过点击、申请等前置行为,因此最终的匹配预测是一个级联过程,对于匹配的判断需要前置行为的输出作为输入。

混合推荐方法

结合文本匹配与历史行为偏好建模的PJF方法也是研究者们的研究热点,这些方法往往是将从双方文本中提取的显式偏好与从历史行为中获得的隐式偏好相结合完成推荐。下面笔者选择了一部分工作进行介绍。

【PJFFF】Learning Effective Representations for Person-Job Fit by Feature Fusion (CIKM 2020)

https://dl.acm.org/doi/abs/10.1145/3340531.3412717

本文中提出了一种结合特征融合、文本匹配以及历史行为偏好建模的PJF模型,整个模型分为两个部分,一部分以求职者简历和职位描述中的显式信息为输入,另一部分建模双方的历史行为序列,建模隐式偏好特征。

859adaf6-9011-11ed-bfe3-dac502259ad0.png

在简历或职位描述中除了技能描述、职位要求等文本信息外,还有一些可以通过NLP技术提取出的语义实体,如年龄、性格、大学等等,本文作者将这些实体也作为显式信息输入,通过DeepFM模型完成建模,对于文本信息则使用CNN得到向量表示,最终两种显示特征concat作为第一部分的输出。

85b21acc-9011-11ed-bfe3-dac502259ad0.png

模型第二部分则通过两个LSTM对求职者和职位的历史行为进行建模,用于提取双方的隐式特征,模型输入是第一部分获得的显式特征与匹配结果onehot向量的拼接。最终的预测过程中首先将双方的显式特征与隐式特征拼接,之后通过内积得到匹配得分。

【PJFCANN】Person-job fit estimation from candidate profile and related recruitment history with Co-Attention Neural Networks (Neurocomputing 2022)

https://www.sciencedirect.com/science/article/pii/S0925231222007299

85c2f090-9011-11ed-bfe3-dac502259ad0.png

本文将文本匹配与从历史交互记录中提取的关系图相结合。文本匹配部分通过mashRNN实现了单词级编码,之后通过co-attention完成了简历与职位描述间的匹配交互与句子级编码,最终基于另一个简单的attention获得文本的本地(local)编码向量。此外,作者根据历史交互记录建立了职位—职位和求职者—求职者之间的关系图,以职位与职位之间的关系图为例,假设我们需要预测的job—resume对为 (J, R),若另一职位 J' 与当前简历 R 也产生过交互则在 J 与 J' 之间建立一条边,这条边的权重通过两个职位描述信息的相似度得到。获得两个关系图后通过GNN得到图中各个节点的表示,并基于attention机制获得职位和求职者简历的全局(global)表示。最终的匹配预测同样基于MLP实现。

其他

除了上述几类方法外,还有很多其他方法,例如基于特征工程的传统机器学习方法,基于单边偏好建模的职位推荐,灵活运用用户搜索历史或其他辅助数据的方法等。

The Influence of Feature Selection on Job Clustering for an E-recruitment Recommender System (2020):基于特征选择与提取。

A Session-based Job Recommendation System Combining Area Knowledge and Interest Graph Neural Networks (2020):加入领域知识增强的单边序列推荐。

Using autoencoders for session‑based job recommendations (2020):基于autoencoder的单边序列推荐。

Learning to Match Jobs with Resumes from Sparse Interaction Data using Multi-View Co-Teaching Network (2020):为了缓解PJF任务中交互数据稀疏且嘈杂的问题,作者提出了一种基于稀疏交互数据的新型多视图协同教学网络,结合基于文本匹配的模型和基于关系的模型,两个部分采用协同教学机制来减少噪声对训练数据的影响。核心思想是让两个组件通过选择更可靠的训练实例来相互帮助。

Leveraging Search History for Improving Person-Job Fit (2022):不再局限于求职者与职位之间的历史匹配记录,而是结合了求职者的搜索历史信息进行偏好建模。

Job Recommendation Based on Extracted Skill Embeddings (2022):从求职者简历与职位要求描述中提取技能短语,使用Word2Vec编码后计算相似度。

小结

本文从文本匹配、历史行为偏好建模以及混合推荐方法三个角度向大家介绍了当前人岗匹配中的主要模型与方法,可以看到,单纯基于文本匹配的人岗匹配方法在最新的研究中较少出现,随着BERT等系列大规模预训练语言模型的快速涌现,文本匹配任务也不再局限于简单的监督训练,最近的很多PJF工作中都将BERT作为一个基线且表现出不俗的性能,因此结合对历史行为偏好的建模是当前人岗匹配研究的主要方向。但同时人岗匹配的实际场景使得交互数据非常稀疏,如何解决数据稀疏也是当前的一大研究热点。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52265
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23537
  • 自然语言处理

    关注

    1

    文章

    630

    浏览量

    14717
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新品|乐鑫ESP32-H21重磅登场!

    乐鑫科技(Espressif)再次推出重磅新品——ESP32-H21。作为乐鑫科技级代理商,启明云端当然要第时间为大家带来这款MCU系统级芯片(SoC)的解读!本期启明云端带你
    的头像 发表于 04-14 18:03 500次阅读
    新品<b class='flag-5'>速</b><b class='flag-5'>览</b>|乐鑫ESP32-H21重磅登场!

    技术资讯 I 通 MCM 封装

    本文要点MCM封装将多个芯片集成在同基板上,在提高能效与可靠性的同时,还可简化设计并降低成本。MCM封装领域的最新进展包括有机基板、重分布层扇出、硅中介层和混合键合。这些技术能够提升MCM
    的头像 发表于 12-12 17:10 7378次阅读
    技术资讯 I <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>速</b>通 MCM 封装

    MCU软件核心库及示例代码

    为加速嵌入式项目开发,本文对MCU软件核心库进行整体,涵盖初始化、外设控制与中断处理等关键部分,并结合简洁示例代码,帮助开发者快速理解与应用库功能。 、MCU核心库函数功能 MCU核心库
    的头像 发表于 12-11 17:19 840次阅读
    MCU软件核心库及示例代码<b class='flag-5'>速</b><b class='flag-5'>览</b> !

    科学岛团队在高增益光纤固体混合单频Innoslab激光放大技术方面取得研究进展

    图 1 光纤固体混合Innoslab放大器示意图 近期,中国科学院合肥物质院安光所张天舒研究员课题组在光纤固体混合单频Innoslab激光放大技术研究方面取得新进展,相关成果发表在国际知名光学
    的头像 发表于 12-05 06:44 276次阅读
    科学岛团队在高增益光纤固体混合单频Innoslab激光放大技术方面取得<b class='flag-5'>研究进展</b>

    库拉日雪山:读懂美的AI版图

    “科技月”三十年,美的用AI筑起库拉日雪山
    的头像 发表于 11-03 19:52 9709次阅读
    库拉<b class='flag-5'>岗</b>日雪山:读懂美的AI版图

    多光谱图像颜色特征用于茶叶分类的研究进展

    多光谱成像技术结合颜色特征分析为茶叶分类提供了高效、非破坏性的解决方案。本文系统综述了该技术的原理、方法、应用案例及挑战,探讨了其在茶叶品质分级、品种识别和产地溯源中的研究进展,并展望了未来发展方向
    的头像 发表于 10-17 17:09 757次阅读
    多光谱图像颜色特征用于茶叶分类的<b class='flag-5'>研究进展</b>

    划重点!浦江开源鸿蒙生态大会金句

    划重点!浦江开源鸿蒙生态大会金句
    的头像 发表于 10-16 17:29 998次阅读
    划重点!<b class='flag-5'>一</b>图<b class='flag-5'>速</b><b class='flag-5'>览</b>浦江开源鸿蒙生态大会金句

    高光谱成像在作物病虫害监测的研究进展

    特性会发生显著变化,例如: 叶绿素含量下降 :导致可见光波段(400-700 nm)反射率异常 细胞结构破坏 :引起近红外波段(700-1300 nm)散射特征改变 水分与糖分异常 :影响短波红外波段(1300-2500 nm)吸收峰分布 研究进展与关键技术突破 ()光
    的头像 发表于 10-16 15:53 678次阅读
    高光谱成像在作物病虫害监测的<b class='flag-5'>研究进展</b>

    NVIDIA展示机器领域研究成果

    在今年的机器科学与系统会议 (RSS) 上,NVIDIA 研究中心展示了系列推动机器人学习的研究成果,展示了在仿真、现实世界迁移和决策制定领域
    的头像 发表于 07-23 10:43 1638次阅读

    微双重驱动的新型直线电机研究

    摘罢:大行程、高精度,同时易于小型化的移动机构是先进制造业等领域要解决的关键问题之,综述了现有宏/微双重驱动机构和直线超声电机的研究进展和存在问题,提出了种宏微双重驱动新型直线压电
    发表于 06-24 14:17

    双电机后轮驱动混合动力汽车电子差控制的研究

    电机后轮驱动混合动力汽车电子差控制的研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第时间告知,删除内容!
    发表于 06-18 16:39

    升降曲线对直线电机系统性能影响的研究

    摘要:对次速度曲线升降,二次速度曲线升降,三次速度曲线升降以及三角函数速度曲线升降曲线进行了分析,并对后3种升降
    发表于 06-17 08:48

    轮式移动机器电机驱动系统的研究与开发

    【摘 要】以嵌入式运动控制体系为基础,以移动机器人为研究对象,结合三轮结构轮式移动机器,对二轮差驱动转向自主移动机器运动学和动力学空间模型进行了分析和计算,
    发表于 06-11 14:30

    氧化镓射频器件研究进展

    ,首先介绍了 Ga2O3在射频器件领域的优势和面临的挑战,然后综述了近年来 Ga2O3射频器件在体掺杂沟道、AlGaO/Ga2O3调制 掺杂异质结以及与高导热衬底异质集成方面取得的进展,并对研究结果进行了讨论,最后展望了未来 G
    的头像 发表于 06-11 14:30 2756次阅读
    氧化镓射频器件<b class='flag-5'>研究进展</b>

    驱动未来 | 功率放大器基础知识及经典应用!

    弹性体、超声电机、扬声器等等)的放大器。组成:功率放大器可以由以下几个部分组成:模拟前端电路、增益控制电路、功率放大电路、输入输出匹配电路。功率放大器的分类分类:我们
    的头像 发表于 05-22 18:47 1687次阅读
    驱动未来 | <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>速</b><b class='flag-5'>览</b>功率放大器基础知识及经典应用!