0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文速览人岗匹配领域研究进展

深度学习自然语言处理 来源:RUC AI Box 2023-01-10 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文主要从文本匹配、历史行为偏好建模以及混合推荐三个角度介绍了当前人岗匹配中的主要模型与方法。

引言:随着互联网产业快速发展,网络招聘已经成为一种普遍的求职服务并从中衍生出了人岗匹配(Person-Job Fit,PJF)任务。与传统仅需关注用户兴趣偏好的商品或电影推荐不同,PJF这种双边场景下的推荐双方都存在主动行为及自身偏好,如求职者有自身的目标职位,工作职位也有对求职者的能力要求。正因这种双边建模需求,PJF涌现出了各种各样与传统推荐不同的模型与方法,其中,求职者简历与职位描述之间的文本匹配和从双方历史交互行为提取偏好信息成为了大家关注的重点。本文将主要从文本匹配、历史行为偏好建模以及混合推荐方法三个角度向大家介绍当前PJF中的主要模型与方法。欢迎大家批评指正,相互交流。

83dc9114-9011-11ed-bfe3-dac502259ad0.png

基于文本匹配的PJF

基于文本匹配的方法认为求职者与职位是否匹配主要依赖于求职者简历中的技能或工作经历与职位要求描述之间是否相对应,因此这种方法往往将PJF问题建模为一个简历与职位描述之间的文本匹配问题。早期的文本匹配方法中人们以一种无监督的方式创建文本的向量表示并计算相似度,如许多研究者使用具有TF-IDF权重的词袋,还有一些则基于Word2Vec方法。随着自然语言处理技术(NLP)的快速发展,CNN、RNN乃至Transformer等新型技术也开始应用于PJF问题并逐渐成为主流。本文选择了一小部分工作进行简单介绍。

【PJFNN】Person-Job Fit: Adapting the Right Talent for the Right Job with Joint Representation Learning (TMIS 2018)

https://dl.acm.org/doi/abs/10.1145/3234465

83ecd164-9011-11ed-bfe3-dac502259ad0.png

本文提出了一种基于卷积神经网络 (CNN) 的模型——PJFNN,PJFNN使用二分神经网络架构,对与职位要求描述以及求职者简历中的工作经历分别使用两个类似的CNN进行编码,它们之间唯一的不同是最后的pooling方法,职位要求使用Max-pooling,而求职者工作经历使用Mean-pooling。作者认为CNN最终输出的潜在表示的每个维度都可以反映专业知识的某些方面,职位的要求描述往往格式良好,不同要求项目通常独立的代表专业知识的不同方面。相比之下,求职者的每一项工作经历往往蕴含多种专业知识,因此更需要潜在表示之间的充分混合。

【APJFNN】Enhancing Person-Job Fit for Talent Recruitment: An Ability-aware Neural Network Approach (SIGIR 2018)

https://dl.acm.org/doi/abs/10.1145/3209978.3210025

与PJFNN基于CNN不同,本文中作者使用了LSTM+attention的方式进行求职者工作经历与职位要求的编码,在编码过程中两个部分的编码表示也不再相互独立,而是通过attention使得求职者工作经历与职位要求之间产生了充分的交互。整个模型的结构如下图:

84075dea-9011-11ed-bfe3-dac502259ad0.png

作者首先基于双向LSTM完成了单词级的表示(图中Word-level Representation),再通过两次attention完成了对职位要求的句子级表示以及全局表示(图中Job Requirement Representation),整个职位要求的编码表示过程与求职者部分独立。而对于求职者工作经历的编码则与职位要求息息相关,作者认为对于工作经历的编码过程应提取出与当前职位要求相关的信息,即工作经历中的某一项与当前职位的哪一个要求相匹配是关注的重点,因此在句子级以及全局表示的attention中都结合了职位要求表示完成(图中Candidate Experience Representation)。

【IPJF】Towards Effective and Interpretable Person-Job Fitting (CIKM 2019)

https://dl.acm.org/doi/abs/10.1145/3357384.3357949

841864c8-9011-11ed-bfe3-dac502259ad0.png

本文的亮点在于不仅仅考虑到了求职者与职位之间的双向匹配,还结合了求职者和职位双方各自的独立意图,提出了一个多任务框架。此外,作者不再将正例之外的所有目标都视为负例,而是将数据分为三种。以求职者为例,达成面试的职位为正例;求职者提出面试申请但遭到拒绝的职位为中性样本,代表单向意图;求职者没有提出面试申请的职位为负例。

【SCLPJF】Domain Adaptation for Person-Job Fit with Transferable Deep Global Match Network (EMNLP 2019)

https://aclanthology.org/D19-1487/

本文作者注意到了人岗匹配中带标签数据的稀缺问题,并希望通过领域适应(Domain Adaptation)的方法缓解这个问题。例如在招聘市场,科技领域的职位往往占比较大,数据较多,而设计相关的职位和数据较少,作者希望模型可以从具有足够标记数据的源域中获得的知识和信息来提高具有有限或很少标记数据的目标域中的预测性能。

8441818c-9011-11ed-bfe3-dac502259ad0.png

本文提出的模型主要分为Hierarchical Attention-based RNN Encoder和Global Match Representation两部分。前者基于双向GRU(BiGRU)对求职者简历和职位发布信息进行编码,并使用attention完成从单词级到句子级以及从句子级到全局表示的聚合,最终获得职位发布表示和简历表示。后者通过CNN建模职位发布与求职者简历之间的匹配信息。

为了实现模型在不同领域之间的可迁移性,作者首先使用文本领域自适应中的经典SCL算法得到相比于原始句子级表示更具可迁移性的SCL表示。其次将Global Match Representation中的匹配权重矩阵分解为两个矩阵的乘积,分别是多领域共享部分A和依托于特定领域的B;最后将卷积网络分为源域和目标域两部分实现了可迁移的匹配信息提取。

基于历史行为偏好的PJF

不同于基于文本匹配的方法,基于历史行为偏好的模型更注重于从求职者与职位双方的交互历史记录中提取出各自的偏好信息。虽然很多模型还会根据求职者简历与职位描述生成embedding,但不再通过各种复杂的方法进行简历文本与职位描述文本之间的匹配交互。

【DPGNN】Modeling Two-Way Selection Preference for Person-Job Fit (RecSys 2022)

https://dl.acm.org/doi/abs/10.1145/3523227.3546752

本篇文章获得了ACM RecSys 2022 Best Student Paper Runner-up。

85032ac6-9011-11ed-bfe3-dac502259ad0.png

本文提出了一种有别于单向选择推荐以及整体文本匹配建模的双视角图表示学习方法DPGNN。在双视角交互图中,作者为每个求职者(或职位)建模两个不同的节点,一个捕捉自己选择职位(或求职者)的偏好,是一种主动表示,另一个是被动表示,用于与对方的偏好进行匹配。作者使用BERT对求职者简历和职位描述进行编码,结合基于ID的embedding表示对双视角交互图中的节点进行初始化,之后使用GCN进行混合偏好传播,区别于原始的GCN,DPGNN为单向偏好边和双向匹配边的信息传播赋予了不同的权重。在最终匹配预测上,DPGNN结合了两个视角的意图(求职者选择职位和职位选择求职者)。此外,作者还针对性的设计了一种四元组损失,为每一对求职者—职位正例分别采样一个负例求职者和一个负例职位。

【JRMPM】Interview Choice Reveals Your Preference on the Market: To Improve Job-Resume Matching through Proling Memories (KDD 2019)

https://dl.acm.org/doi/abs/10.1145/3292500.3330963

8531db14-9011-11ed-bfe3-dac502259ad0.png

本文中作者提出了一种结合历史偏好的匹配网络(JRMPM),关键思想是从职位或求职者历史交互目标的文本信息中提取潜在偏好。具体来说,作者提出了一种基于记忆模块的偏好更新机制,以职位的偏好为例,JRMPM模型通过一个记忆矩阵M记录职位的句子级潜在偏好,并根据时间顺序,一步步根据职位历史交互求职者的简历信息更新记忆矩阵M。同理,对于求职者来说则是根据其历史交互职位的描述信息更新记忆矩阵。最终,通过Max-pooling将求职者与职位的句子级偏好记忆矩阵转换为全局偏好向量并输入MLP得到匹配预测结果。

【DPJF-MBS】Beyond Matching: Modeling Two-Sided Multi-Behavioral Sequences for Dynamic Person-Job Fit (DASFAA 2021)

https://link.springer.com/chapter/10.1007/978-3-030-73197-7_24

本文中,作者将关注点落到了求职者和招聘职位双方在实现匹配之前产生的丰富的辅助行为,如点击、申请、聊天等,不同于在PJF问题中非常稀疏的匹配行为,这些辅助行为往往更为密集且蕴含丰富的偏好信息。

8573f594-9011-11ed-bfe3-dac502259ad0.png

整个模型(DPJF-MBS)分为两个部分,Write Operation根据时间顺序将多种行为信息更新于记忆矩阵M中,Read Operation则从记忆矩阵中读出不同行为的偏好信息。具体来说,模型包含多个用户共享的全局键矩阵{,,,, },在Write Operation过程中,将当前行为对应的全局键矩阵当作key计算attention权重用于更新偏好记忆矩阵M,在Read Operation过程中也将根据不同的全局键矩阵计算不同的行为偏好权重,并根据权重聚合记忆矩阵M生成多个行为偏好向量。此外,作者还敏锐的注意到了多种行为之间的级联关系,例如在达成匹配的前提是经历过点击、申请等前置行为,因此最终的匹配预测是一个级联过程,对于匹配的判断需要前置行为的输出作为输入。

混合推荐方法

结合文本匹配与历史行为偏好建模的PJF方法也是研究者们的研究热点,这些方法往往是将从双方文本中提取的显式偏好与从历史行为中获得的隐式偏好相结合完成推荐。下面笔者选择了一部分工作进行介绍。

【PJFFF】Learning Effective Representations for Person-Job Fit by Feature Fusion (CIKM 2020)

https://dl.acm.org/doi/abs/10.1145/3340531.3412717

本文中提出了一种结合特征融合、文本匹配以及历史行为偏好建模的PJF模型,整个模型分为两个部分,一部分以求职者简历和职位描述中的显式信息为输入,另一部分建模双方的历史行为序列,建模隐式偏好特征。

859adaf6-9011-11ed-bfe3-dac502259ad0.png

在简历或职位描述中除了技能描述、职位要求等文本信息外,还有一些可以通过NLP技术提取出的语义实体,如年龄、性格、大学等等,本文作者将这些实体也作为显式信息输入,通过DeepFM模型完成建模,对于文本信息则使用CNN得到向量表示,最终两种显示特征concat作为第一部分的输出。

85b21acc-9011-11ed-bfe3-dac502259ad0.png

模型第二部分则通过两个LSTM对求职者和职位的历史行为进行建模,用于提取双方的隐式特征,模型输入是第一部分获得的显式特征与匹配结果onehot向量的拼接。最终的预测过程中首先将双方的显式特征与隐式特征拼接,之后通过内积得到匹配得分。

【PJFCANN】Person-job fit estimation from candidate profile and related recruitment history with Co-Attention Neural Networks (Neurocomputing 2022)

https://www.sciencedirect.com/science/article/pii/S0925231222007299

85c2f090-9011-11ed-bfe3-dac502259ad0.png

本文将文本匹配与从历史交互记录中提取的关系图相结合。文本匹配部分通过mashRNN实现了单词级编码,之后通过co-attention完成了简历与职位描述间的匹配交互与句子级编码,最终基于另一个简单的attention获得文本的本地(local)编码向量。此外,作者根据历史交互记录建立了职位—职位和求职者—求职者之间的关系图,以职位与职位之间的关系图为例,假设我们需要预测的job—resume对为 (J, R),若另一职位 J' 与当前简历 R 也产生过交互则在 J 与 J' 之间建立一条边,这条边的权重通过两个职位描述信息的相似度得到。获得两个关系图后通过GNN得到图中各个节点的表示,并基于attention机制获得职位和求职者简历的全局(global)表示。最终的匹配预测同样基于MLP实现。

其他

除了上述几类方法外,还有很多其他方法,例如基于特征工程的传统机器学习方法,基于单边偏好建模的职位推荐,灵活运用用户搜索历史或其他辅助数据的方法等。

The Influence of Feature Selection on Job Clustering for an E-recruitment Recommender System (2020):基于特征选择与提取。

A Session-based Job Recommendation System Combining Area Knowledge and Interest Graph Neural Networks (2020):加入领域知识增强的单边序列推荐。

Using autoencoders for session‑based job recommendations (2020):基于autoencoder的单边序列推荐。

Learning to Match Jobs with Resumes from Sparse Interaction Data using Multi-View Co-Teaching Network (2020):为了缓解PJF任务中交互数据稀疏且嘈杂的问题,作者提出了一种基于稀疏交互数据的新型多视图协同教学网络,结合基于文本匹配的模型和基于关系的模型,两个部分采用协同教学机制来减少噪声对训练数据的影响。核心思想是让两个组件通过选择更可靠的训练实例来相互帮助。

Leveraging Search History for Improving Person-Job Fit (2022):不再局限于求职者与职位之间的历史匹配记录,而是结合了求职者的搜索历史信息进行偏好建模。

Job Recommendation Based on Extracted Skill Embeddings (2022):从求职者简历与职位要求描述中提取技能短语,使用Word2Vec编码后计算相似度。

小结

本文从文本匹配、历史行为偏好建模以及混合推荐方法三个角度向大家介绍了当前人岗匹配中的主要模型与方法,可以看到,单纯基于文本匹配的人岗匹配方法在最新的研究中较少出现,随着BERT等系列大规模预训练语言模型的快速涌现,文本匹配任务也不再局限于简单的监督训练,最近的很多PJF工作中都将BERT作为一个基线且表现出不俗的性能,因此结合对历史行为偏好的建模是当前人岗匹配研究的主要方向。但同时人岗匹配的实际场景使得交互数据非常稀疏,如何解决数据稀疏也是当前的一大研究热点。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3655

    浏览量

    51753
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23258
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14576
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    立讯精密披露在人形机器领域的最新进展

    11月26日,立讯精密在最新的投资者关系活动记录中披露了在人形机器领域的最新进展
    的头像 发表于 12-03 14:50 597次阅读

    多光谱图像颜色特征用于茶叶分类的研究进展

    多光谱成像技术结合颜色特征分析为茶叶分类提供了高效、非破坏性的解决方案。本文系统综述了该技术的原理、方法、应用案例及挑战,探讨了其在茶叶品质分级、品种识别和产地溯源中的研究进展,并展望了未来发展方向
    的头像 发表于 10-17 17:09 431次阅读
    多光谱图像颜色特征用于茶叶分类的<b class='flag-5'>研究进展</b>

    划重点!浦江开源鸿蒙生态大会金句

    划重点!浦江开源鸿蒙生态大会金句
    的头像 发表于 10-16 17:29 385次阅读
    划重点!<b class='flag-5'>一</b>图<b class='flag-5'>速</b><b class='flag-5'>览</b>浦江开源鸿蒙生态大会金句

    高光谱成像在作物病虫害监测的研究进展

    特性会发生显著变化,例如: 叶绿素含量下降 :导致可见光波段(400-700 nm)反射率异常 细胞结构破坏 :引起近红外波段(700-1300 nm)散射特征改变 水分与糖分异常 :影响短波红外波段(1300-2500 nm)吸收峰分布 研究进展与关键技术突破 ()光
    的头像 发表于 10-16 15:53 343次阅读
    高光谱成像在作物病虫害监测的<b class='flag-5'>研究进展</b>

    微双重驱动的新型直线电机研究

    摘罢:大行程、高精度,同时易于小型化的移动机构是先进制造业等领域要解决的关键问题之,综述了现有宏/微双重驱动机构和直线超声电机的研究进展和存在问题,提出了种宏微双重驱动新型直线压电
    发表于 06-24 14:17

    升降曲线对直线电机系统性能影响的研究

    摘要:对次速度曲线升降,二次速度曲线升降,三次速度曲线升降以及三角函数速度曲线升降曲线进行了分析,并对后3种升降
    发表于 06-17 08:48

    氧化镓射频器件研究进展

    ,首先介绍了 Ga2O3在射频器件领域的优势和面临的挑战,然后综述了近年来 Ga2O3射频器件在体掺杂沟道、AlGaO/Ga2O3调制 掺杂异质结以及与高导热衬底异质集成方面取得的进展,并对研究结果进行了讨论,最后展望了未来 G
    的头像 发表于 06-11 14:30 2004次阅读
    氧化镓射频器件<b class='flag-5'>研究进展</b>

    详解水下机器的产业发展现状及趋势分

    不久前,由上海交通大学、中国科学院深海科学与工程研究所、华大集团联合发起的马里亚纳海沟环境与生态研究计划(MEER计划)取得重大科研进展。该研究专题集中报道了马里亚纳海沟深渊样本的
    的头像 发表于 03-14 10:12 2202次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>详解水下机器<b class='flag-5'>人</b>的产业发展现状及趋势分

    汽车焊接机器的智能控制系统研究进展

    效率、保证焊接质量具有重要意义。近年来,随着人工智能、大数据、物联网等技术的发展,汽车焊接机器的智能控制系统的研究取得了显著进展,为汽车制造业带来了新的变革。
    的头像 发表于 02-26 14:09 724次阅读

    30KPA48A:快速响应,为电路安全保驾护航

    30KPA48A:快速响应,为电路安全保驾护航
    的头像 发表于 02-22 10:15 891次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>速</b><b class='flag-5'>览</b> 30KPA48A:快速响应,为电路安全保驾护航

    香港科技大学陈敬课题组揭示GaN与SiC材料的最新研究进展

    基于宽禁带半导体氮化镓,碳化硅的最新研究进展研究成果覆盖功率器件技术和新型器件技术: 高速且具备优越开关速度控制能力的3D堆叠式GaN/SiC cascode 功率器件 多年来,商业SiC
    的头像 发表于 02-19 11:23 1264次阅读
    香港科技大学陈敬课题组揭示GaN与SiC材料的最新<b class='flag-5'>研究进展</b>

    二极管泵浦高能激光的研究进展(1)

    质量这总目标发展迅速。详细综述了国内外高平均功率块状固体激光、高功率可见光波段激光、高峰值功率激光、高功率光纤激光、碱金属蒸气激光等二极管泵浦高能激光的研究进展,并对其发展趋势进行了展望。
    的头像 发表于 02-18 15:46 901次阅读
    二极管泵浦高能激光的<b class='flag-5'>研究进展</b>(1)

    清华大学:软体机器柔性传感技术最新研究进展

    随着机器技术的发展,配备柔性传感功能的软体机器人在医疗辅助康复、水下资源勘探、陆地灾难救援等领域发挥着重要作用,如何设计高性能柔性传感器,实现软体机器智能化发展是机器
    的头像 发表于 02-14 14:31 1216次阅读
    清华大学:软体机器<b class='flag-5'>人</b>柔性传感技术最新<b class='flag-5'>研究进展</b>

    石墨烯铅蓄电池研究进展、优势、挑战及未来方向

    石墨烯铅蓄电池是将石墨烯材料与传统铅酸电池技术相结合的研究方向,旨在提升铅酸电池的性能(如能量密度、循环寿命、快充能力等)。以下是该领域研究进展、优势、挑战及未来方向: 、石墨烯在
    的头像 发表于 02-13 09:36 2808次阅读

    中山大学:在柔性触觉传感电子皮肤研究进展

    研究内容】     中山大学衣芳教授团队在" 科学通报"期刊上发表了题为“ 柔性触觉传感电子皮肤研究进展”的最新论文。本文主要综述了近年来柔性触觉传感电子皮肤的研究进展, 重点归纳总结了上述三类
    的头像 发表于 02-12 17:03 1705次阅读
    中山大学:在柔性触觉传感电子皮肤<b class='flag-5'>研究进展</b>