0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习自然语言处理

文章:836 被阅读:170.8w 粉丝数:40 关注数:0 点赞数:5

广告

RL究竟是如何与LLM做结合的?

强化学习(Reinforcement Learning, RL)的核心概念可简单概括为:一个机器人(....
的头像 深度学习自然语言处理 发表于 01-03 16:34 709次阅读
RL究竟是如何与LLM做结合的?

2023年大语言模型(LLM)全面调研:原理、进展、领跑者、挑战、趋势

大型语言模型(LLM)是基于人工智能的先进模型,经过训练,它可以密切反映人类自然交流的方式处理和生成....
的头像 深度学习自然语言处理 发表于 01-03 16:05 508次阅读
2023年大语言模型(LLM)全面调研:原理、进展、领跑者、挑战、趋势

一种基于表征工程的生成式语言大模型人类偏好对齐策略

最近复旦大学自然语言处理组郑骁庆和黄萱菁团队提出了基于表征工程(Representation Eng....
的头像 深度学习自然语言处理 发表于 01-03 14:25 198次阅读
一种基于表征工程的生成式语言大模型人类偏好对齐策略

NLP领域的语言偏置问题分析

许多研究证明,学术论文表达的nativeness会影响其被接受发表的可能性[1, 2]。先前的研究也....
的头像 深度学习自然语言处理 发表于 01-03 11:00 232次阅读
NLP领域的语言偏置问题分析

ChatGPT是一个好的因果推理器吗?

因果推理能力对于许多自然语言处理(NLP)应用至关重要。最近的因果推理系统主要基于经过微调的预训练语....
的头像 深度学习自然语言处理 发表于 01-03 09:55 482次阅读
ChatGPT是一个好的因果推理器吗?

1-2B参数规模大模型的使用心得

大模型时代,根据大模型缩放定律,大家通常都在追求模型的参数规模更大、训练的数据更多,从而使得大模型涌....
的头像 深度学习自然语言处理 发表于 12-28 11:47 518次阅读
1-2B参数规模大模型的使用心得

从Google多模态大模型看后续大模型应该具备哪些能力

前段时间Google推出Gemini多模态大模型,展示了不凡的对话能力和多模态能力,其表现究竟如何呢....
的头像 深度学习自然语言处理 发表于 12-28 11:19 472次阅读
从Google多模态大模型看后续大模型应该具备哪些能力

一文速览大语言模型提示最新进展

尽管基本的CoT提示策略在复杂推理任务中展示出了强大的能力,但它仍然面临着一些问题,比如推理过程存在....
的头像 深度学习自然语言处理 发表于 12-27 14:19 302次阅读
一文速览大语言模型提示最新进展

高级检索增强生成技术(RAG)全面指南

ChatGPT、Midjourney等生成式人工智能(GenAI)在文本生成、文本到图像生成等任务中....
的头像 深度学习自然语言处理 发表于 12-25 15:16 2082次阅读
高级检索增强生成技术(RAG)全面指南

大模型微调数据选择和构造技巧

比如我们会经常遇到下面几种情况: 1.数据要不要都去标注,标的比较慢咋办? 2.我已经有一....
的头像 深度学习自然语言处理 发表于 12-20 14:39 425次阅读
大模型微调数据选择和构造技巧

Mistral中杯代码能力完胜GPT-4,成本暴降2/3

这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和G....
的头像 深度学习自然语言处理 发表于 12-18 16:55 379次阅读
Mistral中杯代码能力完胜GPT-4,成本暴降2/3

论文遭首届ICLR拒稿、代码被过度优化,word2vec作者Tomas Mikolov分享背后的故事

尽管 word2vec 是我被引用最多的论文,但我从未认为它是我最有影响力的项目。实际上,word2....
的头像 深度学习自然语言处理 发表于 12-18 16:51 377次阅读
论文遭首届ICLR拒稿、代码被过度优化,word2vec作者Tomas Mikolov分享背后的故事

什么是大模型的badcase?如何修复大模型的badcase呢?

首先我们定义什么是大模型的badcase,大模型badcase是指在应用场景中,出现不符合预期的答复....
的头像 深度学习自然语言处理 发表于 12-14 16:40 679次阅读

对于大模型RAG技术的一些思考

大模型或者句向量在训练时,使用的语料都是较为通用的语料。这导致了这些模型,对于垂直领域的知识识别是有....
的头像 深度学习自然语言处理 发表于 12-07 09:41 648次阅读
对于大模型RAG技术的一些思考

开源LLM在各种基准上的代理能力

采用ChatGPT的企业可能会担心API调用的巨大成本、服务中断、数据所有权和隐私问题,以及其他不可....
的头像 深度学习自然语言处理 发表于 12-04 14:02 709次阅读
开源LLM在各种基准上的代理能力

人工智能体在未来几年如何颠覆软件行业

Agent 不仅将改变人们与计算机的互动方式,还将颠覆软件行业,引发自从我们从键入命令到点击图标以来....
的头像 深度学习自然语言处理 发表于 12-04 13:54 537次阅读

聚焦于用LLMs模拟国际冲突的研究

本实验旨在验证LLM在模拟复杂历史事件方面的有效性。实验选用了OpenAI开发的GPT-4作为后端模....
的头像 深度学习自然语言处理 发表于 12-04 13:51 191次阅读
聚焦于用LLMs模拟国际冲突的研究

浅谈Q-Learning在Agent的应用

经典的文字模型我们已经很熟悉了:训练时,模型不停的预测下一个 token 并与真实语料比较,直到模型....
的头像 深度学习自然语言处理 发表于 12-02 16:53 588次阅读
浅谈Q-Learning在Agent的应用

大模型对话系统的内功与外功

Zero-shot Setting:在 O-Cue 中,由于单步指令较复杂(不要要进行推理还要进行回....
的头像 深度学习自然语言处理 发表于 12-01 16:32 273次阅读
大模型对话系统的内功与外功

基于大语言模型辩论的多智能体协作推理分析

具体来说,我们以多项选择的常识推理作为示例任务,因为常识推理任务是一类可能性 (plausible)....
的头像 深度学习自然语言处理 发表于 11-29 15:45 425次阅读
基于大语言模型辩论的多智能体协作推理分析

大模型的Scaling Law的概念和推导

对于Decoder-only的模型,计算量(Flops), 模型参数量, 数据大小(token数),....
的头像 深度学习自然语言处理 发表于 11-29 14:28 1031次阅读
大模型的Scaling Law的概念和推导

Long-Context下LLM模型架构全面介绍

随着ChatGPT的快速发展,基于Transformer的大型语言模型(LLM)为人工通用智能(AG....
的头像 深度学习自然语言处理 发表于 11-27 17:37 547次阅读
Long-Context下LLM模型架构全面介绍

如何从大脑活动中解码自然语言呢?

语言不仅是人类交流的工具,更是思维和智能的基础。
的头像 深度学习自然语言处理 发表于 11-25 15:57 370次阅读
如何从大脑活动中解码自然语言呢?

为什么Agent落地这么难?AI最大赛道Agent机遇全解析

“如果一篇论文提出了某种不同的训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的....
的头像 深度学习自然语言处理 发表于 11-25 15:54 1352次阅读
为什么Agent落地这么难?AI最大赛道Agent机遇全解析

被OpenAI带火的Agent如何解放人力?

在历史的长河中,自动化是人类技术发展的主要动力,帮助人类从复杂、危险、繁琐的劳动环境中解放出来。自早....
的头像 深度学习自然语言处理 发表于 11-25 15:23 510次阅读
被OpenAI带火的Agent如何解放人力?

探讨Sam 和 Ilya 的深层矛盾

有效加速主义 和 超级“爱”对齐 的理念冲突,以及一个变量:GPT-5 是数字生命,还是工具?
的头像 深度学习自然语言处理 发表于 11-24 11:28 226次阅读
探讨Sam 和 Ilya 的深层矛盾

基于ICL范式的LLM的最高置信度预测方案

本文假设不同的ICL为LLM提供了关于任务的不同知识,导致对相同数据的不同理解和预测。因此,一个直接....
的头像 深度学习自然语言处理 发表于 11-24 11:20 981次阅读
基于ICL范式的LLM的最高置信度预测方案

用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

目前的 VL 预训练方法通常仅适用于视觉和语言模态,而现实世界中的应用场景往往包含更多的模态信息,如....
的头像 深度学习自然语言处理 发表于 11-23 15:46 283次阅读
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

大型语言模型的逻辑推理能力探究

最新研究揭示,尽管大语言模型LLMs在语言理解上表现出色,但在逻辑推理方面仍有待提高。为此,研究者们....
的头像 深度学习自然语言处理 发表于 11-23 15:05 526次阅读
大型语言模型的逻辑推理能力探究

基于单一LLM的情感分析方法的局限性

LLM的发展为情感分析任务带来的新的解决方案。有研究人员使用LLM,在上下文学习(in-contex....
的头像 深度学习自然语言处理 发表于 11-23 11:14 385次阅读
基于单一LLM的情感分析方法的局限性