0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习自然语言处理

文章:835 被阅读:169.9w 粉丝数:40 关注数:0 点赞数:5

广告

面向结构化数据的文本生成技术研究

今天我们要讲的文本生成是现在最流行的研究领域之一。文本生成的目标是让计算机像人类一样学会表达,目前看....
的头像 深度学习自然语言处理 发表于 06-26 14:39 336次阅读
面向结构化数据的文本生成技术研究

ChatGLM2-6B:性能大幅提升,8-32k上下文,推理提速42%,在中文榜单位列榜首

在主要评估LLM模型中文能力的 C-Eval 榜单中,截至6月25日 ChatGLM2 模型以 71....
的头像 深度学习自然语言处理 发表于 06-26 14:30 777次阅读
ChatGLM2-6B:性能大幅提升,8-32k上下文,推理提速42%,在中文榜单位列榜首

神经编码器-解码器模型的历史

基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果....
的头像 深度学习自然语言处理 发表于 06-20 15:42 461次阅读
神经编码器-解码器模型的历史

基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力

  因果推理是人类智力的标志之一。因果关系NLP领域近年来引起了人们的极大兴趣,但其主要依赖于从常识....
的头像 深度学习自然语言处理 发表于 06-20 15:39 1279次阅读
基准数据集(CORR2CAUSE)如何测试大语言模型(LLM)的纯因果推理能力

RLHF实践中的框架使用与一些坑 (TRL, LMFlow)

我们主要用一个具体的例子展示如何在两个框架下做RLHF,并且记录下训练过程中我们踩到的主要的坑。这个....
的头像 深度学习自然语言处理 发表于 06-20 14:36 1472次阅读
RLHF实践中的框架使用与一些坑 (TRL, LMFlow)

GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星

网友表示,「澄清问题」是真正使GPT-Engineer脱颖而出的原因,因为修复生成代码中的问题往往比....
的头像 深度学习自然语言处理 发表于 06-20 14:34 357次阅读
GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星

基于多任务预训练模块化提示

Prompt Tuning 可以让预训练的语言模型快速适应下游任务。虽然有研究证明:当训练数据足够多....
的头像 深度学习自然语言处理 发表于 06-20 11:04 382次阅读
基于多任务预训练模块化提示

智能开源大模型baichuan-7B技术改进

baichuan-7B 主要是参考LLaMA进行的改进,且模型架构与LLaMA一致。而在开源大模型中....
的头像 深度学习自然语言处理 发表于 06-17 14:14 741次阅读

分析自动评测器的工具包

除了各类开源模型外,还有GPT-4、PaLM 2等众多「闭源」模型,甚至还开设了一个「准中文」排行榜....
的头像 深度学习自然语言处理 发表于 06-17 14:11 332次阅读
分析自动评测器的工具包

基于 Transformers 的编码器-解码器模型

基于 transformer 的编码器-解码器模型是 表征学习 和 模型架构 这两个领域多年研究成果....
的头像 深度学习自然语言处理 发表于 06-16 16:53 474次阅读
基于 Transformers 的编码器-解码器模型

LLM in Medical Domain: 一文速览大语言模型在医学领域的应用

由于在生成长文本的数据集上,Flan-PaLM和临床医生的结果显示出一定gap。本文提出了使用Ins....
的头像 深度学习自然语言处理 发表于 06-15 18:00 1282次阅读
LLM in Medical Domain: 一文速览大语言模型在医学领域的应用

王小川大模型首亮相!70亿参数霸榜,清北抢先用

AGIEval评测基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包....
的头像 深度学习自然语言处理 发表于 06-15 17:56 476次阅读
王小川大模型首亮相!70亿参数霸榜,清北抢先用

梁宁:为什么中国没有像ChatGPT和Vision Pro这样的创新产品?

相隔 20 多年的时间再回头看,我比较得意的一件事就是,1996 年我给联想的总裁办做了一次汇报,说....
的头像 深度学习自然语言处理 发表于 06-15 17:04 826次阅读

ChatGPT的潜力和局限

  今天为大家分享一篇研究,当ChatGPT穿越到口袋妖怪世界,是否会理解并应用这个虚构世界的知识呢....
的头像 深度学习自然语言处理 发表于 06-13 17:23 385次阅读
ChatGPT的潜力和局限

为k近邻机器翻译领域自适应构建可解释知识库

为了找到NMT模型的潜在缺陷,构建更加可解释的知识库,我们提出以局部准确性这一新概念作为分析角度。其....
的头像 深度学习自然语言处理 发表于 06-13 15:25 411次阅读
为k近邻机器翻译领域自适应构建可解释知识库

大模型参数高效微调技术原理综述

神经网络包含很多全连接层,其借助于矩阵乘法得以实现,然而,很多全连接层的权重矩阵都是满秩的。
的头像 深度学习自然语言处理 发表于 06-13 14:59 1890次阅读
大模型参数高效微调技术原理综述

能遵循instruction的句向量模型

句向量技术是将连续的文本转化为固定长度的稠密向量,将句子映射到同一个向量空间中
的头像 深度学习自然语言处理 发表于 06-13 14:56 638次阅读
能遵循instruction的句向量模型

基于 RNN 的解码器架构如何建模

  Vaswani 等人在其名作 Attention is all you need 中首创了 基于....
的头像 深度学习自然语言处理 发表于 06-12 17:08 450次阅读
基于 RNN 的解码器架构如何建模

Meta开源文本如何生成音乐大模型

年初,谷歌推出了音乐生成大模型 MusicLM,效果非常不错。有人称这比大火的 ChatGPT 还重....
的头像 深度学习自然语言处理 发表于 06-12 15:11 534次阅读
Meta开源文本如何生成音乐大模型

如何将ChatGPT的能力蒸馏到另一个大模型

如何将ChatGPT的能力蒸馏到另一个大模型,是当前许多大模型研发的研发范式。当前许多模型都是采用c....
的头像 深度学习自然语言处理 发表于 06-12 15:06 561次阅读
如何将ChatGPT的能力蒸馏到另一个大模型

In-Context-Learning在更大的语言模型上表现不同

最近,在语言模型领域取得了巨大的进展,部分是因为它们可以通过In-Context- Learning....
的头像 深度学习自然语言处理 发表于 06-12 14:35 450次阅读
In-Context-Learning在更大的语言模型上表现不同

Allen AI推出集成主流大语言模型的LLM-BLENDER框架

在推理阶段,计算一个矩阵,该矩阵包含表示成对比较结果的logits。给定该矩阵,可以推断给定输入x的....
的头像 深度学习自然语言处理 发表于 06-11 15:06 480次阅读
Allen AI推出集成主流大语言模型的LLM-BLENDER框架

使用单卡高效微调bloom-7b1,效果惊艳

在本文中我们将对QLoRA的基本原理进行介绍,并且在Firefly项目中进行实践。我们在bloom-....
的头像 深度学习自然语言处理 发表于 06-08 15:19 1363次阅读
使用单卡高效微调bloom-7b1,效果惊艳

性能媲美同时成本降低98%,斯坦福提出FrugalGPT,研究却惹争议

这项研究提出的思想和发现为可持续高效地使用 LLM 奠定了基础。如果能够在不增加预算的情况下采用更高....
的头像 深度学习自然语言处理 发表于 06-08 15:11 250次阅读
性能媲美同时成本降低98%,斯坦福提出FrugalGPT,研究却惹争议

Transformer结构及其应用详解

本文首先详细介绍Transformer的基本结构,然后再通过GPT、BERT、MT-DNN以及GPT....
的头像 深度学习自然语言处理 发表于 06-08 09:56 1433次阅读
Transformer结构及其应用详解

从大模型中蒸馏脚本知识用于约束语言规划

为了实现日常目标,人们通常会根据逐步指令来计划自己的行动。这些指令被发现是目标导向的脚本,包括一组达....
的头像 深度学习自然语言处理 发表于 06-08 09:46 763次阅读
从大模型中蒸馏脚本知识用于约束语言规划

LLM时代NLP研究何去何从?

在当前低资源的语言基准上(如FLORES-200)改进机器翻译性能。针对资源极低的语言,可以利用圣经....
的头像 深度学习自然语言处理 发表于 06-02 15:52 728次阅读

iPhone都能微调大模型了嘛

自动测试分数达到 ChatGPT的99.3%,人类难以分辨 两者的回答…… 这是开源大模型最新成果,....
的头像 深度学习自然语言处理 发表于 06-02 15:26 447次阅读
iPhone都能微调大模型了嘛

一个通用的自适应prompt方法,突破了零样本学习的瓶颈

为了解决这个问题,这篇研究提出了一种Universal Self-adaptive Promptin....
的头像 深度学习自然语言处理 发表于 06-01 14:48 497次阅读
一个通用的自适应prompt方法,突破了零样本学习的瓶颈

探索ChatGPT的信息抽取能力

通过人工检查ChatGPT的回复,发现ChatGPT倾向于识别比标注的跨度更长的sapn,以更接近人....
的头像 深度学习自然语言处理 发表于 06-01 14:45 889次阅读
探索ChatGPT的信息抽取能力