可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中....
用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷....
想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处....
在这篇 NeurIPS23 论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视....
这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文,在 Rebuttal 之后的分数为 8....
除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。 作为今年 AI 圈的顶流,大型语言模型(....
机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是对于 ResNet 和 Dens....
由于本文以大语言模型 RLHF 的 PPO 算法为主,所以希望你在阅读前先弄明白大语言模型 RLHF....
从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也....
正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 ....
2023年11月18日CCF YOCSEF太原在太原理工大学明向校区信计学院北楼一层会议室举办“卫星....
研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。 今年 5 月,北卡罗....
论文链接: https://arxiv.org/abs/2305.10299 代码链接1: htt....
AI Agents 是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的 LLM Agen....
本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,....
你的测试集信息在训练集中泄漏了吗? 一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图....
作为本年度人工智能领域最重要的突破之一,大语言模型相关研究始终是各大相关领域的关注焦点。 近日,来自....
如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑....
网友:我都不敢想 象一年后的视频技术会有多先进。 一段五十秒的预告视频,再次让 AI 圈沸腾了。 昨....
Paper List: https://github.com/westlake-repl/Reco....
Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序 列中的多层次表....
上海交大上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性....
论文链接: https://arxiv.org/abs/2305.17476 代码链接: https....
离开学校加入公司的业务部门已经半年多了,往后应该会努力抽时间做点开源项目,但暂时没什么计划再发一作论....
视觉幻觉是常见于多模态大语言模型 (Multimodal Large Language Models....
大模型家族来了一个专门解决数学问题的「新成员」——Llemma。 如今,在各种文本混合数据上训练出来....
本文是 ICCV 2023 入选 Oral 论文 Grounded Entity-Landmark ....
论文标题: DropPos: Pre-Training Vision Transformers by....
本文介绍一篇 LLM 推理加速技术 相关的文章,值得读一读。 LLMs 在现实应用中的计算成本主要由....
近些年,3D 自然场景的生成出现了大量的研究工作,但是 3D 城市生成的研究工作还寥寥无几。这主要是....