0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能感知与物联网技术研究所

文章:408 被阅读:157.6w 粉丝数:22 关注数:0 点赞数:11

广告

适配器微调在推荐任务中的几个关键因素

可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中....
的头像 智能感知与物联网技术研究所 发表于 03-04 09:50 200次阅读
适配器微调在推荐任务中的几个关键因素

再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 333次阅读
再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 1369次阅读
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

在这篇 NeurIPS23 论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:35 277次阅读
NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文,在 Rebuttal 之后的分数为 8....
的头像 智能感知与物联网技术研究所 发表于 12-18 16:05 419次阅读
ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。 作为今年 AI 圈的顶流,大型语言模型(....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:55 153次阅读

GPT推断中的批处理(Batching)效应简析

机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是对于 ResNet 和 Dens....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:52 364次阅读
GPT推断中的批处理(Batching)效应简析

拆解大语言模型RLHF中的PPO算法

由于本文以大语言模型 RLHF 的 PPO 算法为主,所以希望你在阅读前先弄明白大语言模型 RLHF....
的头像 智能感知与物联网技术研究所 发表于 12-11 18:30 1249次阅读
拆解大语言模型RLHF中的PPO算法

大规模神经网络优化:超参最佳实践与规模律

从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 579次阅读

陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 ....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 413次阅读
陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

2023年11月18日CCF YOCSEF太原在太原理工大学明向校区信计学院北楼一层会议室举办“卫星....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:25 701次阅读
星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。 今年 5 月,北卡罗....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 438次阅读
任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

论文链接:  https://arxiv.org/abs/2305.10299 代码链接1: htt....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 417次阅读
NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

AI Agents 是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的 LLM Agen....
的头像 智能感知与物联网技术研究所 发表于 11-26 21:25 584次阅读
NeurIPS 2023 | AI Agents先行者CAMEL:首个基于大模型的多智能体框架

全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了 HyperAttention,....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:15 293次阅读
全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%

13B模型全方位碾压GPT-4?这背后有什么猫腻

你的测试集信息在训练集中泄漏了吗? 一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:15 307次阅读

把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架

作为本年度人工智能领域最重要的突破之一,大语言模型相关研究始终是各大相关领域的关注焦点。 近日,来自....
的头像 智能感知与物联网技术研究所 发表于 11-20 09:10 324次阅读
把ChatGPT塞进副驾驶!清华、中科院、MIT联合提出Co-Pilot人机交互框架

NeurIPS 2023 | 北大具身智能团队提出需求驱动导航:对齐人类需求,让机器人更高效

如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:05 308次阅读

Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了

网友:我都不敢想 象一年后的视频技术会有多先进。 一段五十秒的预告视频,再次让 AI 圈沸腾了。 昨....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:00 781次阅读
Runway新功能「运动笔刷」再次惊艳AI圈:随手一涂,图片就动起来了

从ID-based到LLM-based:可迁移推荐系统发展

Paper List:  https://github.com/westlake-repl/Reco....
的头像 智能感知与物联网技术研究所 发表于 11-12 22:00 391次阅读
从ID-based到LLM-based:可迁移推荐系统发展

重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了

Transformer 在时间序列预测中出现了强大能力,可以描述成对依赖关系和提取序 列中的多层次表....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 344次阅读
重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了

178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离

上海交大上海AI Lab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 359次阅读
178页,128个案例,GPT-4V医疗领域全面测评,离临床应用与实际决策尚有距离

NeurIPS 2023 | 如何从理论上研究生成式数据增强的效果?

论文链接: https://arxiv.org/abs/2305.17476 代码链接: https....
的头像 智能感知与物联网技术研究所 发表于 11-05 20:15 381次阅读
NeurIPS 2023 | 如何从理论上研究生成式数据增强的效果?

NeurIPS 2023 | 大模型时代自监督预训练的隐性长尾偏见

离开学校加入公司的业务部门已经半年多了,往后应该会努力抽时间做点开源项目,但暂时没什么计划再发一作论....
的头像 智能感知与物联网技术研究所 发表于 10-30 11:05 228次阅读
NeurIPS 2023 | 大模型时代自监督预训练的隐性长尾偏见

幻觉降低30%!首个多模态大模型幻觉修正工作Woodpecker

视觉幻觉是常见于多模态大语言模型 (Multimodal Large Language Models....
的头像 智能感知与物联网技术研究所 发表于 10-30 11:05 211次阅读
幻觉降低30%!首个多模态大模型幻觉修正工作Woodpecker

参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了

大模型家族来了一个专门解决数学问题的「新成员」——Llemma。 如今,在各种文本混合数据上训练出来....
的头像 智能感知与物联网技术研究所 发表于 10-23 09:40 179次阅读
参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了

ICCV 2023 | 面向视觉-语言导航的实体-标志物对齐自适应预训练方法

本文是 ICCV 2023 入选 Oral 论文 Grounded Entity-Landmark ....
的头像 智能感知与物联网技术研究所 发表于 10-23 09:40 331次阅读
ICCV 2023 | 面向视觉-语言导航的实体-标志物对齐自适应预训练方法

NeurIPS 2023 | 全新的自监督视觉预训练代理任务:DropPos

论文标题: DropPos: Pre-Training Vision Transformers by....
的头像 智能感知与物联网技术研究所 发表于 10-15 20:25 321次阅读
NeurIPS 2023 | 全新的自监督视觉预训练代理任务:DropPos

Continuous Batching:解锁LLM潜力!让LLM推断速度飙升23倍,降低延迟!

本文介绍一篇 LLM 推理加速技术 相关的文章,值得读一读。 LLMs 在现实应用中的计算成本主要由....
的头像 智能感知与物联网技术研究所 发表于 10-15 20:25 328次阅读
Continuous Batching:解锁LLM潜力!让LLM推断速度飙升23倍,降低延迟!

CityDreamer:一键生成无边界的3D城市

近些年,3D 自然场景的生成出现了大量的研究工作,但是 3D 城市生成的研究工作还寥寥无几。这主要是....
的头像 智能感知与物联网技术研究所 发表于 10-15 20:25 294次阅读