0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能感知与物联网技术研究所

文章:422 被阅读:188.9w 粉丝数:24 关注数:0 点赞数:11

广告

一种基于正交与缩放变换的大模型量化方法

近年来,大规模语言模型(Large Language Models, LLMs)在自然语言处理领域取....
的头像 智能感知与物联网技术研究所 发表于 03-04 11:10 925次阅读
一种基于正交与缩放变换的大模型量化方法

大模型的数学能力或许一直都在关键在于如何唤醒它

在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑....
的头像 智能感知与物联网技术研究所 发表于 02-17 17:44 943次阅读
大模型的数学能力或许一直都在关键在于如何唤醒它

TeleAI提出COPO对齐方法:8B模型超越Llama3-70B的表现

在自然界中,好奇心驱使着生物探索未知,是生存和进化的关键。人类,作为地球上最具智能的物种,其探索精神....
的头像 智能感知与物联网技术研究所 发表于 02-17 17:31 676次阅读
TeleAI提出COPO对齐方法:8B模型超越Llama3-70B的表现

2025年Next Token Prediction范式会统一多模态吗

训练方法与推理策略 性能评测体系 现存挑战与未来方向 综述的完整目录如下: 多模态的 Tokeniz....
的头像 智能感知与物联网技术研究所 发表于 01-21 10:11 939次阅读
2025年Next Token Prediction范式会统一多模态吗

大连理工提出基于Wasserstein距离(WD)的知识蒸馏方法

自 Hinton 等人的开创性工作以来,基于 Kullback-Leibler 散度(KL-Div)....
的头像 智能感知与物联网技术研究所 发表于 01-21 09:45 1022次阅读

中国电提出大模型推理加速新范式Falcon

近日,中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Para....
的头像 智能感知与物联网技术研究所 发表于 01-15 13:49 1475次阅读
中国电提出大模型推理加速新范式Falcon

探索对抗训练的概率分布偏差:DPA双概率对齐的通用域自适的目标检测方法

  论文标题:Universal Domain Adaptive Object Detection ....
的头像 智能感知与物联网技术研究所 发表于 01-15 13:45 1186次阅读
探索对抗训练的概率分布偏差:DPA双概率对齐的通用域自适的目标检测方法

SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer

  背景简介 随着图像编辑工具和图像生成技术的快速发展,图像处理变得非常方便。然而图像在经过处理后不....
的头像 智能感知与物联网技术研究所 发表于 01-15 09:30 836次阅读
SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer

基于移动自回归的时序扩散预测模型

在人工智能领域,目前有很多工作采用自回归方法来模拟或是替代扩散模型,其中视觉自回归建模(Visual....
的头像 智能感知与物联网技术研究所 发表于 01-03 14:05 1663次阅读
基于移动自回归的时序扩散预测模型

港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制

本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——Spa....
的头像 智能感知与物联网技术研究所 发表于 01-03 09:28 1814次阅读
港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制

Mamba入局图像复原,达成新SOTA

图像复原又来新突破了!还记得性能超越SwinIR(基于Transformer)的MambaIR吗?一....
的头像 智能感知与物联网技术研究所 发表于 12-30 18:09 1639次阅读
Mamba入局图像复原,达成新SOTA

准确性超Moshi和GLM-4-Voice,端到端语音双工模型Freeze-Omni

GPT-4o 提供的全双工语音对话带来了一股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现端....
的头像 智能感知与物联网技术研究所 发表于 12-17 10:21 1330次阅读
准确性超Moshi和GLM-4-Voice,端到端语音双工模型Freeze-Omni

CNN, RNN, GNN和Transformer模型的统一表示和泛化误差理论分析

背景介绍 本文是基于我们之前的 RPN(Reconciled Polynomial Network)....
的头像 智能感知与物联网技术研究所 发表于 12-06 11:31 2157次阅读
CNN, RNN, GNN和Transformer模型的统一表示和泛化误差理论分析

复旦提出大模型推理新思路:Two-Player架构打破自我反思瓶颈

在 AI 领域,近期的新闻焦点无疑是关于「Scaling Law 是否撞墙?」的辩论。这一曾经被视作....
的头像 智能感知与物联网技术研究所 发表于 12-06 11:24 1187次阅读
复旦提出大模型推理新思路:Two-Player架构打破自我反思瓶颈

浙大、微信提出精确反演采样器新范式,彻底解决扩散模型反演问题

随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐....
的头像 智能感知与物联网技术研究所 发表于 11-27 09:21 1079次阅读
浙大、微信提出精确反演采样器新范式,彻底解决扩散模型反演问题

经典图神经网络(GNNs)的基准分析研究

本文简要介绍了经典图神经网络(GNNs)的基准分析研究,发表在 NeurIPS 2024。 文章回顾....
的头像 智能感知与物联网技术研究所 发表于 11-27 09:16 1197次阅读
经典图神经网络(GNNs)的基准分析研究

一种信息引导的量化后LLM微调新算法IR-QLoRA

大模型应用开卷,连一向保守的苹果,都已释放出发展端侧大模型的信号。 问题是,大语言模型(LLM)卓越....
的头像 智能感知与物联网技术研究所 发表于 11-19 17:16 1332次阅读
一种信息引导的量化后LLM微调新算法IR-QLoRA

适配器微调在推荐任务中的几个关键因素

可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中....
的头像 智能感知与物联网技术研究所 发表于 03-04 09:50 1284次阅读
适配器微调在推荐任务中的几个关键因素

再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 1157次阅读
再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

想将一份文档图片转换成 Markdown 格式?以往这一任务需要文本识别、布局检测和排序、公式表格处....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:40 2838次阅读
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!

NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

在这篇 NeurIPS23 论文中,来自鲁汶大学、新加坡国立大学和中科院自动化所的研究者提出了一种视....
的头像 智能感知与物联网技术研究所 发表于 12-24 21:35 975次阅读
NeurIPS23|视觉 「读脑术」:从大脑活动中重建你眼中的世界

ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

这篇是 ICLR 上用 TCN 来做一般的时间序列分析的论文,在 Rebuttal 之后的分数为 8....
的头像 智能感知与物联网技术研究所 发表于 12-18 16:05 1560次阅读
ICLR 2024高分投稿:用于一般时间序列分析的现代纯卷积结构

DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解

除了模仿人类说话、写作、写代码,大模型还能用来发现新知识。 作为今年 AI 圈的顶流,大型语言模型(....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:55 735次阅读

GPT推断中的批处理(Batching)效应简析

机器学习模型依赖于批处理(Batching)来提高推断吞吐量,尤其是对于 ResNet 和 Dens....
的头像 智能感知与物联网技术研究所 发表于 12-18 15:52 1475次阅读
GPT推断中的批处理(Batching)效应简析

拆解大语言模型RLHF中的PPO算法

由于本文以大语言模型 RLHF 的 PPO 算法为主,所以希望你在阅读前先弄明白大语言模型 RLHF....
的头像 智能感知与物联网技术研究所 发表于 12-11 18:30 3750次阅读
拆解大语言模型RLHF中的PPO算法

大规模神经网络优化:超参最佳实践与规模律

从理论分析入手把握大规模神经网络优化的规律,可以指导实践中的超参数选择。反过来,实践中的超参数选择也....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 1701次阅读

陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

正是包括两位菲尔兹奖获得者在内四位数学家的坚持,才得以证明了一个堪称「加性组合学圣杯」的猜想,其中 ....
的头像 智能感知与物联网技术研究所 发表于 12-10 21:45 1378次阅读
陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

2023年11月18日CCF YOCSEF太原在太原理工大学明向校区信计学院北楼一层会议室举办“卫星....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:25 2090次阅读
星载传算能力——天地一体化网络在轨边缘计算产业发展的拦路虎

任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。 今年 5 月,北卡罗....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 1061次阅读
任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

论文链接:  https://arxiv.org/abs/2305.10299 代码链接1: htt....
的头像 智能感知与物联网技术研究所 发表于 12-03 20:20 1106次阅读
NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法