近日,AMD在Huggingface平台上正式推出了自家首款“小语言模型”——AMD-Llama-135m。这款模型以其独特的推测解码功能,吸引了业界的广泛关注。
AMD-Llama-135m模型拥有6700亿个token,并采用了Apache 2.0开源许可,为用户提供了更多的灵活性和自由度。据AMD介绍,该模型主打“推测解码”能力,这一功能的基本原理是通过使用一个小型草稿模型来生成一组候选token,然后由更大的目标模型对这些候选token进行验证。这种方法不仅能够确保生成的token的准确性和可靠性,而且允许每次前向传递生成多个token,从而显著提高了效率。
与传统的AI模型相比,AMD-Llama-135m在RAM占用方面也有了显著的优化。由于采用了推测解码技术,该模型能够在不影响性能的前提下,减少RAM的占用,实现了更加高效的计算和存储资源利用。
AMD-Llama-135m的发布,标志着AMD在AI领域迈出了重要的一步。未来,AMD将继续致力于AI技术的研发和创新,为全球用户提供更加智能、高效和可靠的解决方案。
-
amd
+关注
关注
25文章
5650浏览量
139057 -
AI
+关注
关注
90文章
38189浏览量
297000 -
模型
+关注
关注
1文章
3649浏览量
51719
发布评论请先 登录
【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地
AMD Vitis AI 5.1测试版发布
皓丽全球首款四摄AI会议平板:AI全视之眼 + AI智会大模型双加持
使用 NPU 插件对量化的 Llama 3.1 8b 模型进行推理时出现“从 __Int64 转换为无符号 int 的错误”,怎么解决?
首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手
人民网发布首款智能硬件AI之眼
无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?
Hugging Face推出最小AI视觉语言模型
NVIDIA推出开放式Llama Nemotron系列模型
极空间私有云联合UnifyDrive亮相CES:发布全球首款大语言模型 AI NAS
云天励飞首款AI眼镜正式发布
AI大语言模型开发步骤
Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

AMD发布首款小语言AI模型Llama-135m
评论