0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM发布全新Granite 3.2 AI模型

IBM中国 来源:IBM中国 2025-03-06 16:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Granite 3.2 是小型的 AI 模型,通过对开发人员友好的授权条款,提供推理、视觉和护栏功能。

更新后的 Granite 时间序列模型可提供长期预测,参数少于 10M;适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划等用例。

IBM 于 2月底推出其 Granite 大型语言模型家族的最新一代产品 Granite 3.2,持续推动小型、高效、企业专用的 AI,为实际应用创造效益。

所有 Granite 3.2 模型均采用宽松的 Apache 2.0 开源授权条款,可在 Hugging Face 下载。部分模型现已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,预计不久将支援 RHEL AI 1.5,为企业与开源社区注入更强大的 AI 能力。

主要亮点

全新视觉语言模型:专为理解文件任务而设计,在关键企业基准测试 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表现可媲美甚至超越更大规模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了强大的训练数据外,IBM 也利用其开源 Docling 工具包处理 8千 5百万份 PDF 文件,并生成 2千 6百万个合成问答配对,提升视觉语言模型在处理大量文件工作流时的能力。

增强推理功能:Granite 3.2 的 2B 与 8B 模型加入了「思维链」(Chain of Thought,CoT)推理机制,且使用者可以开启或关闭推理功能以优化效率。通过这项能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基准测试中的表现[2],比前一代优异比例达到两位数,且不影响其他领域的安全性或性能。此外,通过创新的推理扩展方法,Granite 3.2 8B 模型可以调整至接近 Claude 3.5 Sonnet 或 GPT-4o 在数学推理基准(如 AIME2024 和 MATH500[3])上的表现。

Granite Guardian 安全模型更轻巧:在保持 Granite 3.1 Guardian 模型性能的同时,模型尺寸减少三成。此外,Granite 3.2 系列还引入了语言化信心评估(Verbalized Confidence)新功能,可提供更精细的风险评估,帮助安全监测系统识别不确定性。

IBM 持续推动企业专用的小型 AI 模型策略,并已在测试中展现高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型语言模型 CRM 基准测试中获得高分,显示其在实际应用中的准确度和可靠性。

IBM Granite 模型家族拥有广大的合作伙伴生态体系,许多领先的软件公司已将 Granite 模型嵌入其技术。Granite 3.2 是 IBM 在推动企业专用小型 AI 方面的重要进展,体现了 IBM 致力于提供小型、高效、实用 AI 的产品策略。

CrushBank 首席技术官 David Tan表示:“在 CrushBank,我们亲眼目睹了 IBM 开放、高效的人工智能模型如何为企业人工智能带来真正的价值--在性能、成本效益和可扩展性之间实现适当的平衡。Granite 3.2 通过新的推理功能更进一步,我们很高兴能在构建新的代理(智能体)解决方案时探索这些功能。”

Granite 3.2 是 IBM 产品组合和战略发展的重要一步,旨在为企业提供小型实用的 AI。虽然思维链在推理任务中表现强大,但它需要大量计算资源,并非所有任务都必须启用。因此,IBM 在 Granite 3.2 模型中加入了程式化开关功能,使用者可以根据需求开启或关闭推理模式;模型可在不启用推理的情况下运行较简单的任务,以降低不必要的计算成本。

此外,其他推理技术(例如推理扩展 Inference Scaling) 已显示 Granite 3.2 8B 模型能够在标准数学推理基准测试中,媲美甚至超越更大模型的性能。持续发展这项推理技术也是 IBM 研究团队的重点方向[4],以进一步提升 AI 的效能与应用范围。

除了 Granite 3.2 的指令、视觉和防护模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)时间序列模型,这些模型的参数少于 1千万,具备长期预测能力,可进行长达两年的长期预测。这些模型为长期趋势分析提供强大工具,适用于金融与经济趋势分析、供应链需求预测,以及零售业的季节性库存规划。

IBM AI 研究副总裁 Sriram Raghavan表示:“AI 的下一个时代将聚焦效率、整合与实际应用的影响力 — 企业应该能够在不过度消耗计算资源的情境下,取得强大的 AI 效益。IBM 最新的 Granite 模型发展专注于开放式解决方案,逐步推动 AI 的普及,使其更具成本效益,为现代企业创造更大价值。”

关于 IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1853

    浏览量

    76774
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296468
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51708

原文标题:IBM 推出 Granite 3.2:全新企业级多模态及推理的 AI 模型

文章出处:【微信号:IBMGCG,微信公众号:IBM中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    正面对决GPT-5和Germini-3,DeepSeek-V3.2震撼发布

    12月1日,中国 AI创新企业 DeepSeek 再度加速技术迭代,今日宣布推出 DeepSeek-V3.2 与 V3.2-Speciale 两款模型。公司在官网上指出,DeepSee
    的头像 发表于 12-02 14:10 6797次阅读
    正面对决GPT-5和Germini-3,DeepSeek-V<b class='flag-5'>3.2</b>震撼<b class='flag-5'>发布</b>

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显
    的头像 发表于 10-23 17:58 943次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    曙光AI超集群系统全面支持DeepSeek-V3.2-Exp

    9月29日,DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放架构,芯片层、软件层、模型层实现“跨层协同”,使得曙光
    的头像 发表于 09-30 16:18 1470次阅读

    IBM联合NASA发布开源AI模型重要突破

    近日,IBM(纽交所代码:IBM)与美国国家航空航天局 (NASA) 联合发布了一款开创性的开源基础模型,可理解高分辨率的太阳观测数据,从而预测太阳活动对地球和太空技术的影响。该
    的头像 发表于 09-02 09:16 643次阅读

    OpenAI开源模型登陆IBM watsonx.ai开发平台

    OpenAI 已向公众发布了两款 AI 模型,允许开发者和企业可自由下载、运行并进行定制。其中一款模型现已部署在 IBM watsonx.
    的头像 发表于 08-26 15:36 760次阅读

    IBM发布全新升级watsonx.data数据平台

    随着企业不断扩展智能体(agents)和其他先进的 AI 应用,“数据困境”已经成为众多企业实施 AI 的首要挑战。IBM 正在致力于此,将它们与关键的非结构化数据连接起来,为企业大模型
    的头像 发表于 08-08 14:08 823次阅读

    后摩智能发布全新端边大模型AI芯片

    7月25日,WAIC 2025 前夕,后摩智能正式发布全新端边大模型 AI 芯片——后摩漫界M50,同步推出力擎系列 M.2卡、力谋系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边
    的头像 发表于 07-26 16:09 1248次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态资源,还
    发表于 04-13 19:52

    IBM携手英伟达AI数据平台推动企业级AI创新

    近日,IBM(纽约证券交易所:IBM)宣布与英伟达(纳斯达克股票代码:NVDA)开展全新合作,双方将基于英伟达 AI 数据平台参考架构(reference architecture)进
    发表于 03-24 19:20 411次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、低功耗和灵活扩展的需求。 []() 领先的计算
    发表于 03-19 17:54

    IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型

    ,进一步增强企业在安全、治理以及规模化部署方面的能力。 DeepSeek R1是IBMAI领域的一项重要创新,它采用了蒸馏模型技术,能够在保持模型性能的同时,显著减小
    的头像 发表于 02-14 10:21 870次阅读

    DeepSeek最新AI模型现已登陆IBM watsonx.ai平台

    ,工程和科学计算提供裨益。 利用已部署的模型(如 IBM Granite,Llama,DeepSeek等)和以下解决方案能力,开发者可以在 IBM watsonx.
    的头像 发表于 02-08 09:21 1038次阅读

    IBM携手欧莱雅开发首个可持续化妆品AI模型

    近日,IBM(纽约证券交易所:IBM)与全球领先的化妆品公司欧莱雅(L’Oréal)宣布最新合作成果,即利用 IBM 的生成式人工智能 (Gen AI) 技术和行业专长,发掘化妆品配方
    的头像 发表于 01-21 09:22 977次阅读

    Meta发布AI模型Meta Motivo,旨在提升元宇宙体验

    Meta公司近日宣布,将推出一款名为Meta Motivo的全新人工智能模型。该模型具备控制类似人类的数字代理动作的能力,有望为元宇宙的用户体验带来显著提升。 Meta Motivo的发布
    的头像 发表于 12-16 10:34 1348次阅读