0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

把大模型装进小盒子:这个小魔盒直击端侧AIGC的痛点!

算能开发者社区 2024-05-10 08:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

私有本地化部署:智能硬件的未来

随着当下数字化的高速发展,今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生,在大模型普惠应用井喷的时代,这类产品的使用存在许多门槛和风险,比如高昂的服务器部署成本、在运行过程中会过度依赖网络状态、以及难以保障数据的安全性等问题。

为了解决大模型产品使用期间所产生的算力成本高、网络波动、数据隐私等问题,Firefly开源团队推出可本地化部署的智能盒子:AIBOX-1684X

Firefly智能新品:智能算力小魔盒

AIBOX-1684X支持主流大模型私有化部署,仅掌心大小的体积就能把智算能力私有化,能够满足个性化的智能部署!其算力高达32Tops,拥有八核2.3GHz处理器,兼具稳定性、私密性、精致小巧等特性。

支持主流大模型

AIBOX-1684X几乎支持目前主流大模型的本地化运行,包括LLaMa3,ChatGLM3,Qwen等语言大模型,SAM等视觉大模型,以及Stable Diffusion 智能绘图。

私有化部署

本地化部署,无惧断网

无需网络即可使用智算的能力,不受网络状态影响,任务运行更稳定。

支持主流

开源透明,安全无风险

使用全开源智能模型部署工具链,透明可信任,做到零安全隐患。

f98d6aa0-0e64-11ef-9118-92fbcf53809c.jpg

精致小巧,随处部署

仅掌心大小,10cm内的小方盒,表面柔润精致的铝合金切割工艺,在哪部署都合适。

f9a0fd72-0e64-11ef-9118-92fbcf53809c.jpg

极致性能:快速响应,无需多等

千字文本生成仅需10.2秒

AIBOX在本地运行时,拥有极快的响应时间,能够更好地提升用户体验。例如在Qwen1.5-1.8B模型中,推理性能可达到32.5 token/s,相当于其生成一篇1000字的文章仅需约10.2秒,可实现自然语言的快速问答

f9b256f8-0e64-11ef-9118-92fbcf53809c.png

标准图像生成仅需7秒

支持 AIGC 领域的 Stable DiffusionV1.5 图像生成模型,在Stable Diffusion V1.5模型中,生成512* 512尺寸的图片仅需约7秒。

开箱即用:已适配主流大模型

Meta旗下最新开源大模型Llama3运行演示:


清华与智谱合作研发的ChatGLM3-6B演示:


阿里通义千问开源大模型Qwen1.5-1.8B演示:


支持多种深度学习框架

AIBOX支持所有主流大模型深度学习框架,包括TensorFlow、PyTorch、MXNet、PaddlePaddle、ONNX和Darknet,并支持自定义算子开发。

高配硬件性能,运行畅通无阻

搭载SOPHON算能智算处理器BM1684X,最高主频2.3GHz,最高支持32路1080P H.264/H.265的视频解码,32路1080P高清视频全流程处理(解码+智能分析)

f9e80906-0e64-11ef-9118-92fbcf53809c.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296518
  • AIGC
    +关注

    关注

    1

    文章

    391

    浏览量

    3149
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4963
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    引领模型落地!Firefly-RK182X 开发套件上线发售

    海量参数的大模型给AI行业带来颠覆性的体验,然而在设备中,由于有限的DRAM带宽、硬件算力、存储容量等瓶颈,让
    的头像 发表于 11-26 16:33 786次阅读
    引领<b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>落地!Firefly-RK182X 开发套件上线发售

    国产超新星|EA500I PRO智能工作站:小盒子大能量,千元级解锁大模型

    随着AI从小模型向大模型的加速渗透,算力已成为企业构建智算能力的核心关键。对于渴望切入AI赛道的中小企业,既具备成本优势又能快速部署的边缘计算盒子,无疑是理想的选择;但市场上超100T算力的边缘计算
    的头像 发表于 11-11 10:53 1127次阅读
    国产超新星|EA500I PRO智能工作站:<b class='flag-5'>小盒子</b>大能量,千元级解锁大<b class='flag-5'>模型</b>

    产品案例 | 遛“狗”新方式,盒子来帮忙

    当一只机器狗被一个巴掌大的小盒子操控,躲避障碍、跟随指令完成转身、停止等动作时,围观人群纷纷发出惊叹:“这么小的盒子,居然能‘溜’机器狗?”。这个小盒子”,正是机器狗的“智慧大脑”,
    的头像 发表于 09-08 12:13 3932次阅读
    产品案例 | 遛“狗”新方式,<b class='flag-5'>盒子</b>来帮忙

    芯圣电子重磅推出一站式HC AI玩具盒子服务方案

    核心优势提供一站式PCBA&云端服务:提供完整PCBA方案和云端服务,原厂芯片配合专业设计;支持各大主流⼤模型平台:无缝接入
    的头像 发表于 08-15 14:28 646次阅读
    芯圣电子重磅推出一站式HC AI玩具<b class='flag-5'>盒子</b>服务方案

    芯圣电子重磅推出一站式HC AI玩具盒子服务方案

    核心优势提供一站式PCBA&云端服务:提供完整PCBA方案和云端服务,原厂芯片配合专业设计;支持各大主流⼤模型平台:无缝接入Open
    的头像 发表于 08-15 14:26 1205次阅读
    芯圣电子重磅推出一站式HC AI玩具<b class='flag-5'>盒子</b>服务方案

    华为CANN与智谱GLM模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM模型已完成与CANN的适配。这标志着国产大模型与计算架构在
    的头像 发表于 08-11 11:00 2196次阅读

    SiLM228x系列SiLM2285 600V/4A半桥驱动,高压高功率应用

    600V/4A/4A半桥门极驱动器(SOP8封装),正是为解决这些难题而生,为工业与新能源应用提供高效、可靠的驱动解决方案。核心技术突破,行业: 超强抗干扰能力: 卓越的抗负向
    发表于 08-08 08:46

    隧道工程LoRa无线监测设备集成方案 隧道深部监测

    隧道工程LoRa无线监测设备集成方案 隧道深部监测 河北稳控科技专业从事岩土工程信息化监测设备(监测仪器、仪表及监测系统)。基于隧道监测实际情况,结合工程环境情况,特推出一站式
    的头像 发表于 07-28 16:29 334次阅读

    终于有人模型说清楚了

    ""大模型?在聊具体内容之前,先解释一下这个名字的由来。在计算机和通信领域,我们通常整个系统分为几个层次:云端(Cloud):远程的数
    的头像 发表于 07-24 12:03 1634次阅读
    终于有人<b class='flag-5'>把</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>说清楚了

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    模型全链路分析功能,针对AI应用开发的三大逐个击破。 当前AI应用开发者在使用开发工具时会面临一个很头疼的问题,种类多、功能不聚合、过于碎片化,导致开发过程非常复杂。Neuron Studio
    发表于 04-13 19:52

    AI大模型侧部署正当时:移远端AI大模型解决方案,激活场景智能新范式

    在AI技术飞速发展的当下,AI大模型的应用正从云端向加速渗透。 作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型
    发表于 03-27 11:26 418次阅读
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:移远端<b class='flag-5'>侧</b>AI大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    AI大模型侧部署正当时:移远端AI大模型解决方案,激活场景智能新范式

    在AI技术飞速发展的当下,AI大模型的应用正从云端向加速渗透。作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型
    的头像 发表于 03-26 19:05 985次阅读
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b>侧部署正当时:移远端<b class='flag-5'>侧</b>AI大<b class='flag-5'>模型</b>解决方案,激活场景智能新范式

    新能源电力直流系统:绝缘监测最优解

    新能源电力直流系统:绝缘监测最优解
    的头像 发表于 02-13 10:05 547次阅读
    <b class='flag-5'>直</b><b class='flag-5'>击</b>新能源电力直流系统<b class='flag-5'>痛</b><b class='flag-5'>点</b>:绝缘监测最优解

    AIGC入门及鸿蒙入门

    人工智能生成内容(AIGC)和鸿蒙系统是当前科技领域的两个热门话题。以下是对它们的入门指南: AIGC入门 1. 基础概念: AIGC,全称Artificial Intelligence
    发表于 01-13 10:32

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用需求增加,
    的头像 发表于 12-12 10:35 1284次阅读