0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在算力魔方上本地部署Phi-4模型

jf_23871869 来源:jf_23871869 作者:jf_23871869 2025-01-15 11:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

​作者:算力魔方创始人/英特尔边缘计算创新大使 刘力

前面我们分享了《Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑》,Llama 3.3 70B模型的发布,标志着开源AI模型在智能水平上的一大飞跃。它不仅达到了之前只有Llama 3.1 405B模型才具备的智能水平,而且还超越了11月发布的GPT-4o模型。

wKgZPGeHLW-ABC3FAAFm4cCBsoA793.png

本文我们将分享微软刚刚发布的Phi-4模型,其模型参数只有14B,是Llama3.3 70B的五分之一,但性能却跟Llama 3.3 70B模型差不多,甚至在GPQA和MATH两项上还超越了Llama3.3 70B!

参考链接:https://arxiv.org/pdf/2412.08905

本文将分享Phi-4 14B模型在算力魔方4060版上的部署过程。

一,算力魔方®简介

算力魔方®是一款可以DIY的迷你主机,采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择不同算力的计算模块,再搭配不同的 IO 模块可以组成丰富的配置,适应不同场景。

性能不够时,可以升级计算模块提升算力;IO 接口不匹配时,可以更换 IO 模块调整功能,而无需重构整个系统。

本文以下所有步骤将在带有英特尔i7-1265U处理器算力魔方®上完成验证。

二,安装Ollama

请按照《Gemma 2+Ollama在算力魔方上帮你在LeetCode解题》安装Ollama。

wKgZPGeHJcmAGKTfAAPzdFi2bXk106.png

三,运行Phi-4

使用下面的命令完成运行Phi-4:

ollama run phi4
wKgZPGeHJeuAN609AAGomLXNOs0320.png

四,测试Phi-4数学能力

输入下面的数学问题,测试Phi-4的数学能力:

A farmer has a rectangular field with a length of 2x + 5 meters and a width of x - 3 meters.

Part A: Find the area of the field in terms of x.

Part B: If the area of the field is 150 square meters, determine the value of x.

Part C: Calculate the perimeter of the field.

五,总结

使用Ollama可以方便快捷的将Phi-4模型本地化部署在算力魔方®上。

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方®”!

​审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51715
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16566
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU
    的头像 发表于 07-30 21:44 725次阅读

    基于魔方与PP-OCRv5的OpenVINO智能文档识别方案

    )团队最新推出的PP-OCRv5模型精度和效率实现了显著突破,结合Intel OpenVINO工具套件的硬件加速能力,能够为各类文档处理场景提供更强大的支持。 二,
    的头像 发表于 06-12 21:19 1411次阅读
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>与PP-OCRv5的OpenVINO智能文档识别方案

    基于魔方的智能文档信息提取方案

    的进步,使得自动化和智能化的文档信息提取成为现实。本方案结合了Intel OpenVINO平台的性能优化优势与百度飞桨(PaddlePaddle)提供的PP-OCRv4模型,旨在开发一款高性能、高精度的智能文档处理系统。
    的头像 发表于 05-15 10:37 500次阅读
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>的智能文档信息提取方案

    DeepSeek R1模型本地部署与产品接入实操

    针对VS680/SL1680系列大芯片,我们的研发团队正在研究将蒸馏后的轻量级DeepSeek模型(DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC
    的头像 发表于 04-19 16:32 609次阅读
    DeepSeek R1<b class='flag-5'>模型</b><b class='flag-5'>本地</b><b class='flag-5'>部署</b>与产品接入实操

    魔方IO扩展模块介绍 网络篇1

    一,魔方简介 魔方®AIPC是目前市面上唯一的模块化迷你电脑,
    的头像 发表于 04-09 14:33 758次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>IO扩展模块介绍 网络篇1

    如何在RAKsmart服务器实现企业AI模型部署

    AI模型的训练与部署需要强大的支持、稳定的网络环境和专业的技术管理。RAKsmart作为全球领先的服务器托管与云计算服务提供商,已成为企业部署
    的头像 发表于 03-27 09:46 762次阅读

    安霸大AI芯片接入DeepSeek R1

    安霸(Ambarela)人工智能领域持续发,已成功多款 AI 芯片,包括 N 系列大 AI 芯片
    的头像 发表于 02-17 13:36 872次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬件配置堪称豪华, AI
    发表于 02-14 17:42

    使用OpenVINO C# API轻松部署飞桨PP-OCRv4模型

    ​ 作者:魔方创始人/英特尔创新大使刘 《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》 收到了读者热烈反响,
    的头像 发表于 02-12 10:42 2019次阅读
    使用OpenVINO C# API轻松<b class='flag-5'>部署</b>飞桨PP-OCRv<b class='flag-5'>4</b><b class='flag-5'>模型</b>

    赶紧本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

    ​作者:魔方创始人/英特尔边缘计算创新大使 刘 前面我们分享了《
    的头像 发表于 01-21 14:29 4331次阅读
    赶紧<b class='flag-5'>在</b><b class='flag-5'>本地</b>运行与OpenAI-o1能力近似的DeepSeek-R1<b class='flag-5'>模型</b>

    如何在边缘端获得GPT4-V的能力:魔方+MiniCPM-V 2.6

    作者:魔方创始人/英特尔边缘计算创新大使 刘 前面我们分享了《
    的头像 发表于 01-20 13:40 1110次阅读
    如何在边缘端获得GPT<b class='flag-5'>4</b>-V的能力:<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>魔方</b>+MiniCPM-V 2.6

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 796次阅读

    魔方本地部署Phi-4模型

    模型
    jf_23871869
    发布于 :2025年01月15日 11:06:15