0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿拉伯语自然语言处理模型NOOR的详细介绍

文传商讯 来源:文传商讯 作者:文传商讯 2022-04-12 11:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

阿布扎比先进技术研究委员会旗下的全球研究中心和应用研究支柱部门技术创新研究所(TII)今天宣布推出NOOR语言处理模型,这是迄今为止全球规模居首的阿拉伯语自然语言处理(NLP)模型。

TII的高级研究人员和人工智能专家团队与LightOn联手,对这个阿拉伯语NLP模型进行了改进。LightOn是一家专为企业提供超大规模机器智能的技术公司。NOOR模型能够执行超出语言领域的任务,可提供覆盖整个端到端处理管道的高质量数据,包括大规模数据抓取、过滤和管理。该模型可促进超大规模数据的分布式训练和服务,基于该模型的应用具有高效推理能力,并可针对特定领域进行模型调整。

TII和ASPIRE首席执行官Ray O. Johnson博士表示:“这一进展将大幅提升我们的研究能力和资质,并提升阿布扎比和阿联酋作为重要研究生态系统的地位。我们的专家团队再次证明,阿布扎比和阿联酋地区可以取得具有世界影响力的、突破性的研发成果。”

TII人工智能跨学科中心部门主任Ebtesam Almazrouei博士表示:“在自然语言处理领域,大型语言模型不断涌现。能推出这个拥有100亿个参数的先进模型,我们感到很自豪。这是全球规模居首的阿拉伯语NLP模型。为训练该模型,我们采集了一套独一无二的大型阿拉伯语数据集。相关工作历经数月时间,包括对各种来源数据的整理、剔除和过滤。在此特别感谢参与该项目的整个团队,他们使NOOR成为世界各地学者和企业首选的阿拉伯语研究模型。”

TII数字科学研究中心和人工智能跨学科中心部门首席研究员Mérouane Debbah教授在发布会上表示:“通过NOOR,TII利用在大型语言模型方面的专有技术,扩大了现代标准阿拉伯语模型的范围,以在新一代人工智能研究中建立跨学科的先进专长。”

NOOR拥有超过300亿字的独特数据集,涵盖网络数据、书籍、诗歌、新闻文章和技术信息等来源,从而打造出全球规模居首的高质量跨领域阿拉伯语数据集,并大幅拓宽了该模型的适用范围。

Ebtesam Almazrouei博士表示,NOOR模型基于流行的Transformer架构,仅包含解码器,结构与GPT-3相似,其设计旨在处理生成类任务。经过升级的架构引入了机器学习领域的最新发展,包括更好的位置嵌入等改进。为确保NOOR大规模数据集的质量,TII团队设计了一个基于机器学习技术的自动过滤管道。相关工具可以识别优质参考文本,并保障模型不受垃圾内容污染。

NOOR利用先进的3D并行技术,在配备128个A100 GPU的高性能计算资源上进行了训练,该过程采用分布式计算模式,能够确保有效利用可用的硬件资源。

人工智能跨学科中心部门主任指出,NOOR只是该部门努力为更广泛的阿联酋人工智能战略做出贡献的第一步。

该模型以阿拉伯语中的“光”命名,以体现模型旨在启迪人类智慧的宗旨。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261538
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51713
  • 自然语言处理

    关注

    1

    文章

    629

    浏览量

    14563
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知
    的头像 发表于 11-10 17:30 514次阅读
    云知声论文入选<b class='flag-5'>自然语言</b><b class='flag-5'>处理</b>顶会EMNLP 2025

    小白学大模型:国外主流大模型汇总

    数据科学AttentionIsAllYouNeed(2017)https://arxiv.org/abs/1706.03762由GoogleBrain的团队撰写,它彻底改变了自然语言处理(NLP
    的头像 发表于 08-27 14:06 670次阅读
    小白学大<b class='flag-5'>模型</b>:国外主流大<b class='flag-5'>模型</b>汇总

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    )真香,是不是可以没有YOLO和OCR了? - 北京合众恒跃科技有限公司 - 电子技术论坛 - 广受欢迎的专业电子论坛!已经详细介绍了,这里不再赘述。 四、测试验证:用自然语言控制开发板 启动服务器
    发表于 08-23 13:10

    沙特阿拉伯国家电力公司SEC与华为数字能源签署电网仿真测试合作协议

    【沙特阿拉伯,利雅得,2025年7月3日】沙特阿拉伯国家电力公司(以下简称“SEC”)、沙特阿拉伯国家电网公司(以下简称“NG”)和华为数字能源正式签署电网仿真测试合作协议,三方将联合建设电网仿真
    的头像 发表于 07-10 14:47 3565次阅读
    沙特<b class='flag-5'>阿拉伯</b>国家电力公司SEC与华为数字能源签署电网仿真测试合作协议

    沙特阿拉伯新能源整车认证

    沙特阿拉伯对新能源汽车(包括纯电动汽车、插电式混合动力汽车等)的整车认证主要遵循其国家标准和海湾合作委员会(GCC)的通用法规。以下是沙特新能源汽车整车认证的关键要点和流程:1.适用法规与标准
    的头像 发表于 06-21 23:53 831次阅读
    沙特<b class='flag-5'>阿拉伯</b>新能源整车认证

    云知声四篇论文入选自然语言处理顶会ACL 2025

    结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大
    的头像 发表于 05-26 14:15 1042次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b><b class='flag-5'>处理</b>顶会ACL 2025

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。https
    的头像 发表于 04-30 18:34 1062次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    自然语言提示原型在英特尔Vision大会上首次亮相

    在英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 790次阅读

    ​VLM(视觉语言模型)​详细解析

    视觉语言模型(Visual Language Model, VLM)是一种结合视觉(图像/视频)和语言(文本)处理能力的多模态人工智能模型
    的头像 发表于 03-17 15:32 7586次阅读
    ​VLM(视觉<b class='flag-5'>语言</b><b class='flag-5'>模型</b>)​<b class='flag-5'>详细</b>解析

    语言模型的解码策略与关键优化总结

    的技术参考。主要涵盖贪婪解码、束搜索、采样技术等核心解码方法,以及温度参数、惩罚机制等关键优化手段。大型语言模型的技术基础大型语言模型是当代自然语言
    的头像 发表于 02-18 12:00 1072次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    IBM与联想扩大战略技术合作伙伴关系

    近日,IBM 与联想在沙特阿拉伯电子科技及信息技术展(LEAP 2025)大会上宣布,将继续扩大双方的战略技术合作伙伴关系,旨在帮助沙特阿拉伯王国的客户实现生成式人工智能(Gen AI)的规模化应用。
    的头像 发表于 02-14 09:42 909次阅读

    耐能与沙特阿拉伯国家半导体中心达成战略合作

    基于对全球人工智能市场趋势以及中东地区(尤其是沙特阿拉伯)新兴机遇的深刻洞察。耐能(Kneron)经过战略考量,选择与沙特国家半导体中心(NSH)合作,在利雅得设立子公司。沙特阿拉伯国家半导体中心的使命是在沙特打造一个无晶圆厂半导体生态系统 。
    的头像 发表于 01-09 13:48 808次阅读

    望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!

    语言模型的崛起为智能化应用开辟了新的可能性。借助深度学习技术,这些模型能够理解和生成自然语言处理复杂的文本和语义信息。这使得它们在诸如人
    的头像 发表于 01-08 13:44 1039次阅读

    沙特阿拉伯发布《利雅得宣言》 共筑包容性、创新性和有影响力的人工智能未来

    沙地阿拉伯利雅得2024年12月17日 /美通社/ -- 在第19届联合国互联网治理论坛(IGF)暨2024年利雅得互联网治理论坛的开幕式上,沙特阿拉伯王国宣布了《利雅得宣言》,本届论坛旨在促进各国
    的头像 发表于 12-18 09:56 544次阅读

    LLMWorld上线代码翻译新工具——问丫·码翻译侠,快来体验!

    01. 工具介绍 aicode.llmworld.net 问丫·码翻译侠 是一款由LLMWorld新推出的代码翻译工具,支持各种语言之间的翻译,包括计算机语言
    的头像 发表于 12-09 11:11 1603次阅读
    LLMWorld上线代码翻译新工具——问丫·码<b class='flag-5'>语</b>翻译侠,快来体验!