0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过利用机器学习模型破译古籍

星星科技指导员 来源:NVIDIA 作者:Michelle Horton 2022-04-08 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了揭示过去的秘密,世界各地的历史学者花费毕生精力翻译古代手稿。圣母大学的一个研究小组希望帮助这项任务,用一种新开发的机器学习模型来翻译和记录几百年前的手写文档。

利用圣加尔修道院图书馆的数字化手稿和一个考虑到人类感知的机器学习模型 study 在深度学习转录能力方面有显著提高。

“我们正在处理历史文件,这些文件的书写风格早已过时,可以追溯到几个世纪以前,并且使用拉丁语等语言,而拉丁语已经很少使用了。你可以得到这些材料的美丽照片,但我们已经着手做的是以一种模仿专家读者眼睛对页面感知的方式自动转录,并提供快速、可搜索的文本阅读,”圣母大学副教授、资深作者沃尔特·舍勒在新闻稿中说。

圣加尔修道院图书馆建于 719 年,是世界上最古老、最丰富的图书馆藏品之一。该图书馆藏有大约 160000 卷书和 2000 份手稿,可追溯到八世纪。在羊皮纸上用现在很少使用的语言手工书写,这些材料中的许多尚未被阅读——这是一笔潜在的历史档案财富,等待发掘。

机器学习方法能够自动转录这些类型的历史文件已经在工作中,但挑战仍然存在。

到目前为止,大型数据集对于提高这些语言模型的性能是必不可少的。由于可供查阅的书籍数量巨大,这项工作需要时间,并且需要相对较少的专家学者进行注释。缺少知识,如从未编纂过的中世纪拉丁语词典,构成了更大的障碍。

该团队将传统的机器学习方法与研究物理世界和人类行为之间关系的视觉心理物理学相结合,以创建更多信息丰富的注释。在这种情况下,他们在处理古代文本时将人类视觉测量纳入神经网络的训练过程。

“这是机器学习中通常不使用的策略。我们通过这些心理物理测量来标记数据,这些测量直接来自于通过行为测量对感知进行的心理学研究。然后,我们通知网络在感知这些角色方面的常见困难,并可以根据这些测量结果进行纠正,” Scheirer 说。

为了训练、验证和测试这些模型,研究人员使用了一套来自圣加尔的可追溯到九世纪的数字化手写拉丁手稿。他们要求专家阅读并将文本行中的手动抄本输入定制的软件中。测量每次抄写的时间,可以洞察单词、字符或段落的难度。根据作者的说法,这些数据有助于减少算法中的错误,并提供更真实的读数。

所有的实验都是使用 cuDNN-accelerated PyTorch 深度学习框架和 GPU 。“如果没有 NVIDIA 硬件和软件,我们肯定不可能完成我们所做的事情。

pYYBAGJPlEWAa7tcAAGssGNMcGs826.png

该研究引入了一种新的深度学习损失公式,该公式结合了人类视觉测量,可应用于手写文档转录的不同处理管道。信贷: Scheirer 等人/ IEEE

团队仍在努力改进某些方面。损坏和不完整的文档以及插图和缩写对模型提出了特殊的挑战。

“由于互联网规模的数据和 GPU 硬件,人工智能达到了拐点,这将使文化遗产和人文学科与其他领域一样受益。我们只是初步了解我们可以对这个项目做些什么。

关于作者

Michelle Horton 是 NVIDIA 的高级开发人员通信经理,拥有通信经理和科学作家的背景。她在 NVIDIA 为开发者博客撰文,重点介绍了开发者使用 NVIDIA 技术的多种方式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134471
  • 互联网
    +关注

    关注

    55

    文章

    11321

    浏览量

    108861
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    孔夫子旧书网开放平台接口实战:古籍图书检索与商铺数据集成

    本文详解孔夫子旧书网古籍数据接口的实战调用,涵盖认证签名、古籍检索、商铺集成与特色数据处理四大场景,提供可复用的Python代码及避坑指南,助力学术研究、旧书商管理与古籍数字化落地。
    的头像 发表于 09-23 13:59 349次阅读

    利用NVIDIA Cosmos模型训练通用机器

    机器人领域的一大核心挑战在于如何让机器人掌握新任务,而无需针对每个新任务和环境耗费大量精力收集和标注数据集。NVIDIA 的最新研究方案通过生成式 AI、世界基础模型(如 NVIDIA
    的头像 发表于 08-05 16:22 1746次阅读
    <b class='flag-5'>利用</b>NVIDIA Cosmos<b class='flag-5'>模型</b>训练通用<b class='flag-5'>机器</b>人

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 2636次阅读

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练
    的头像 发表于 07-14 11:49 764次阅读
    <b class='flag-5'>通过</b>NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这一角落。在本文中,我们将把一个机器学习模型(神经网络)部署到边缘设备上,利用从ModbusTCP寄存器获取的实时数据来预测一台复古音频放大器的当前
    的头像 发表于 06-11 17:22 786次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!

    【「零基础开发AI Agent」阅读体验】+Agent的案例解读

    输入问题或选中的古籍文字进行意图识别。若回答需引用字典条目、古籍数据库检索结果,系统会自动获取相关信息,通过大语言模型综合生成回复,确保内容准确性与关联性。​ 2)全文检索和语义检索
    发表于 05-14 11:23

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习
    的头像 发表于 02-13 09:39 625次阅读

    【ELF 2学习板试用】利用RKNN-Toolkit2实现rknn模型转换

    为rknn模型,然后在板端利用RKNN-Toolkit2-Lite2运行rknn模型以实现GPU加速。而rknn模型的转换则需要用的瑞芯微官方提供的RKNN-Toolkit2转换工具,
    发表于 02-09 17:57

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将机器学习
    的头像 发表于 01-25 17:05 1211次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    集对模型进行进一步训练的过程。 大模型微调是利用预训练模型的权重和特征,通过在新任务数据集上的训练,对
    发表于 01-14 16:51

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    。 多模态融合的创新与突破 机器人控制技术的另一个重要突破在于多模态大模型的应用。相比于仅通过文字进行人机交互的传统方法,现代机器人能够融合视觉、声音、定位等多模态输入信息,为任务执行
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智
    发表于 12-24 15:03

    cmp在机器学习中的作用 如何使用cmp进行数据对比

    机器学习领域,"cmp"这个术语可能并不是一个常见的术语,它可能是指"比较"(comparison)的缩写。 比较在机器学习中的作用 模型
    的头像 发表于 12-17 09:35 1324次阅读

    构建云原生机器学习平台流程

    构建云原生机器学习平台是一个复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 676次阅读