0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FedJAX的库结构和内容

Tensorflowers 来源:TensorFlow 作者:TensorFlow 2021-11-08 11:27 次阅读

联邦学习是一种机器学习设置,允许多个客户端(即移动设备或者整个组织,取决于正在参与的任务)在一个中央服务器的编排下,协同训练同一个模型,同时还能保持训练数据的离散性。例如,通过联邦学习,可以基于永远不会从移动设备中消失的用户数据训练虚拟键盘语言模型。

要实现这点,联邦学习算法首先需要初始化服务器中的模型,然后完成以下对于每一轮训练而言都非常关键的三步:

1. 服务器将模型发送到一组采样客户端。

2. 这些采样客户端在本地数据中训练模型。

3. 训练完成之后,客户端将更新后的模型发送到服务器,然后服务器将所有这些模型汇总在一起。

随着人们对隐私和安全的日益注重,联邦学习已成为一个尤为活跃的研究领域。对于这个日新月异的领域,能够轻松将想法转换为代码、快速迭代,以及比较和复制现有基线的重要性不言而喻。

日新月异的领域

https://research.google/pubs/pub49232/

因此,我们很高兴为大家介绍 FedJAX。FedJAX 是一个基于 JAX 的开源库,适用于注重研究易用性的联邦学习模拟。FedJAX 拥有适用于执行联邦算法、预打包的数据集、模型和算法以及高模拟速度的简单基本模块,旨在让研究员能够更快速、更容易地开发和评估联邦算法。

FedJAX

https://github.com/google/fedjax

JAX

https://github.com/google/jax

在这篇文章中,我们将讨论 FedJAX 的库结构和内容。我们会证明,在 TPU 中,FedJAX 可通过 EMNIST 数据集的联合平均,在几分钟内就能训练完模型。而通过 Stack Overflow 数据集的标准超参数 (Hyperparameter),则需要将近 1 小时。

EMNIST

https://github.com/google/fedjax/blob/main/fedjax/datasets/emnist.py

联合平均

https://fedjax.readthedocs.io/en/latest/fedjax.algorithms.html#module-fedjax.algorithms.fed_avg

Stack Overflow

https://github.com/google/fedjax/blob/main/fedjax/datasets/stackoverflow.py

库结构

FedJAX 注重易用性,因此仅引进了少量新概念。使用 FedJAX 编写的代码与学术论文用于描述新颖算法的伪代码类似,因此极易上手。除此之外,虽然 FedJAX 提供了联邦学习的基本模块,但用户可以将其替换为最基本的实现(仅使用 NumPy 和 JAX),并且仍然可以将整体训练速度保持在一个合理的区间。

与学术论文用于描述新颖算法的伪代码类似

https://github.com/google/fedjax/blob/main/README.md#quickstart

NumPy

https://numpy.org/

包含的数据集和模型

在当前联邦学习研究领域,存在各种各样常用的数据集和模型,例如图像识别 (Image recognition)、语言建模 (Language modeling) 等。越来越多这样的数据集和模型无需安装即可直接用于 FedJAX,因此用户无需从头开始编写预处理数据集和模型。这不仅有利于对不同的联邦算法进行有效比较,还加速了新算法的开发。

目前,FedJAX 与以下数据集和示例模型一起打包:

EMNIST-62,一项字符识别任务

https://github.com/google/fedjax/blob/main/fedjax/datasets/emnist.py

Shakespeare,一项下一字符预测任务

https://github.com/google/fedjax/blob/main/fedjax/datasets/shakespeare.py

Stack Overflow,一项下一字词预测任务

https://github.com/google/fedjax/blob/main/fedjax/datasets/stackoverflow.py

除了以上标准设置,FedJAX 还提供用于创建新数据集和模型的工具,这些新数据集和模型可以与库的其余内容共同使用。

工具

https://fedjax.readthedocs.io/en/latest/fedjax.html#federated-data

此外,FedJAX 支持联合平均的标准实现,也支持用于在分散式示例上训练共享模型的其他联邦算法,例如自适应联邦优化器、不可知联合平均以及 Mime,从而让比较和评估现有算法变得更加简单。

自适应联邦优化器

https://fedjax.readthedocs.io/en/latest/fedjax.algorithms.html#module-fedjax.algorithms.fed_avg

不可知联合平均

https://fedjax.readthedocs.io/en/latest/fedjax.algorithms.html#module-fedjax.algorithms.agnostic_fed_avg

Mime

https://fedjax.readthedocs.io/en/latest/fedjax.algorithms.html#module-fedjax.algorithms.mime

性能评估

我们在两项任务上对自适应联合平均的标准 FedJAX 实现进行了基准测试:图像识别任务(测试联邦 EMNIST-62 数据集)和下一字词预测任务(测试 Stack Overflow 数据集)。联邦 EMNIST-62 数据集较小,由 3400 名用户和他们创建的示例(共 62 个拉丁字母数字字符)构成;而 Stack Overflow 数据集较大,由数百万问题和答案构成(这些问题和答案来自于拥有成千上万名用户的 Stack Overflow 论坛)。

自适应联合平均

https://openreview.net/pdf?id=LkFG3lB13U5

联邦 EMNIST-62 数据集

https://github.com/google/fedjax/blob/main/fedjax/datasets/emnist.py

Stack Overflow 数据集

https://github.com/google/fedjax/blob/main/fedjax/datasets/stackoverflow.py

我们在专门用于机器学习的各种硬件上测量性能。对于联邦 EMNIST-62,我们在 GPU (NVIDIA V100) 和 TPU(Google TPU v2 上的 1 个 TensorCore)加速器上对单一模型进行了 1500 轮训练(每轮 10 个客户端)。

对于 Stack Overflow,我们在 GPU (NVIDIA V100)、单核 TPU(Google TPU v2 上 1 个 TensorCore)及多核 TPU(Google TPU v2 上 8 个 TensorCore)上对单一模型进行了 1500 轮训练(每轮 50 个客户端)。其中,在 GPU 上使用 jax.jit,在单核 TPU 上仅使用 jax.jit,而在多核 TPU 上使用 jax.pmap。在下方图表中,我们记录了每轮训练的平均完成时间、完整评估测试数据所需时间以及整体执行时间(整体执行包含训练和完整评估)。

通过标准超参数和 TPUs,联邦 EMNIST-62 的整个实验可以在几分钟之内完成,而 Stack Overflow.的实验需要 1 小时左右的时间。

我们还评估了随着每轮客户端数量增加之后的 Stack Overflow 平均每轮训练时长。通过比较图表上 8 核 TPU 与单核 TPU 的平均每轮训练时长,我们很容易就能发现,如果每轮参与的客户端数量较多,则使用多核 TPU 能极大缩短运行时间(对微分化的不公开学习等应用来说非常有帮助)。

微分化的不公开学习

https://openreview.net/forum?id=BJ0hF1Z0b

结论和未来研究方向

在这篇文章中,我们介绍了 FedJAX 这种适用于研究、速度较快且简单易用的联邦学习模拟库。我们希望 FedJAX 能推动联邦学习的深入研究,同时引起人们对于该领域的更多关注。未来,我们计划继续发展现有算法集、聚合机制、数据集和模型。

欢迎各位随时查阅我们的教程笔记本,或者亲自体验 FedJAX!

教程笔记本

https://fedjax.readthedocs.io/en/latest/

亲自体验 FedJAX

https://github.com/google/fedjax/blob/main/examples

若想进一步了解 FedJAX 及其与 Tensorflow Federated 等平台的关系,请参阅我们的论文、README 或常见问题解答。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8125

    浏览量

    82543
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130577

原文标题:FedJAX:使用 JAX 进行联邦学习模拟

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    HarmonyOS鸿蒙原生应用开发设计- 音效

    HarmonyOS设计文档中,为大家提供了独特的音效,开发者可以根据需要直接引用。 音效可以分为拟物音效、系统音效、特殊效果音。具体分为提示音、UI交互音、来电铃声、闹铃、拟物音效、乐器、科幻等
    发表于 10-30 16:09

    HarmonyOS鸿蒙原生应用开发设计- 图标

    HarmonyOS设计文档中,为大家提供了独特的图标,开发者可以根据需要直接引用。 图标可以分为双色图标、填充图标、线性图标。具体分为 键盘、箭头、连接状态、媒体、人、设备、索引、通信、文件
    发表于 10-27 16:40

    物联网开发需要学习哪些内容

    和需要掌握的技能。 1. 物联网软件开发必备编程技术: Linux C语言、数据结构 核心技能内容: 必备的Linux命令; C语言的基础知识; C语言的数组、指针和函数; 数据结构中的线性表、栈和队列用法及实现; 二叉树递归遍
    的头像 发表于 10-09 17:23 795次阅读

    C语言结构体讲解

    在C语言中有一块极容易被忽略,但是对于嵌入式编程来说用处特别大的内容——结构
    发表于 10-01 13:27 151次阅读
    C语言<b class='flag-5'>结构</b>体讲解

    OTG IP主机Cube介绍

    USB主机Cube架构与文件组织• USB主机库架构• USB主机库文件组织• USB主机内核文件• USB主机类文件• USB主机Cube库内核模块• 内核API,用户回调与数据结构• 内核状态机概述• 具备底层驱动的内核接口• USB主机Cube
    发表于 09-11 08:04

    USB IP设备

    项目结构• 库函数、USB库函数• 类相关文件• 应用相关文件• 代码结构• 初始化• USB中断处理流程• 回调接口函数• 如何基于已有例程做自己的应用裁剪• 需要用到的EP及其静态配置(硬件
    发表于 09-07 07:55

    RealView编译工具和浮点支持指南

    ARM体系结构的应用程序二进制接口(ABI)是一系列规范,描述了将源程序转换为目标文件的特定于处理器的方面。 任何符合ABI相关方面的工具链生成的对象文件都可以链接在一起,以生成最终的可执行映像或
    发表于 08-12 07:27

    关于RTT使用STM32加密STM32_Cryptographic未找到问题

    库文件相关操作: 1.已将文件添加至RTT工程文件夹的“Libraries”目录: 目录内容: 2.工程中已将对应头文件和路径添加:
    发表于 08-04 16:12

    如何使用Microsoft Visual Studio构建本机Windows on Arm

    许多用C和C++编写的提供二进制构建,使它们易于立即使用。但是,如果某个特定的没有为您的平台提供二进制文件,则必须构建源代码在你可以使用图书馆之前。提供二进制构建的包括以下内容
    发表于 08-02 08:26

    数据应用系统结构(2)#数据技术

    数据
    未来加油dz
    发布于 :2023年07月11日 16:49:18

    数据应用系统结构(1)#数据技术

    数据
    未来加油dz
    发布于 :2023年07月11日 16:48:31

    C语言结构体对齐介绍

    大家好,我是嵌入式老林,从事嵌入式软件开发多年,今天分享的内容是C语言结构体对齐介绍,希望能对你有所帮助
    发表于 07-11 11:50 611次阅读
    C语言<b class='flag-5'>结构</b>体对齐介绍

    如何在NodeMCU上使用Prampec的SoftTimer

    我想在 NodeMCU 上使用 Prampec 的 SoftTimer 。 我可以编译和创建使用引脚 D0..D4 的任务,但是当我尝试使用引脚 D5-D8 时,没有任何附加内容。 我在
    发表于 06-06 06:11

    内容激励】前沿资讯内容扶持计划

    计划背景 本次激励计划面向电子行业优质企业,旨在为企业提供更多流量扶持与曝光展示。同时,针对优质技术内容,可向管理员申请电子发烧友平台推荐位展示,与电子发烧友平台共建专业、优质的企业内容生态
    发表于 05-19 16:49

    PS-9305S三轴荷重试验机内容结构?|深圳磐石测控仪器

    PS-9305S三轴荷重试验机内容结构?|深圳磐石测控仪器
    的头像 发表于 05-17 11:08 324次阅读
    PS-9305S三轴荷重试验机<b class='flag-5'>内容</b><b class='flag-5'>结构</b>?|深圳磐石测控仪器