0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Effective TensorFlow 2.0高效开发指南

电子工程师 来源:lp 2019-03-31 11:40 次阅读

前段时间TF发布了2.0版本,今天略读了一番,发现新特性确实可以在开发中节省很多时间。阅读的同时,顺便将开发指南翻译了一点,如有错误欢迎指正。

Effective TensorFlow 2.0

为使TensorFLow用户更高效,TensorFlow 2.0中进行了多出更改。TensorFlow 2.0删除了篇冗余API,使API更加一致(统一RNNs, 统一优化器),并通过Eager execution更好地与Python集成。

许多RFCs已经解释了TensorFlow 2.0带来的变化。本指南介绍了TensorFlow 2.0应该怎么进行开发。这假设您已对TensorFlow 1.x有一定了解。

A brief summary of major changes

API Cleanup

许多API在TF 2.0中进行了移动或删除。一些主要的变化包括删除tf.app,tf.flags,使tf.logging支持现在开源的absl-py,重新生成项目的tf.contribe,通过清理tf.*中那些较少使用的命名空间,例如tf.math。一些API已替换为自己的2.0版本-tf.summary,tf.keras.metrics, 和tf.keras.optimizers。最快升级应用这些重命名带来的变化可使用v2升级脚本。

Eager execution

TensorFlow 1.x要求用户通过tf.*API手动的将抽象语法树(图)拼接在一起。然后它要求用户通过一组输入、输出张量传递给session.run()从而手动编译调用这个图。TensorFlow 2.0 Eager execution可以像Python那样执行,在2.0中,graph 和 session会像实现细节一样。

值得注意的是tf.control_dependencies()不再需要了,因为所有代码都是行顺序执行的(用tf.function声明)。

No more globals

TensorFlow 1.x严重依赖隐式全局命名空间。当你调用tf.Variable(),它会被放入默认图中,即使你忘了指向它的Python变量,它也会被保留在那里。然后你可以恢复它,但前提是你得知道它创建时的名称。如果你无法控制变量的创建,这很难做到。其结果是,各种各样的机制,试图帮助用户再次找到他们的变量,以及为框架找到用户创建的变量:Variable scopes, global collections。例如tf.get_global_step(),tf.global_variables_initializer(),还有优化器隐式计算所有可训练变量的梯度等等。TensorFlow 2.0消除了这些机制(Variable 2.0 RFC)默认支持的机制:跟踪你的变量!如果你忘记了一个tf.Variable,它就会当作垃圾被回收。

Functions, not sessions

session.run()几乎可以像函数一样调用:指定输入和被调用的函数,你可以得到一组输出。在TensorFlow 2.0中,您可以使用Python函数tf.function()来标记它以进行JIT编译,以便TensorFlow将其作为单个图运行(Function 2.0 RFC)。这种机制允许TensorFlow 2.0获得图模型所有的好处:

性能:函数可以被优化(node pruning, kernel fusion, etc.)

可移植性:该功能可以被导出/重新导入(SavedModel 2.0 RFC),允许用户重用和共享模块化TensorFlow功能。

# TensorFlow 1.X

outputs = session.run(f(placeholder), feed_dict={placeholder: input})

# TensorFlow 2.0

outputs = f(input)

凭借穿插Python 和TensorFlow代码的能力,我们希望用户能够充分利用Python的表现力。除了在没有Python解释器的情况下执行TensorFlow,如mobile, C++, 和 JS。为了帮助用户避免在添加时重写代码@tf.function, AutoGraph会将Python构造的一个子集转换为他们的TensorFlow等价物:

for/while -> tf.while_loop (支持break 和 continue)

if->tf.cond

for _ in dataset -> dataset.reduce

AutoGraph支持控制流的任意嵌套,这使得可以有较好性能并且简洁地实现许多复杂的ML程序,如序列模型,强化学习,自定义训练循环等。

Recommendations for idiomatic TensorFlow 2.0

Refactor your code into smaller functions

TensorFlow 1.x中常见使用模式是“kitchen sink”策略,其中所有可能的计算的联合被预先布置,然后选择被评估的张量,通过session.run()运行。在TensorFlow 2.0中,用户应该将代码重构为较小的函数,这些函数根据需要被调用。通常,没有必要用tf.function去装饰那些比较小的函数;仅用tf.function去装饰高等级的计算,例如,训练的一个步骤,或模型的前向传递。

Use Keras layers and models to manage variables

Keras模型和图层提供了方便variables和 trainable_variables属性,它以递归方式收集所有因变量。这使得在本地管理变量非常容易。

对比:

def dense(x, W, b):

return tf.nn.sigmoid(tf.matmul(x, W)+ b)

@tf.function

def multilayer_perceptron(x, w0, b0, w1, b1, w2, b2 ...):

x = dense(x, w0, b0)

x = dense(x, w1, b1)

x = dense(x, w2, b2)

...

# 你仍然需要管理w_i和b_i,它们的形状远离代码定义。

Keras版本:

# 可以调用每个图层,其签名等效于 linear(x)

layers =[tf.keras.layers.Dense(hidden_size, activation=tf.nn.sigmoid)for _ in range(n)]

perceptron = tf.keras.Sequential(layers)

# layers[3].trainable_variables => returns [w3, b3]

# perceptron.trainable_variables => returns [w0, b0, ...]

Keras layers/models继承自tf.train.Checkpointable并集成了@tf.function,这使得直接从Keras对象导出SavedModels或checkpoint成为可能。您不一定要使用Keras的.fitAPI来利用这些集成。

这是一个迁移学习的例子,演示了Keras如何轻松收集相关变量的子集。假设你正在训练一个带有共享主干的多头模型:

trunk = tf.keras.Sequential([...])

head1 = tf.keras.Sequential([...])

head2 = tf.keras.Sequential([...])

path1 = tf.keras.Sequential([trunk, head1])

path2 = tf.keras.Sequential([trunk, head2])

# Train on primary dataset

for x, y in main_dataset:

with tf.GradientTape()as tape:

prediction = path1(x)

loss = loss_fn_head1(prediction, y)

# Simultaneously optimize trunk and head1 weights.

gradients = tape.gradients(loss, path1.trainable_variables)

optimizer.apply_gradients(gradients, path1.trainable_variables)

# Fine-tune second head, reusing the trunk

for x, y in small_dataset:

with tf.GradientTape()as tape:

prediction = path2(x)

loss = loss_fn_head2(prediction, y)

# Only optimize head2 weights, not trunk weights

gradients = tape.gradients(loss, head2.trainable_variables)

optimizer.apply_gradients(gradients, head2.trainable_variables)

# You can publish just the trunk computation for other people to reuse.

tf.saved_model.save(trunk, output_path)

Combine tf.data.Datasets and @tf.function

在内存中迭代拟合训练数据时,可以随意使用常规的Python迭代。或者,tf.data.Dataset是从硬盘读取训练数据流的最好方法。Datasets是可迭代的(不是迭代器),它可以像在Eager模式下的其他Python迭代一样工作。您可以通过用tf.function()包装代码来充分利用数据集异步预取/流功能,这将使用AutoGraph等效的图操作替换Python的迭代。

@tf.function

def train(model, dataset, optimizer):

for x, y in dataset:

with tf.GradientTape()as tape:

prediction = model(x)

loss = loss_fn(prediction, y)

gradients = tape.gradients(loss, model.trainable_variables)

optimizer.apply_gradients(gradients, model.trainable_variables)

如果您使用Keras .fit()API,则无需担心数据集迭代。

model.compile(optimizer=optimizer, loss=loss_fn)

model.fit(dataset)

Take advantage of AutoGraph with Python control flow

AutoGraph提供了一种将依赖于数据的控制流转换为等效图形模式的方法,如tf.cond和tf.while_loop。

数据相关控制流出现的一个常见位置是序列模型。tf.keras.layers.RNN包装了一个RNN cell,允许您既可以静态也可以动态的循环展开。为了演示,您可以重新实现动态展开,如下所示:

classDynamicRNN(tf.keras.Model):

def __init__(self, rnn_cell):

super(DynamicRNN,self).__init__(self)

self.cell = rnn_cell

def call(self, input_data):

# [batch, time, features] -> [time, batch, features]

input_data = tf.transpose(input_data,[1,0,2])

outputs = tf.TensorArray(tf.float32, input_data.shape[0])

state =self.cell.zero_state(input_data.shape[1], dtype=tf.float32)

for i in tf.range(input_data.shape[0]):

output, state =self.cell(input_data[i], state)

outputs = outputs.write(i, output)

return tf.transpose(outputs.stack(),[1,0,2]), state

有关AutoGraph功能的更详细概述,请参阅指南

Use tf.metrics to aggregate data and tf.summary to log it

要记录摘要,请使用tf.summary.(scalar|histogram|...)上下文管理器将其重定向到编写器。(如果省略上下文管理器,则不会发生任何事情。)与TF 1.x不同,摘要直接发送给编写器; 没有单独的“合并”操作,也没有单独的add_summary()调用,这意味着step必须在调用点提供该值。

summary_writer = tf.summary.create_file_writer('/tmp/summaries')

with summary_writer.as_default():

tf.summary.scalar('loss',0.1, step=42)

要在将数据记录为摘要之前聚合数据,请使用 tf.metrics。Metrics是有状态的;它们积累值并在您调用 .result()时返回结果。清除积累值,请使用 .reset_states()。

def train(model, optimizer, dataset, log_freq=10):

avg_loss = tf.keras.metrics.Mean(name='loss', dtype=tf.float32)

for images, labels in dataset:

loss = train_step(model, optimizer, images, labels)

avg_loss.update_state(loss)

if tf.equal(optimizer.iterations % log_freq,0):

tf.summary.scalar('loss', avg_loss.result(), step=optimizer.iterations)

avg_loss.reset_states()

def test(model, test_x, test_y, step_num):

loss = loss_fn(model(test_x), test_y)

tf.summary.scalar('loss', loss, step=step_num)

train_summary_writer = tf.summary.create_file_writer('/tmp/summaries/train')

test_summary_writer = tf.summary.create_file_writer('/tmp/summaries/test')

with train_summary_writer.as_default():

train(model, optimizer, dataset)

with test_summary_writer.as_default():

test(model, test_x, test_y, optimizer.iterations)

通过将TensorBoard指向摘要日志目录来可视化生成的摘要:tensorboard --logdir /tmp/summaries。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    2981

    浏览量

    41689
  • tensorflow
    +关注

    关注

    13

    文章

    313

    浏览量

    60241

原文标题:TensorFlow 2.0高效开发指南

文章出处:【微信号:MachineEpoch,微信公众号:MachineEpoch】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    USB2.0与OTG规范及开发指南(全中文)

    本帖最后由 eehome 于 2013-1-5 09:48 编辑 USB2.0与OTG规范及开发指南(全中文)
    发表于 08-20 18:32

    电子系统设计开发开发指南V2.0

    电子系统设计开发开发指南V2.0(基于FPGA+C8051F020+高速AD_DA_比较器).pdf (5.76 MB )
    发表于 04-23 02:58

    单片机实用开发指南

    单片机实用开发指南
    发表于 03-21 23:21 209次下载

    CPLD FPGA高级应用开发指南

    CPLD FPGA高级应用开发指南
    发表于 04-15 10:56 58次下载
    CPLD FPGA高级应用<b class='flag-5'>开发指南</b>

    Tiny6410 Linux开发指南详解

    Tiny6410 Linux 开发指南
    发表于 07-08 17:12 209次下载
    Tiny6410 Linux<b class='flag-5'>开发指南</b>详解

    [CPLD/FPGA高级应用开发指南].任晓东.文博.扫描版

    [CPLDFPGA高级应用开发指南].任晓东.文博.扫描版
    发表于 11-13 15:07 0次下载

    A64开发板LCD开发指南

    A64开发板LCD开发指南,驱动开发指南
    发表于 06-21 17:02 0次下载

    横版排插开发指南

    横版排插开发指南
    发表于 12-29 20:02 0次下载

    电热毯开发指南

    电热毯开发指南
    发表于 12-29 20:14 0次下载

    彩光灯开发指南

    彩光灯开发指南
    发表于 12-29 20:15 0次下载

    C#上位机实战开发指南

    C#上位机实战开发指南
    发表于 11-22 19:25 0次下载

    迪文DGUS屏用户开发指南pdf

    迪文DGUS屏开发指南
    发表于 03-16 10:19 75次下载

    GD32W51x快速开发指南

    GD32W51x快速开发指南
    发表于 02-27 18:42 0次下载
    GD32W51x快速<b class='flag-5'>开发指南</b>

    GD32W51x硬件开发指南

    GD32W51x硬件开发指南
    发表于 03-01 18:43 1次下载
    GD32W51x硬件<b class='flag-5'>开发指南</b>

    Linux NOR开发指南

    Linux NOR开发指南
    的头像 发表于 03-06 09:55 584次阅读
    Linux NOR<b class='flag-5'>开发指南</b>