TensorFlow中Keras深度学习模型Sequential和Model详解 - TensorFlow自学笔记7

原创已于 2024-08-30 17:05:21 修改 · 2k 阅读 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

楠语盒子

关注

标签

#深度学习 #tensorflow #keras

分类数据科学与机器学习开发

于 2024-08-26 13:14:42 首次发布

tensorflow 专栏收录该内容

9 篇文章

订阅专栏

在Keras中有两种深度学习的模型：序列模型（Sequential）和通用模型（Model）。

差异在于不同的拓扑结构。

一. Sequential序列模型

序列模型各层之间是依次顺序的线性关系（多个网络层的线性堆叠），模型结构通过一个列表来制定，或者逐层添加网络结构。

1. 构造模型

通过将网络层实例的列表传递给 Sequential 的构造器，来创建一个 Sequential 模型。

# 导入类from keras.models
import Sequentialfrom keras.layers
import Dense, Activation

# 构建Sequential模型
# Model是keras最核心的数据结构
model = Sequential([
  Dense(32, input_shape=(784,)),
  Activation('relu'),
  Dense(10),
  Activation('softmax'),
])

也可以简单地使用 .add() 方法将各层添加到模型中

model = Sequential()
model.add(Dense(32, input_dim=784))
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('softmax'))

3. 指定输入数据的尺寸

指定输入数据的尺寸在第一层，模型需要知道它所期望的输入尺寸，在后面的层中，模型可以自动地推断尺寸。有三种方式指定输入数据的尺寸

1). 传递一个input_shape参数给第一层。它是一个表示尺寸的元组（一个由整数或None组成的元组，其中None表示可能为任何正整数）。在input_shape中不包含数据的batch大小。

2). 某些2D层，如Dense，支持通过参数input_dim指定输入尺寸；某些3D时序层支持input_dim和input_length参数。

3). 如果你需要为你的输入制定一个固定大小的batch（对stateful RNNs很有用），可以传递一个batch_size参数给一个层。如果你同时将batch_size=32和input_shape=(6,8)传递给一个层，那么每一批输入的尺寸就为(32,6,8)。

因此，如下代码是等价的：

1	`model.add(Dense(32, input_shape=(784,))`

1	`model.add(Dense(32, input_dim=784))`

2. 编译模型

在训练模型之前，通过 compile 方法配置学习过程，参数：

2.1. 优化器optimizer

1). 可以是现有优化器的字符串标识符（如rmsprop或adagrad），

2). 也可以是Optimizer类的示例，参见optimizers；下图中的类都可以直接用

字符串标识符代表了Keras预定义的优化器函数类，它们与具体的优化器函数实现相关联

有两种写法：

1) 只写字符串

model.compile(optimizer= 'adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

2）用对应类的构造函数

model.compile(optimizer= tf.keras.optimizers.Adam(),#'adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

tf.keras.optimizers.Adam(), 调用了Adam类的构造函数，用的是默认参数值，参见 Adam

2.2. 损失函数loss

模型试图最小化的目标函数。

1). 可以是现有损失函数的字符串标识符（如categorical_crossentropy或mse）

2). 也可以是一个目标函数，见losses；

字符串标识符代表了Keras预定义的损失函数类，它们与具体的损失函数实现相关联

2.3. 评估标准metrics

对于任何分类问题，都希望将其设置为metrics = ['accuracy']。可以是现有的字符串标识符，也可以是自定义的评估标准函数。

#分类问题
model.compile(
  optimizer='rmsprop',
  loss='categorical_crossentropy',
  metrics=['accuracy']
)

#二分类问题
model.compile(
  optimizer='rmsprop',
  loss='binary_crossentropy',
  metrics=['accuracy']
)

#均方误差回归问题
model.compile(
  optimizer='rmsprop',
  loss='mse'
)

#自定义评估标准函数
import keras.backend as K
def mean_pred(y_true,y_pred):
  return K.mean(y_pred)

model.compile(
  optimizer='rmsprop',
  loss='binary_crossentropy',
  metrics=['accuracy',mean_pred]
)

更多metrics，参见 metrics

3. 训练模型

在输入数据和标签的Numpy矩阵上进行训练。为了训练这一个模型，通常会使用 fit 函数，参见

x 和 y：分别代表输入数据和目标变量。
batch_size：每次更新使用的样本数。
epochs：整个数据集将被遍历的次数。
validation_split：验证集占训练集的比例，用于监控模型的性能并防止过拟合。

# 对于具有2个类的单输入模型（二进制分类）

model = Sequential()

model.add(Dense(32, activation='relu', input_dim=100))

model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',

loss='binary_crossentropy',

metrics=['accuracy'])

# 生成虚拟数据

import numpy as np

data = np.random.random((1000, 100))

labels = np.random.randint(2, size=(1000, 1))

# 训练模型，以32个样本为一个batch进行迭代

model.fit(data, labels, epochs=10, batch_size=32)

Epoch 1/10

1000/1000 [==============================] - 0s 105us/step - loss: 0.7028 - accuracy: 0.4980

Epoch 2/10

1000/1000 [==============================] - 0s 32us/step - loss: 0.6932 - accuracy: 0.5380

Epoch 3/10

1000/1000 [==============================] - 0s 34us/step - loss: 0.6862 - accuracy: 0.5510

Epoch 4/10

1000/1000 [==============================] - 0s 34us/step - loss: 0.6842 - accuracy: 0.5580

Epoch 5/10

1000/1000 [==============================] - 0s 31us/step - loss: 0.6834 - accuracy: 0.5570

Epoch 6/10

1000/1000 [==============================] - 0s 34us/step - loss: 0.6799 - accuracy: 0.5720

Epoch 7/10

1000/1000 [==============================] - 0s 34us/step - loss: 0.6760 - accuracy: 0.5860

Epoch 8/10

1000/1000 [==============================] - 0s 37us/step - loss: 0.6742 - accuracy: 0.5920

Epoch 9/10

1000/1000 [==============================] - 0s 35us/step - loss: 0.6702 - accuracy: 0.5810

Epoch 10/10

1000/1000 [==============================] - 0s 36us/step - loss: 0.6686 - accuracy: 0.6050

<keras.callbacks.callbacks.History at 0x1e1c574b888>

二. Model通用模型

通用模型可以设计非常复杂、任意拓扑结构的神经网络，例如有向无环网络、共享层网络等。

相比于序列模型只能依次线性逐层添加，通用模型能够比较灵活地构造网络结构，设定各层级的关系。

from keras.layers import Input, Dense

from keras.models import Model

# 定义输入层，确定输入维度

input = input(shape = (784, ))

# 2个隐含层，每个都有64个神经元，使用relu激活函数，且由上一层作为参数

x = Dense(64, activation='relu')(input)

x = Dense(64, activation='relu')(x)

# 输出层

y = Dense(10, activation='softmax')(x)

# 定义模型，指定输入输出

model = Model(input=input, output=y)

# 编译模型，指定优化器，损失函数，度量

model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

# 模型拟合，即训练

model.fit(data, labels)