1. 超越 Hello World,一个计算机视觉示例


在前面的练习中,您看到了如何创建一个神经网络来找出您要解决的问题。这给出了学习行为的明确例子。当然,在那种情况下,这有点矫枉过正,因为直接编写函数 Y=3x+1 会更容易,而不是费心使用机器学习来学习一组固定的 X 和 Y 之间的关系值,并将其扩展到所有值。

但是,如果编写这样的规则要困难得多——例如计算机视觉问题,那该怎么办?让我们看一个场景,在这个场景中,我们可以识别不同的服装项目,这些项目是从包含 10 种不同类型的数据集训练出来的。

1.1 开始编码

让我们从我们导入 TensorFlow 开始

import tensorflow as tf

我们将训练一个神经网络从一个名为 Fashion MNIST 的通用数据集中识别服装项目。您可以的更多信息。

它包含 10 个不同类别的 70,000 件服装。每件衣服都是 28x28 的灰度图像。你可以在这里看到一些例子:

Fashion MNIST 数据可直接在 tf.keras 数据集 API 中获得。你像这样加载它:

Fashion MNIST 数据可直接在 tf.keras 数据集 API 中获得。你像这样加载它:

mnist = tf.keras.datasets.fashion_mnist

在此对象上调用 load_data 将为您提供两组两个列表,这些将是包含服装项目及其标签的图形的训练和测试值。

(training_images, training_labels), (test_images, test_labels) = mnist.load_data()
这些值是什么样的?让我们打印一张训练图像和一个训练标签以查看…数组中不同索引的实验。例如,还要看一下索引 42…这与索引 0 处的引导不同

import matplotlib.pyplot as plt


您会注意到数字中的所有值都在 0 到 255 之间。如果我们正在训练一个神经网络,出于各种原因,如果我们将所有值都视为 0 到 1 之间会更容易,这个过程称为“归一化”。 . 幸运的是,在 Python 中很容易对这样的列表进行规范化而无需循环。你这样做:

training_images  = training_images / 255.0
test_images = test_images / 255.0

现在你可能想知道为什么有 2 组…训练和测试——还记得我们在介绍中谈到过吗?这个想法是有一组数据用于训练,然后是另一组数据…模型还没有看到…看看它在分类值方面有多好。毕竟,当您完成后,您会想要尝试使用以前从未见过的数据!


model = tf.keras.models.Sequential([tf.keras.layers.Flatten(), 
                                    tf.keras.layers.Dense(128, activation=tf.nn.relu), 
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])


Flatten:还记得之前我们打印出来的图像是正方形的吗?Flatten 只是将那个正方形变成一维集合。

Dense : 添加一层神经元


Relu实际上意味着“如果 X>0 返回 X,否则返回 0”——所以它所做的只是将值 0 或更大的值传递给网络中的下一层。

Softmax取一组值,并有效地选择最大的值,因此,例如,如果最后一层的输出看起来像 [0.1, 0.1, 0.05, 0.1, 9.5, 0.1, 0.05, 0.05, 0.05],它会节省你从它钓鱼中寻找最大的值,然后把它变成 [0,0,0,0,1,0,0,0,0] – 目标是节省大量的编码!

现在模型已经定义,接下来要做的就是实际构建它。您可以像以前一样使用优化器和损失函数对其进行编译,然后通过调用 * model.fit *要求它使您的训练数据适合您的训练标签来训练它-即让它弄清楚两者之间的关系训练数据及其实际标签,因此将来如果您有与训练数据相似的数据,那么它可以预测该数据的外观。

model.compile(optimizer = tf.keras.optimizers.Adam(),
              loss = 'sparse_categorical_crossentropy',

model.fit(training_images, training_labels, epochs=5)
Epoch 1/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.5011 - accuracy: 0.8227
Epoch 2/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3738 - accuracy: 0.8658
Epoch 3/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3372 - accuracy: 0.8772
Epoch 4/5
1875/1875 [==============================] - 4s 2ms/step - loss: 0.3143 - accuracy: 0.8846
Epoch 5/5
1875/1875 [==============================] - 3s 2ms/step - loss: 0.2984 - accuracy: 0.8909
一旦完成训练——你应该在最后一个时期结束时看到一个准确度值。它可能看起来像 0.9098。这告诉您,您的神经网络对训练数据进行分类的准确率约为 91%。IE,它找出了图像和标签之间的模式匹配,在 91% 的时间里都有效。不是很好,但考虑到它只训练了 5 个 epoch 并且完成得很快。


model.evaluate(test_images, test_labels)
313/313 [==============================] - 0s 1ms/step - loss: 0.3710 - accuracy: 0.8642
[0.371006578207016, 0.8641999959945679]

对我来说,这返回了大约 0.8838 的准确度,这意味着它的准确度约为 88%。正如预期的那样,它可能不会像对待训练数据那样处理看不见的数据!在学习本课程时,您将寻找改进方法。


2. 探索练习

2.1 练习 1:


classifications = model.predict(test_images)


提示:尝试运行 print(test_labels[0]) – 你会得到一个 9。这是否有助于你理解为什么这个列表看起来是这样的?

2.2 练习 2:

现在让我们看看模型中的层。对具有 512 个神经元的密集层尝试不同的值。你在损失、训练时间等方面得到了什么不同的结果?你认为为什么会这样?

import tensorflow as tf

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(1024, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)

Epoch 1/5 
1875/1875 [==============================] - 12s 6ms/step - 损失: 0.4715 
Epoch 2/5 
1875/1875 [==============================] - 11s 6ms/step - 损失:0.3583 
Epoch 3/5 
1875/1875 [==============================] - 11s 6ms/step - 损失:0.3205 
Epoch 4/ 5 
1875/1875 [==============================] - 12s 6ms/step - 损失:0.2963 
Epoch 5/5 
1875 /1875 [==============================] - 12s 6ms/step - 损失:0.2800 
313/313 [=== ==========================] - 1s 3ms/step - 损失:
0.3366 [6.0128713e-08 3.6625007e-08 6.0206345e-10 1.6711460e-10 4.0677031e-09 
 5.6566618e-04 1.1954526e-08 5.5199428e-03 1.0437609e-08 9.9391431e-01] 
2.3 练习 3:

如果删除 Flatten() 层会发生什么。你认为为什么会这样?

您会收到有关数据形状的错误。现在可能看起来很模糊,但它强化了经验法则,即网络中的第一层应该与数据具有相同的形状。现在我们的数据是 28x28 的图像,28 层的 28 个神经元是不可行的,因此将 28,28“展平”为 784x1 更有意义。我们不是自己编写所有代码来处理它,而是在开始时添加 Flatten() 层,当数组稍后加载到模型中时,它们会自动为我们展平。

import tensorflow as tf

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(64, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

# This version has the 'flatten' removed. Replace the above with this one to see the error.
#model = tf.keras.models.Sequential([tf.keras.layers.Dense(64, activation=tf.nn.relu),
#                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)


2.4 练习 4:

考虑最终(输出)层。为什么有 10 个?如果您的数量与 10 不同,会发生什么?例如,尝试用 5

一旦发现意外值,您就会收到错误消息。另一个经验法则——最后一层的神经元数量应该与您要分类的类别数量相匹配。在这种情况下,它是数字 0-9,所以有 10 个,因此您的最后一层应该有 10 个神经元。

import tensorflow as tf

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(64, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

# Replace the above model definiton with this one to see the network with 5 output layers
# And you'll see errors as a result!
# model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
#                                    tf.keras.layers.Dense(64, activation=tf.nn.relu),
#                                    tf.keras.layers.Dense(5, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)


2.5 练习 5:

考虑网络中附加层的影响。如果在 512 层和最后一层 10 之间添加另一层会发生什么。


import tensorflow as tf

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(256, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=5)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)


2.6 练习 6:


尝试 15 个时期——你可能会得到一个损失比 5 个尝试 30 个时期更好的模型——你可能会看到损失值停止减少,有时会增加。这是一种称为“过度拟合”的副作用,您可以在 [某处] 了解它,并且在训练神经网络时需要注意这一点。如果你没有改善你的损失,那么浪费你的时间训练是没有意义的,对吧!😃

import tensorflow as tf

mnist = tf.keras.datasets.fashion_mnist

(training_images, training_labels) ,  (test_images, test_labels) = mnist.load_data()

training_images = training_images/255.0
test_images = test_images/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(128, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(training_images, training_labels, epochs=30)

model.evaluate(test_images, test_labels)

classifications = model.predict(test_images)


2.7 练习 7:

在训练之前,您对数据进行了标准化,从 0-255 的值到 0-1 的值。去掉它会有什么影响?这是尝试的完整代码。为什么你认为你会得到不同的结果?

import tensorflow as tf
mnist = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = mnist.load_data()
# To experiment with removing normalization, comment out the following 2 lines
model = tf.keras.models.Sequential([
  tf.keras.layers.Dense(512, activation=tf.nn.relu),
  tf.keras.layers.Dense(10, activation=tf.nn.softmax)
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')
model.fit(training_images, training_labels, epochs=5)
model.evaluate(test_images, test_labels)
classifications = model.predict(test_images)

2.8 练习 8:

早些时候,当您为额外的 epoch 进行训练时,您遇到了一个问题,您的损失可能会发生变化。您可能需要一些时间来等待训练来执行此操作,并且您可能会想“如果我能在达到所需值时停止训练,那不是很好吗?” – 即 95% 的准确率对您来说可能就足够了,如果您在 3 个 epoch 后达到该准确度,为什么要坐等它完成更多的 epoch…那么您将如何解决这个问题?像任何其他程序一样…你有回调!让我们看看他们在行动……

import tensorflow as tf

class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
      print("\nReached 90% accuracy so cancelling training!")
      self.model.stop_training = True

callbacks = myCallback()
mnist = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = mnist.load_data()
model = tf.keras.models.Sequential([
  tf.keras.layers.Dense(512, activation=tf.nn.relu),
  tf.keras.layers.Dense(10, activation=tf.nn.softmax)
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(training_images, training_labels, epochs=5, callbacks=[callbacks])

