使用迁移学习和 TensorFlow 进行食品分类

来源|本文经授权转载自深度学习与计算机视觉

摘要
在今天的报告中,我们将分析食品以预测它们是否可以食用。我们应用最先进的 迁移学习方法和 Tensorflow 框架来构建用于食品分类的机器学习模型。

介绍

图像分类是机器预测图片属于哪个类别的工作。在深度学习开始蓬勃发展之前,图像分类等任务无法达到人类水平。
这是因为机器学习模型无法确定图像的邻域知识。模型只接收像素级命令。
由于深度学习的潜力,图像分类任务可以利用被描述为卷积神经网络 (CNN) 的模型来传递人类水平的性能。
CNN 是一种研究图像表征的深度学习模型。该模型无需个人参与即可确定从平面到高级的特征。
该模型不仅接收像素级别的数据。该模型还通过称为卷积的机制从图像中获取相邻数据。
卷积将通过将范围内的像素的编译相乘并将它们相加为一个值来聚合邻域数据。ML 模型将接受这些特征以将图片分类为一组。
深度学习虽然可以完成人类级别的生产,但需要大量的数据。
如果我们没有它们怎么办?我们可以应用一种称为迁移学习的理论。
迁移学习是一种在海量数据上为我们的查询训练模型的技术。因此,我们仅通过微调模型来准备它们。我们将注意到的优势是模型将在一段时间内学会。
本文将帮助你练习使用 TensorFlow (Python) 进行食品图像分类的迁移学习。因为预处理步骤是基本过程,我还将解释如何将数据提供给我们的深度学习模型。

执行

步骤 1:导入库
我们要求做的第一步是导入库。我们想要 TensorFlow、NumPy、os 和 pandas。如果你还没有修复包,你可以应用 pip 命令来安装所需的库。
请注意,我命令使用的 TensorFlow 是 2.4.1 版本,因此请安装该版本。
另外,如果你希望采用 GPU 来训练深度学习模型,请安装 11.0 版的 CUDA,因为该版本包含 2.4.1 版的 TensorFlow。
下载 CUDA 软件 https://developer.nvidia.com/cuda-11.0-download-archive
下面是安装和加载所需库的代码。
# ! pip install tensorflow==2.4.1
# ! pip install pandas
# ! pip install numpy
import os
import numpy as np
import pandas as pd
import tensorflow as tf
步骤2:准备数据
安排好库后,下一步是修复我们的数据集。在此示例中,我们将应用名为Food-5K的数据集。
  • https://www.kaggle.com/binhminhs10/food5k
该数据集由 5000 张图片组成,分为两类,即食物和非食物。FOOD-5K 分为训练、验证和测试数据集。
数据集文件夹的格式如下:
正如你在上面看到的,每个文件夹都由图片组成。每个图片文件名包括类别和由下划线分隔的标识符。
我们需要产生带有图像文件名的列和带有该文件夹排列的标签的数据框。
修复数据集的代码如下所示,
def dframe(dtype):
    X = []
    y = []
    path = 'Food-5K/' + dtype + '/'
    for i in os.listdir(path):
        # Image
        X.append(i)
        # Label
        y.append(i.split('_')[0])
    X = np.array(X)
    y = np.array(y)
    df = pd.DataFrame()
    df['filename'] = X
    df['label'] = y
    return df
df_train = dframe('training')
df_val = dframe('validation')
df_test = dframe('evaluation')
df_train.head()
这是数据框的视图,
下一步就是制作一个对象,将图片放入模型中。我们将练习tf.keras.preprocessing.image库的ImageDataGenerator对象。
使用此对象,我们将生成图像批次。此外,我们可以扩充我们的图片以扩大数据集的乘积。因为我们还扩展了这些图片,我们进一步设置了图像增强技术的参数。
此外,因为我们应用了一个数据帧作为关于数据集的知识,因此我们将使用flow_from_dataframe方法生成批处理并增强图片。
上面的代码看起来像这样
from tensorflow.keras.preprocessing.image import ImageDataGenerator
# Create the ImageDataGenerator object
train_datagen = ImageDataGenerator(
    featurewise_center=True,
    featurewise_std_normalization=True,
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
)
val_datagen = ImageDataGenerator(
    featurewise_center=True,
    featurewise_std_normalization=True,
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
)
# Generate batches and augment the images
train_generator = train_datagen.flow_from_dataframe(
    df_train,
    directory='Food-5K/training/',
    x_col='filename',
    y_col='label',
    class_mode='binary',
    target_size=(224, 224),
)
val_generator = train_datagen.flow_from_dataframe(
    df_val,
    directory='Food-5K/validation/',
    x_col='filename',
    y_col='label',
    class_mode='binary',
    target_size=(224, 224),
)
步骤3:训练模型
决定好批次之后,我们可以通过迁移学习技术来训练模型。因为我们应用了这种方法,所以我们不需要从头开始执行 CNN 架构。相反,我们将使用当前和以前预训练的架构。
我们将应用 ResNet-50 作为我们新模型的脊椎。我们将生成输入并根据类别数量调整 ResNet-50 的最后一个线性层ResNet-50。
构建模型的代码如下
from tensorflow.keras.applications import ResNet50

# Initialize the Pretrained Model
feature_extractor = ResNet50(weights='imagenet', 
                             input_shape=(224, 224, 3),
                             include_top=False)

# Set this parameter to make sure it's not being trained
feature_extractor.trainable = False

# Set the input layer
input_ = tf.keras.Input(shape=(224, 224, 3))

# Set the feature extractor layer
x = feature_extractor(input_, training=False)

# Set the pooling layer
x = tf.keras.layers.GlobalAveragePooling2D()(x)

# Set the final layer with sigmoid activation function
output_ = tf.keras.layers.Dense(1, activation='sigmoid')(x)

# Create the new model object
model = tf.keras.Model(input_, output_)

# Compile it
model.compile(optimizer='adam',
             loss='binary_crossentropy',
             metrics=['accuracy'])

# Print The Summary of The Model
model.summary()

为了训练模型,我们采用拟合的方法来准备模型。这是代码,
model.fit(train_generator, epochs=20, validation_data=val_generator)
步骤4:测试模型
在训练模型之后,现在让我们在测试数据集上检查模型。在扩展中,我们需要结合一个pillow库来加载和调整图片大小,以及 scikit-learn 来确定模型性能。
我们将练习来自 scikit-learn 库的分类报告,以生成关于模型执行的报告。此外,我们会喜欢它的混淆矩阵。
这是预测实验数据及其决策的代码
from PIL import Image
from sklearn.metrics import classification_report, confusion_matrix

y_true = []
y_pred = []

for i in os.listdir('Food-5K/evaluation'):
    img = Image.open('Food-5K/evaluation/' + i)
    img = img.resize((224, 224))
    img = np.array(img)
    img = np.expand_dims(img, 0)
    
    y_true.append(int(i.split('_')[0]))
    y_pred.append(1 if model.predict(img) > 0.5 else 0)
    
print(classification_report(y_true, y_pred))
print()
print(confusion_matrix(y_true, y_pred))

从前面的内容可以看出,该模型的性能已超过95%。因此,我们可以在建立图像分类器 API 的情况下接受此模型。
步骤5:保存模型
如果你希望将模型用于后续使用或部署,你可以使用 save 方法保存模型,
model.save('./resnet50_food_model')
如果你需要加载模型,你可以像这样练习load_model方法,
model = tf.keras.models.load_model('./resnet50_food_model')

下一步是什么

做得好!现在你已了解如何使用 TensorFlow 执行迁移学习。我希望这项研究能鼓励你,尤其是那些渴望在数据不足的情况下训练深度学习模型的人。
(0)

相关推荐

  • 使用TensorFlow和OpenCV实现口罩检测

    重磅干货,第一时间送达 在这段艰难的疫情期间,我们决定建立一个非常简单和基本的卷积神经网络(CNN)模型,使用TensorFlow与Keras库和OpenCV来检测人们是否佩戴口罩. 图片来源于澳门图 ...

  • 【Keras速成】Keras图像分类从模型自定义到测试

    这是给大家准备的Keras速成例子 杨照璐 计算机视觉.深度学习方向从业者 作者 | 杨照璐(微信号lwyzl0821) 编辑 | 言有三 这一次我们讲讲keras这个简单.流行的深度学习框架,一个图 ...

  • 使用 CNN 进行图像分类 - 理解计算机视觉

    介绍 在计算机视觉中,我们有一个卷积神经网络,它非常适用于计算机视觉任务,例如图像分类.对象检测.图像分割等等. 图像分类是当今时代最需要的技术之一,它被用于医疗保健.商业等各个领域,因此,了解并制作 ...

  • 基于计算机视觉的棋盘图像识别

    重磅干货,第一时间送达 本期我们将一起学习如何使用计算机视觉技术识别棋子及其在棋盘上的位置 我们利用计算机视觉技术和卷积神经网络(CNN)为这个项目创建分类算法,并确定棋子在棋盘上的位置.最终的应用程 ...

  • 【机器学习】随机森林是我最喜欢的模型

    机器之心编辑部  TensorFlow 决策森林 (TF-DF) 现已开源,该库集成了众多 SOTA 算法,不需要输入特征,可以处理数值和分类特征,为开发者节省了大量时间. 在人工智能发展史上,各类算 ...

  • PyTorch、TensorFlow最新版本对比,2021年了你选谁?

    作者:Mostafa Ibrahim 机器之心编译 编辑:陈萍 PyTorch(1.8)和Tensorflow(2.5)最新版本比较. 自深度学习重新获得公认以来,许多机器学习框架层出不穷,争相成为研 ...

  • R语言KERAS深度学习CNN卷积神经网络分类识别手写数字图像数据(MNIST)

    原文链接:http://tecdat.cn/?p=23184 在本文中,我们将学习如何使用keras,用手写数字图像数据集(即MNIST)进行深度学习.本文的目的是为了让大家亲身体验并熟悉培训课程中的 ...

  • TensorFlow.js、迁移学习与AI产品创新之道

    TensorFlow 的 JS 版本终于出啦,deeplearn.js 正式收编至 TensorFlow 项目,并改名为 TensorFlow.js : 采用 WebGL 加速的基于浏览器的 JS 机 ...

  • 迁移学习——入门简介

    一.简介 背景:现如今数据爆炸: 对机器学习模型来说要求快速构建,强泛化 对于数据来说,大部分数据没有标签 所以收集标签数据和从头开始构建一个模型都是代价高昂的,需要对模型和带有标签的数据进行重用 传 ...

  • GB2760中食品分类解读

    食品添加剂使用标准中的食品分类解读 食品添加剂使用标准中的食品分类解读 近年来,食品安全标准执行过程中碰到不少问题,是因为目前我国没有统一的食品分类规范,不同的食品安全国家标准通用标准又对应不同的分类 ...

  • Adapter: 高效NLP迁移学习

    今天轻松一点,看个简单高效的trick.也是咱们在昨天的DCCL: 推荐系统的端+云联动学习挖的坑. 目前,NLP中主流的方式是预训练+微调,当然,有大宗师级别的资源强者可以玩GPT-3这样子的大模型 ...

  • 【硕鑫学习课堂】建设投资分类估算法

    一.估算步骤 (1) 分别估算建筑工程费.设备购置费和安装工程费: (2) 汇总建筑工程费.设备购置费和安装工程费,得出分装置的工程费用,然后加总得出项目建设所需的工程费用: (3) 在工程费用的基础 ...

  • 盘点 | 对比图像分类五大方法:KNN、SVM、BPNN、CNN 和迁移学习

    图像分类是人工智能领域的基本研究主题之一,研究者也已经开发了大量用于图像分类的算法.近日,Shiyu Mou 在 Medium 上发表了一篇文章,对五种用于图像分类的方法(KNN.SVM.BP 神经网 ...

  • 2760食品分类说明

    以下食品分类 采用<GB 2760-2014食品安全国家标准 食品添加剂使用标准>中的"食品分类系统",包含了16大类食品.分类说明来源GB 2760-2014实施指南 ...

  • 采用深度迁移学习定位含直驱风机次同步振荡源机组的方法

    中国电工技术学会活动专区 CES Conference 随着新能源电力电子器件的广泛接入,电力系统次同步振荡问题的诱发机理越来越复杂.为了能够及时定位到诱发次同步振荡的机组并采取措施,新能源电力系统国 ...

  • 郝大夫答群友1“补血最快用什么?”2高血压外治法3小孩喝酸奶后呕吐怎么办4补益食品分类

    (一)群友盛林商贸咨询: @郝现军 河南中医 ,补血最快用什么? 郝大夫答复: 补血最快,西医自然是输血. 中医理论:血虚才需要补血.在中医看来有血虚情况的疾病,一部分在西医看来,是贫血:一部分在西医 ...