基于Densenet&Xception融合的102种鲜花识别

根据Densenet&Xception交融的102种鲜花识别

敞开成长之旅！这是我参与「日新方案 2 月更文挑战」的第 15 天，点击检查活动详情

这个交融模型是我在打竞赛的时候随手搞出来的。

这个数据集实际上没有难度，类间分布较为均匀，归于典型的细粒度分类问题。

解题思路便是找一个满足强悍的模型，再加上预练习模型，耐性调参，就会有一个不错的名次。

对于大多数分类问题，我比较习气运用的是ResNet，DenseNet。

对于这种比较简略的图像分类使命，首要呢，我们能够测验一下各种预练习模型，

简略的跑一下，对比一下和第一名的差距，假如仍是没有太好的思路，那么就能够测验本项意图思路。

我们如有任何问题，欢迎在评论区交流，码字不易，我们重视我一下吧。

数据实例

!cd 'data/data31022' && unzip -q fusion.zip

!cd 'data/data30606' && unzip -q 54_data.zip

一、数据读取

### 数据读取
from PIL import Image
import numpy as np
import paddle.fluid as fluid
import os
import shutil
def test(image2, label2):
    def reader():
        for img, label in zip(image2, label2):
            im = Image.open(os.path.join('data/data30606/54_data/train', img))
            im = im.resize((640, 640), Image.ANTIALIAS)
            img = np.array(im).astype('float32')
            img -= [127.5, 127.5, 127.5] #此处为了便利，仅运用了三通道的均值，应该核算在数据集上三通道的均值
            img = img.transpose((2, 0, 1))  # HWC to CHW
            img *= 0.007843  # 像素值归一化
            label = label
            yield img, int(label)
    return reader
def normalized(sample):
    im, label = sample
    return im, label

import pandas as pd
df = pd.read_csv('data/data30606/54_data/train.csv')
image_path_list = df['filename'].values
label_list = df['label'].values
print(type(image_path_list))
image2 = list(image_path_list)
label2 = list(label_list)
reader = fluid.io.xmap_readers(normalized, test(image2, label2), process_num=6, buffer_size=512)  #多进程读数据，process_num能够设置为CPU线程数的80%
train_reader = fluid.io.batch(reader, batch_size=64)   #BS应设置为2的次幂的数
# 能够自行测验shuffle
# shuffle_reader = fluid.layers.shuffle(reader=train_reader, buffer_size=512)

二、模型介绍

为什么要选择这两个模型呢？

Inception结构的网络和ResNet结构的网络的别离代表着深度神经网络的两个方向，

一是网络的宽度，二是网络的深度，神经网络变宽和变深已经被证明是可行的。

所以，本项目选择了两个非常具有代表性的两个网络进行交融。

Xception
DenseNet

这两个网络别离重视于网络的深度以及宽度，将这两个模型交融起来，共同提取图像的特征。

Xception

Xception（极致的 Inception）

先进行一般卷积操作，再对 11 1111 卷积后的每个channel别离进行 33 3333 卷积操作，最终将成果 concat：

传统卷积的完成进程：

Depthwise Separable Convolution的完成进程：

# Xception
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import paddle
import paddle.fluid as fluid
import math
import sys
from paddle.fluid.param_attr import ParamAttr
__all__ = ['Xception', 'Xception41', 'Xception65', 'Xception71']
class Xception(object):
    """Xception"""
    def __init__(self, entry_flow_block_num=3, middle_flow_block_num=8):
        self.entry_flow_block_num = entry_flow_block_num
        self.middle_flow_block_num = middle_flow_block_num
        return
    def net(self, input, class_dim=1000):
        conv = self.entry_flow(input, self.entry_flow_block_num)
        conv = self.middle_flow(conv, self.middle_flow_block_num)
        conv = self.exit_flow(conv, class_dim)
        return conv
    def entry_flow(self, input, block_num=3):
        '''xception entry_flow'''
        name = "entry_flow"
        conv = self.conv_bn_layer(
            input=input,
            num_filters=32,
            filter_size=3,
            stride=2,
            act='relu',
            name=name + "_conv1")
        conv = self.conv_bn_layer(
            input=conv,
            num_filters=64,
            filter_size=3,
            stride=1,
            act='relu',
            name=name + "_conv2")
        if block_num == 3:
            relu_first = [False, True, True]
            num_filters = [128, 256, 728]
            stride = [2, 2, 2]
        elif block_num == 5:
            relu_first = [False, True, True, True, True]
            num_filters = [128, 256, 256, 728, 728]
            stride = [2, 1, 2, 1, 2]
        else:
            sys.exit(-1)
        for block in range(block_num):
            curr_name = "{}_{}".format(name, block)
            conv = self.entry_flow_bottleneck_block(
                conv,
                num_filters=num_filters[block],
                name=curr_name,
                stride=stride[block],
                relu_first=relu_first[block])
        return conv
    def entry_flow_bottleneck_block(self,
                                    input,
                                    num_filters,
                                    name,
                                    stride=2,
                                    relu_first=False):
        '''entry_flow_bottleneck_block'''
        short = fluid.layers.conv2d(
            input=input,
            num_filters=num_filters,
            filter_size=1,
            stride=stride,
            padding=0,
            act=None,
            param_attr=ParamAttr(name + "_branch1_weights"),
            bias_attr=False)
        conv0 = input
        if relu_first:
            conv0 = fluid.layers.relu(conv0)
        conv1 = self.separable_conv(
            conv0, num_filters, stride=1, name=name + "_branch2a_weights")
        conv2 = fluid.layers.relu(conv1)
        conv2 = self.separable_conv(
            conv2, num_filters, stride=1, name=name + "_branch2b_weights")
        pool = fluid.layers.pool2d(
            input=conv2,
            pool_size=3,
            pool_stride=stride,
            pool_padding=1,
            pool_type='max')
        return fluid.layers.elementwise_add(x=short, y=pool)
    def middle_flow(self, input, block_num=8):
        '''xception middle_flow'''
        num_filters = 728
        conv = input
        for block in range(block_num):
            name = "middle_flow_{}".format(block)
            conv = self.middle_flow_bottleneck_block(conv, num_filters, name)
        return conv
    def middle_flow_bottleneck_block(self, input, num_filters, name):
        '''middle_flow_bottleneck_block'''
        conv0 = fluid.layers.relu(input)
        conv0 = self.separable_conv(
            conv0,
            num_filters=num_filters,
            stride=1,
            name=name + "_branch2a_weights")
        conv1 = fluid.layers.relu(conv0)
        conv1 = self.separable_conv(
            conv1,
            num_filters=num_filters,
            stride=1,
            name=name + "_branch2b_weights")
        conv2 = fluid.layers.relu(conv1)
        conv2 = self.separable_conv(
            conv2,
            num_filters=num_filters,
            stride=1,
            name=name + "_branch2c_weights")
        return fluid.layers.elementwise_add(x=input, y=conv2)
    def exit_flow(self, input, class_dim):
        '''xception exit flow'''
        name = "exit_flow"
        num_filters1 = 728
        num_filters2 = 1024
        conv0 = self.exit_flow_bottleneck_block(
            input, num_filters1, num_filters2, name=name + "_1")
        conv1 = self.separable_conv(
            conv0, num_filters=1536, stride=1, name=name + "_2")
        conv1 = fluid.layers.relu(conv1)
        conv2 = self.separable_conv(
            conv1, num_filters=2048, stride=1, name=name + "_3")
        conv2 = fluid.layers.relu(conv2)
        pool = fluid.layers.pool2d(
            input=conv2, pool_type='avg', global_pooling=True)
        # stdv = 1.0 / math.sqrt(pool.shape[1] * 1.0)
        # out = fluid.layers.fc(
        #     input=pool,
        #     size=class_dim,
        #     param_attr=fluid.param_attr.ParamAttr(
        #         name='fc_weights',
        #         initializer=fluid.initializer.Uniform(-stdv, stdv)),
        #     bias_attr=fluid.param_attr.ParamAttr(name='fc_offset'))
        return pool
    def exit_flow_bottleneck_block(self, input, num_filters1, num_filters2,
                                   name):
        '''entry_flow_bottleneck_block'''
        short = fluid.layers.conv2d(
            input=input,
            num_filters=num_filters2,
            filter_size=1,
            stride=2,
            padding=0,
            act=None,
            param_attr=ParamAttr(name + "_branch1_weights"),
            bias_attr=False)
        conv0 = fluid.layers.relu(input)
        conv1 = self.separable_conv(
            conv0, num_filters1, stride=1, name=name + "_branch2a_weights")
        conv2 = fluid.layers.relu(conv1)
        conv2 = self.separable_conv(
            conv2, num_filters2, stride=1, name=name + "_branch2b_weights")
        pool = fluid.layers.pool2d(
            input=conv2,
            pool_size=3,
            pool_stride=2,
            pool_padding=1,
            pool_type='max')
        return fluid.layers.elementwise_add(x=short, y=pool)
    def separable_conv(self, input, num_filters, stride=1, name=None):
        """separable_conv"""
        pointwise_conv = self.conv_bn_layer(
            input=input,
            filter_size=1,
            num_filters=num_filters,
            stride=1,
            name=name + "_sep")
        depthwise_conv = self.conv_bn_layer(
            input=pointwise_conv,
            filter_size=3,
            num_filters=num_filters,
            stride=stride,
            groups=num_filters,
            use_cudnn=False,
            name=name + "_dw")
        return depthwise_conv
    def conv_bn_layer(self,
                      input,
                      num_filters,
                      filter_size,
                      stride=1,
                      groups=1,
                      act=None,
                      use_cudnn=True,
                      name=None):
        """conv_bn_layer"""
        conv = fluid.layers.conv2d(
            input=input,
            num_filters=num_filters,
            filter_size=filter_size,
            stride=stride,
            padding=(filter_size - 1) // 2,
            groups=groups,
            act=None,
            param_attr=ParamAttr(name=name + "_weights"),
            bias_attr=False,
            use_cudnn=use_cudnn)
        bn_name = "bn_" + name
        return fluid.layers.batch_norm(
            input=conv,
            act=act,
            param_attr=ParamAttr(name=bn_name + '_scale'),
            bias_attr=ParamAttr(bn_name + '_offset'),
            moving_mean_name=bn_name + '_mean',
            moving_variance_name=bn_name + '_variance')
def Xception41():
    model = Xception(entry_flow_block_num=3, middle_flow_block_num=8)
    return model
def Xception65():
    model = Xception(entry_flow_block_num=3, middle_flow_block_num=16)
    return model
def Xception71():
    model = Xception(entry_flow_block_num=5, middle_flow_block_num=16)
    return model

DenseNet

相比ResNet，DenseNet提出了一个更激进的密集衔接机制：即相互衔接一切的层，详细来说便是每个层都会接受其前面一切层作为其额定的输入。

结构对比(CNN, ResNet, DenseNet)：

DenseNet结构图

DenseNet中心思想在于建立了不同层之间的衔接联系，充分利用了feature，进一步减轻了梯度消失问题，加深网络不是问题，并且练习效果非常好。

# DesNet
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import paddle
import paddle.fluid as fluid
import math
from paddle.fluid.param_attr import ParamAttr
__all__ = [
    "DenseNet", "DenseNet121", "DenseNet161", "DenseNet169", "DenseNet201",
    "DenseNet264"
]
class DenseNet():
    def __init__(self, layers=121):
        self.layers = layers
    def net(self, input, bn_size=4, dropout=0, class_dim=1000):
        layers = self.layers
        supported_layers = [121, 161, 169, 201, 264]
        assert layers in supported_layers, \
            "supported layers are {} but input layer is {}".format(supported_layers, layers)
        densenet_spec = {
            121: (64, 32, [6, 12, 24, 16]),
            161: (96, 48, [6, 12, 36, 24]),
            169: (64, 32, [6, 12, 32, 32]),
            201: (64, 32, [6, 12, 48, 32]),
            264: (64, 32, [6, 12, 64, 48])
        }
        num_init_features, growth_rate, block_config = densenet_spec[layers]
        conv = fluid.layers.conv2d(
            input=input,
            num_filters=num_init_features,
            filter_size=7,
            stride=2,
            padding=3,
            act=None,
            param_attr=ParamAttr(name="conv1_weights"),
            bias_attr=False)
        conv = fluid.layers.batch_norm(
            input=conv,
            act='relu',
            param_attr=ParamAttr(name='conv1_bn_scale'),
            bias_attr=ParamAttr(name='conv1_bn_offset'),
            moving_mean_name='conv1_bn_mean',
            moving_variance_name='conv1_bn_variance')
        conv = fluid.layers.pool2d(
            input=conv,
            pool_size=3,
            pool_stride=2,
            pool_padding=1,
            pool_type='max')
        num_features = num_init_features
        for i, num_layers in enumerate(block_config):
            conv = self.make_dense_block(
                conv,
                num_layers,
                bn_size,
                growth_rate,
                dropout,
                name='conv' + str(i + 2))
            num_features = num_features + num_layers * growth_rate
            if i != len(block_config) - 1:
                conv = self.make_transition(
                    conv, num_features // 2, name='conv' + str(i + 2) + '_blk')
                num_features = num_features // 2
        conv = fluid.layers.batch_norm(
            input=conv,
            act='relu',
            param_attr=ParamAttr(name='conv5_blk_bn_scale'),
            bias_attr=ParamAttr(name='conv5_blk_bn_offset'),
            moving_mean_name='conv5_blk_bn_mean',
            moving_variance_name='conv5_blk_bn_variance')
        pool = fluid.layers.pool2d(
            input=conv, pool_type='avg', global_pooling=True)
        stdv = 1.0 / math.sqrt(conv.shape[1] * 1.0)
        # out = fluid.layers.fc(
        #     input=conv,
        #     size=class_dim,
        #     param_attr=fluid.param_attr.ParamAttr(
        #         initializer=fluid.initializer.Uniform(-stdv, stdv),
        #         name="fc_weights"),
        #     bias_attr=ParamAttr(name='fc_offset'))
        return pool
    def make_transition(self, input, num_output_features, name=None):
        bn_ac = fluid.layers.batch_norm(
            input,
            act='relu',
            param_attr=ParamAttr(name=name + '_bn_scale'),
            bias_attr=ParamAttr(name + '_bn_offset'),
            moving_mean_name=name + '_bn_mean',
            moving_variance_name=name + '_bn_variance')
        bn_ac_conv = fluid.layers.conv2d(
            input=bn_ac,
            num_filters=num_output_features,
            filter_size=1,
            stride=1,
            act=None,
            bias_attr=False,
            param_attr=ParamAttr(name=name + "_weights"))
        pool = fluid.layers.pool2d(
            input=bn_ac_conv, pool_size=2, pool_stride=2, pool_type='avg')
        return pool
    def make_dense_block(self,
                         input,
                         num_layers,
                         bn_size,
                         growth_rate,
                         dropout,
                         name=None):
        conv = input
        for layer in range(num_layers):
            conv = self.make_dense_layer(
                conv,
                growth_rate,
                bn_size,
                dropout,
                name=name + '_' + str(layer + 1))
        return conv
    def make_dense_layer(self, input, growth_rate, bn_size, dropout, name=None):
        bn_ac = fluid.layers.batch_norm(
            input,
            act='relu',
            param_attr=ParamAttr(name=name + '_x1_bn_scale'),
            bias_attr=ParamAttr(name + '_x1_bn_offset'),
            moving_mean_name=name + '_x1_bn_mean',
            moving_variance_name=name + '_x1_bn_variance')
        bn_ac_conv = fluid.layers.conv2d(
            input=bn_ac,
            num_filters=bn_size * growth_rate,
            filter_size=1,
            stride=1,
            act=None,
            bias_attr=False,
            param_attr=ParamAttr(name=name + "_x1_weights"))
        bn_ac = fluid.layers.batch_norm(
            bn_ac_conv,
            act='relu',
            param_attr=ParamAttr(name=name + '_x2_bn_scale'),
            bias_attr=ParamAttr(name + '_x2_bn_offset'),
            moving_mean_name=name + '_x2_bn_mean',
            moving_variance_name=name + '_x2_bn_variance')
        bn_ac_conv = fluid.layers.conv2d(
            input=bn_ac,
            num_filters=growth_rate,
            filter_size=3,
            stride=1,
            padding=1,
            act=None,
            bias_attr=False,
            param_attr=ParamAttr(name=name + "_x2_weights"))
        if dropout:
            bn_ac_conv = fluid.layers.dropout(
                x=bn_ac_conv, dropout_prob=dropout)
        bn_ac_conv = fluid.layers.concat([input, bn_ac_conv], axis=1)
        return bn_ac_conv
def DenseNet121():
    model = DenseNet(layers=121)
    return model
def DenseNet161():
    model = DenseNet(layers=161)
    return model
def DenseNet169():
    model = DenseNet(layers=169)
    return model
def DenseNet201():
    model = DenseNet(layers=201)
    return model
def DenseNet264():
    model = DenseNet(layers=264)
    return model

三、加载模型

dense = DenseNet121()
xception = Xception41()

# 界说输入层
image = fluid.layers.data(name='image', shape=[3, 640, 640], dtype='float32')
label = fluid.layers.data(name='label', shape=[1], dtype='int64')

# 新版本中，这么界说。
# image = fluid.data(name='image', shape=[-1, 3, 32, 32], dtype='float32')
# label = fluid.data(name='label', shape=[-1, 1], dtype='int64')

model1 = dense.net(image, class_dim=102)
model2 = xception.net(image, class_dim=102)

# 冻结网络Block层
model1.stop_gradient = True
model2.stop_gradient = True

四、模型交融&练习

这里只做简略的交融，尽管这种交融办法一点也不优雅，可是的确能涨分。

模型交融办法如下图所示，别离由两个模型提取特征，然后做一个拼接，通过全衔接层输出猜测概率。

我们需求留意，本项目中只用了一个全衔接层，图中的两个全衔接层的结构我们能够自己测验。

交融模型的结构

# 模型交融
model_fusion = fluid.layers.concat(input=[model1, model2], axis=1)

# 由这里创立一个根本的主程序
base_model_program = fluid.default_main_program().clone()
# 这里再重新加载网络的分类器，巨细为本项意图分类巨细
model = fluid.layers.fc(input=model_fusion, size=102, act='softmax')

# 获取损失函数和准确率函数
cost = fluid.layers.cross_entropy(input=model, label=label)
avg_cost = fluid.layers.mean(cost)
acc = fluid.layers.accuracy(input=model, label=label)
# 界说优化办法
optimizer = fluid.optimizer.AdamOptimizer(learning_rate=1e-4)
# 运行优化算法
opts = optimizer.minimize(avg_cost)
# 界说练习场所
place = fluid.CUDAPlace(0)#用GPU练习
# place = fluid.CPUPlace() #用CPU练习
exe = fluid.Executor(place)
# 进行参数初始化
exe.run(fluid.default_startup_program())

# 官方提供的原预练习模型
src_pretrain_model_path = 'data/data31022/fusion/'
# 通过这个函数判别模型文件是否存在
def if_exist(var):
    path = os.path.join(src_pretrain_model_path, var.name)
    exist = os.path.exists(path)
    return exist
# 加载模型文件，只加载存在模型的模型文件
fluid.io.load_vars(executor=exe, dirname=src_pretrain_model_path, predicate=if_exist, main_program=base_model_program)

# 界说输入数据维度
feeder = fluid.DataFeeder(place=place, feed_list=[image, label])
# 练习10次
for pass_id in range(1):
    # 进行练习
    for batch_id, data in enumerate(train_reader()):
        train_cost, train_acc = exe.run(program=fluid.default_main_program(),
                                        feed=feeder.feed(data),
                                        fetch_list=[avg_cost, acc])
        # 每100个batch打印一次信息
        if batch_id % 10 == 0:
            print('Pass:%d, Batch:%d, Cost:%0.5f, Accuracy:%0.5f' %
                  (pass_id, batch_id, train_cost[0], train_acc[0]))

# 保存参数模型
save_pretrain_model_path = 'models/step-8_model/'
# 删去旧的模型文件
shutil.rmtree(save_pretrain_model_path, ignore_errors=True)
# 创立坚持模型文件目录
os.makedirs(save_pretrain_model_path)
# 保存参数模型，增量练习
fluid.io.save_params(executor=exe, dirname=save_pretrain_model_path)

五、增量练习

这里给我们介绍一下Paddle的增量练习，详细能够检查飞桨的API。PaddleAPI

# 通过step-1处理后的的预练习模型
pretrained_model_path = 'models/step-8_model/'
# 加载通过处理的模型
fluid.io.load_params(executor=exe, dirname=pretrained_model_path)

# 界说输入数据维度
feeder = fluid.DataFeeder(place=place, feed_list=[image, label])
# 迭代一次，测试程序是否跑通。
for pass_id in range(1):
    # 进行练习
    for batch_id, data in enumerate(train_reader()):
        train_cost, train_acc = exe.run(program=fluid.default_main_program(),
                                        feed=feeder.feed(data),
                                        fetch_list=[avg_cost, acc])
        # 每100个batch打印一次信息
        if batch_id % 10 == 0:
            print('Pass:%d, Batch:%d, Cost:%0.5f, Accuracy:%0.5f' %
                  (pass_id, batch_id, train_cost[0], train_acc[0]))

# 保存参数模型
save_pretrain_model_path = 'models/step-6_model/'
# 删去旧的模型文件
shutil.rmtree(save_pretrain_model_path, ignore_errors=True)
# 创立坚持模型文件目录
os.makedirs(save_pretrain_model_path)
# 保存揣度模型
fluid.io.save_inference_model(dirname=save_pretrain_model_path, feeded_var_names=['image'],
    target_vars=[model], executor=exe)

六、猜测

# 加载揣度模型
use_gpu = True    
place = fluid.CUDAPlace(0) if use_gpu else fluid.CPUPlace()    
exe = fluid.Executor(place)    
save_freeze_dir = 'models/step-6_model/'    
[inference_program, feed_target_names, fetch_targets] = fluid.io.load_inference_model(dirname=save_freeze_dir, executor=exe)

# 读取测试数据
from PIL import Image
import numpy as np
def reader(img_path):
    img = Image.open(img_path)
    if img.mode != 'RGB':
        img = img.convert('RGB')
    img = img.resize((640, 640), Image.ANTIALIAS)   
    img = np.array(img).astype('float32')    
    img -= [127.5, 127.5, 127.5]
    img = img.transpose((2, 0, 1))  # HWC to CHW    
    img *= 0.007843    
    img = img[np.newaxis,:]   
    return img

# 单例模式，猜测数据
# 此处直接生成竞赛提交用的CSV文件，我们能够去平台上提交，测试自己的得分哦。
img_list = os.listdir('data/data30606/54_data/')
img_list.sort()
img_list.sort(key=lambda x: int(x[:-4]))  ##文件名按数字排序
img_nums = len(img_list)
# print(img_list)
test_path = 'data/data30606/54_data/test/'
# img_path = test_path + img_list[i]   
labels = []
for i in range(img_nums):   
    img_path = test_path + img_list[i]
    tensor_img = reader(img_path)    
    label = exe.run(inference_program, feed={feed_target_names[0]: tensor_img}, fetch_list=fetch_targets)    
    lab = np.argmax(label)   
    # print(lab)
    labels.append(lab)
submit = pd.DataFrame()
submit[1] = labels
submit.to_csv('submit123.csv', header=False)

总结

总体来说，这种交融办法不是很优雅，相对于核算量的提高所带来的精度提高收益不是很大，竞赛中有人这么干，可是有AIstudio，

显卡算力满足，我们能够纵情的堆，精度越高，竞赛排名越高。

下面是我的得分，我们能够调整迭代次数、学习率等超参，或者增加全衔接层，添加DropOut，来调整网络，我们加油哦。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。