MNA-CNN: 如何在美学质量评估中储存照片原始信息

2024-03-10 04:44:23

传统基于深度学习的图片美学评估的要求输入是fixed-size，待评估的照片经常会经过裁剪、缩放和充填等变换，造成图片质量的下降。

那如何可以实现对原始图片尺寸进行美学质量评估呢？

示例：由上图，可以看出对图片尺寸的更改，直观上对美学质量就有较大影响。

于是，作者提出了一个composition-preserving deep ConvNet method，可以对原图进行美学特征的提取，不损坏原图质量。

具体的方法就是在常规卷积层和池化层前面加入一个spatial pooling layer，以直接处理输入图片的原始大小和长宽比。

接下来，就具体描述下作者的方法。

Background

首先，作者使用了一个广泛使用的图片分类网络ImageNet，将网络的top layer进行调整使之适应于美学质量评估任务。即将softmax prediction layer变成具有sigmoid激活函数的单一线性单元。

示例：深度学习网络结构

令fw表示为一个投影方程

其中，QI表示为图片I的美学质量。

令fcl（I）表示为最后一层全连接层的输出，sigmoid激活函数利用了图片美学质量的先验概率

将训练样本对S={In，ym}作为输入，其实yn为二进制（表示高质量与低质量）。令W表示为网络的连接权重集合，则可用stochastic gradient descend algorithm优化下式

获得网络结构参数。

Composition-preserving Deep ConvNet

作者对上述网络结构进行了修改与调整，采用了adaptive spatial pooling （ASP）strategy来替代原本的fixed-size约束。

示例：adaptive spatial pooling layer。ASP层在本地映像区域执行类似于传统池化层的运算（例如 max pooling）。但不同的是，ASP层代替了原本的输出维度，可相应地调整receptive field的大小。

接下来就是作者提出的Multi-Net Adaptive-Pooling ConvNet (MNA-CNN)的网络结构示意。

示例：MNA-CNN包含多个子网络，每个子网络的最后一层池化输出都转变成ASP。每个子网络的输入均为同一幅图片，每个子网络的输出通过average operator可获得一个最终的总体预测输出值。

作者又对所提出的网络结构做了进一步的改进。

用一个aggregation layer取代MNA-CNN的average operator算子。将每个子网络的预测值和作为每幅图片的scene-categorization posteriors输入，输出最后的美学质量估值。

示例：Scene-Aware Multi-Net Aggregation。将所提出的网络与scene-categorization deep network相结合。顶层的分类器以子网络预测和图像场景分类的后验概率作为特征向量，并产生最终的美学分类。

Experiments

作者将所设计网络应用于AVA数据集，实验效果则如下所示：

可以说是，美学质量评估效果还是很棒棒的。

接着，通过实验检验下ASP的有效性

以及Composition-preserving 有效性

示例1

示例2

综上，可以说作者提出的Composition-preserving网络在美学质量评估方面效果很是不错的。

原文链接：

[1] Mai, Long, Hailin Jin, and Feng Liu. "Composition-preserving deep photo aesthetics assessment. " Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

糖尿病患者如何科学控糖？营养膳食管理很重要，这8点请记好！

糖尿病是一种常见的内分泌疾病,其病残或病死率仅次于癌症和心血管疾病,是危害人类健康的第三大顽疾,与肥胖.高血压.血脂异常共同构成"死亡四重奏". 说起糖尿病的治疗方法,离不开&qu ...
Notebook与计算机视觉的未来

FiftyOne是一个开源的可视化数据集分析工具,最近添加了Jupyter notebook支持,该功能是我实现的,并且是其技术主管. FiftyOne:http://fiftyone.ai/ 完成后 ...
MNA和SGA在评价炎症性肠病患者营养状况中的应用

炎症性肠病(IBD)是一种病因尚不十分清楚的慢性非特异性肠道炎症性疾病,包括溃疡性结肠炎(UC)和克罗恩病(CD).营养不良是IBD患者常见和突出的并发症,严重影响患者的免疫功能.生活质量和长期存活率 ...
住院患者的营养不良与营养评估

蒋聪,杨浩,陈伟,江华,陶晔璇上海交通大学医学院附属新华医院四川省医学科学院四川省人民医院中国医学科学院北京协和医院目的:采用主观全面评定(SGA).营养风险筛查2002(NRS2002).营 ...
常用钢号推荐选用的焊接材料

钢号焊条电弧焊埋弧焊电渣焊 CO2气保焊氩弧焊焊条焊丝钢号(标准号) 焊剂焊丝钢号(标准号) 焊剂焊丝钢号(标准号) 焊丝钢号(标准号) 型号(标准号) 牌号示例型号(标准号) 牌号 ...
不同营养评价方法在肝病患者中的比较及适宜肝病营养评价的方法

于红卫,侯维,时淑云段忠辉,李胜利,刘菲菲李娟,董金玲,孟庆华首都医科大学附属北京佑安医院肝病重症医学科目的:应用不同营养筛查/评估方法对肝病患者进行营养状况调查,筛选出新的适合肝病患者的 ...
刘玮辰等：如何科学评估公共政策?——政策评估中的反事实框架及匹配方法的应用

C刊转载公共管理学研究来源:<公共行政评论>2021年第1期作者简介:刘玮辰,清华大学公共管理学院博士后; 郭俊华,上海交通大学国际与公共事务学院教授; 通讯作者: 史冬波,上海交通 ...
大连理工大学结构优化研究中心在科技部评估中获得优秀

大连讯近日,科技部国际合作司发布了国家国际科技合作基地评估结果.此次评估对718家国际合作基地开展了系统性.全覆盖的综合绩效评估工作.经过专家网络函评.会议评估等环节,依托大连理工大学运载工程 ...
如何应用政策评估中的反事实框架及匹配方法开展政策效应评估？

刘玮辰,郭俊华,史冬波.如何科学评估公共政策?--政策评估中的反事实框架及匹配方法的应用[J].公共行政评论,2021,14(01):46-73+219. 公共决策科学化依赖于科学的公共政策评估.随着 ...
浅谈数字X线成像（DR）的质量评估及影响因素

自从X线被发现之后,很快被引入医学领域.在兽医影像学领域,X线诊断技术经历了传统的屏-片系统.CR到现在的数字系统DR.目前由于DR系统获取图像方便快捷.图像质量清晰.技术要求小.价格相对合理等优点, ...
急性脑卒中影像学评估中容易被忽略的征象

粤C影像科作者:苗延巍仅供学习交流! 精品推荐,急性脑卒中影像学评估中容易被忽略的征象,满满干货,小板凳搬来,一起学习吧...
湖北在全国省级政府一体化政务服务能力评估中位列第七

推动一体化政务服务能力持续提升湖北省"一网通办"在全国省级政府一体化政务服务能力评估中位列第七 5月26日,中央党校(国家行政学院)电子政务研究中心发布了<省级政府和重点城 ...
李危石：椎体CT值在腰椎退变患者骨密度评估中的应用

来源:北京大学第三医院骨科作者:李危石,邹达,王辉等前言椎体松质骨CT值评估骨密度的方法与传统DXA法相比,其最大的优势在于简便快捷,受腰椎退变结构干扰小,可以利用已有的常规CT图像测量,不给患 ...
【资产评估】评估中的物业估值尽调方式，评估师来专业分析！

【资产评估】评估中的物业估值尽调方式，评估师来专业分析！
【彩版】一幅图搞清质量体系中内部审核该干啥？

【彩版】一幅图搞清质量体系中内部审核该干啥？

MNA-CNN: 如何在美学质量评估中储存照片原始信息

相关推荐