当前位置：移动技术网 > IT编程>数据库>Redis > ProxylessNAS论文和算法解析

ProxylessNAS论文和算法解析

2020年07月14日 | 移动技术网IT编程 | 我要评论

ProxylessNAS，论文的全名是Direct Neural Architecture Search on Target Task and Hardware。

之前介绍的方法，搜索的方式基本上都是在小的数据集（比如Cifar-10）搜索出一个最好的Cell架构，然后通过堆叠的方法扩展到大数据集上（比如ImageNet）上做实验。然而，在这一篇论文看来，在小数据集上搜索出来的架构对于大数据集不一定就是好的。基于此观点，ProxylessNAS直接在大数据集上对Cell架构进行搜索，直接找到适合大数据集的Cell架构。

ProxylessNAS借鉴了DARTS论文的思想，将Cell架构空间参数化。但是Cell架构空间是非常大的，如果想在ImageNet上堆叠如此众多的Cell架构空间，会导致模型参数和显存占用异常巨大，训练也难以进行。

ProxylessNAS采用了一种叫做Binary Gate的方法，Node的特征图不再是前继Node经过operation后的加权和，而是让两个Node之间每次只有一个operation被激活，其他的operation都处于抑制的状态，这样的话每次就不用全部训练所有的operation参数和架构参数。具体架构如下图所示。

图1. ProxylessNAS的binarized架构图
在这里插入图片描述

从图1中可以看出，网络的基本结构和DARTS相似，只是在output之前加了一层Binary Gate，Binary Gate每次只有一个元素是1，其他全是0，这样在训练时候就不用去更新0对应的模型操作参数和架构参数，每次的前向推理和后向传播只在少数几条路径上进行。这种方法让网络架构就算是在大数据集上搭建大模型也能进行搜索训练。

ProxylessNAS的搜索方法也和DARTS相似，是交替进行的。搜索的步骤为：

训练模型参数时，将架构参数固定住，两个Node之间用Binary Gate选择其中一个operation进行训练，如图1-(1)所示；
训练架构参数时，固定住模型参数，重新选取Binary Gate（同步骤1）进行架构参数训练，如图1-(2)所示。

除了以精度为目标外，ProxylessNAS还支持硬件latency作为约束条件的优化搜索。其中一种方法是对各种操作的latency进行建模，并把整个模型的latency加入Loss公式中，共同在搜索步骤中优化。

$Loss=Loss_{CE}+\lambda_{1}\|w\|_{2}^{2}+\lambda_{2} E[latency]$

Loss公式中的最后一项即为latency的建模及其在Loss中的权重。

还有一种方法是采用RL的方法，这里就不再赘述，有兴趣的读者自行阅读文章。

作者同样在Cifar-10和ImageNet上做实验。Cifar-10上以PyramidNet为backbone进行改造， $stage=3$ ， $block=18$ ， $edge=12$ （对应NASNet的operation空间），最后一个block的输出通道为400。ImageNet上以MobileNet V2为backbone，对MBConv的操作增加了几种卷积核和ratios作为operation的搜索空间。最终实验结果如下两图所示。

图2. ProxylessNAS在Cifar-10上的实验性能
在这里插入图片描述

图3. ProxylessNAS在ImageNet上的实验性能
在这里插入图片描述

在Cifar-10上ProxylessNAS比同等参数量的其他NAS方法精度更高，甚至比一些更大参数量的方法都要好。在ImageNet上，ProxylessNAS也超越了其他的NAS方法，同时具有更少的latency。

本文地址：https://blog.csdn.net/saturdaysunset/article/details/107303123

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

荐 scrapy_redis 自定义初始请求

scrapy_redis框架的RedisSpider类和RedisMixin类源码分析，自定义初始请求 ... [阅读全文]
将音频文件转二进制分包存储到Redis的实现方法（奇淫技巧操作）

功能需求：一、获取本地音频文件，进行解析成二进制数据音频流二、将音频流转化成byte[]数组，按指定大小字节数进行分包三、将音频流分成若干个包，以list列表形... [阅读全文]
Redis框架Jedis及Redisson对比解析

1概述1.1. 主要内容本文的主要内容为对比redis的两个框架：jedis与redisson，分析各自的优势与缺点，为项目中java缓存方案中的redis编程... [阅读全文]
HBase架构、数据存储结构及工作原理分析

文章目录一、HBase介绍二、HBase架构1.主架构(1).Client(2).Zookeeper(3).HM... [阅读全文]
07.21

1.mongodb内嵌查询。2.redis aof和rdb。3.记录一天下单量(锁和channel选用)。4.g... [阅读全文]
Redis主从模式

Redis有三种集群模式：主从模式、Sentinel模式、Cluster模式主从模式Sentinel模式Clus... [阅读全文]
Zabbix监控

#### 1.zabbix监控日志文件配置[root@localhost ~]# mkdir /scripts/... [阅读全文]
redis 5.0一键搭建redis集群

环境： CentOS7下载并安装redis$ wget http://download.redis.io/rel... [阅读全文]
巨杉数据库与联想信创服务器完成兼容认证

近日，巨杉数据库与联想完成技术兼容和认证工作。经双方共同严格测试，SequoiaDB 巨杉数据库V3.4与联想信... [阅读全文]
Redis再战之AKF、CAP、哨兵机制《七》

文章目录AKF数据一致性（主从复制原理）强一致性弱一致性最终一致性CAP主从集群搭建哨兵机制(过半机制)哨兵之间... [阅读全文]

网友评论


验证码：

ProxylessNAS论文和算法解析

2020年07月14日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论