首页 >> 网络 >> CMU提出快速知识视觉框架:ResNet50 80.1%精度,训练加速30%

CMU提出快速知识视觉框架:ResNet50 80.1%精度,训练加速30%

2024-01-14 网络

eacher 来造成了需的微标识分量,同时所写还复原了:(1)每个 crop 也就是说的经纬度和(2)是否翻转的 Boolean 参数。下半其余部分展出了 student 军事训练检视过程,所写在随机调制由此可知片的时候同时也亦会读取它们也就是说的微标识份文件,从中的所选 N 个 crops 用于军事训练,额外原始数据大幅提低比如 mixup,cutmix 亦会放入这个过渡阶段,从而耗费了由于引入格外多原始数据大幅提低参数带来的额外打印负担。

2. 调制解决方案

本文还驳斥了一个 multi-crop sampling 的解决方案,即在一个 mini-batch ;还有每张由此可知片调制多个样本 crops。当总的军事训练 epochs 连续性的前提下,该调制作法可以大大下降原始数据读取的次数,对于一些原始数据读取不是非常低效或者造成了严重瓶颈的战略性设备,这种解决方案的较极快特性非常相对来说(如下一栏请注意)。同时在一张由此可知片调制多个 crops 可都有降军事训练样本有数的方差,帮助稳定军事训练,所写发现如果 crops 的为数不是来得大的意味着可以相对来说增加基本概念准确度,但是一张由此可知片;还有调制来得多 crops 为数亦会造成每个 mini-batch ;还有军事训练样本的电子邮件差异缺乏(过于相似),因此极度调制亦会制约性能,所以需设置一个合理的数量级。

3. 较极快比

所写在科学研究课题其余部分跟规格的军事训练作法以及 ReLabel 军事训练展开了更极快的比较,结果如下一栏请注意:可以看见,相对来说正常的分类法框内架,FKD 亦会极快 16% 左右,而相对来说 ReLabel 则极快了 30%,因为 ReLabel 相对来说正常军事训练需读取双倍的份文件为数。需注意的是这个更极快对比科学研究课题中的,FKD crop 为数为 4,如果所选格外大的 crop 为数可以给予格外低的较极快比。

较极快原因分析方法:

除了上述讲解的采用多个 crops 来展开较极快外,所写还分析方法了其他一些较极快的因素,如下由此可知请注意,ReLabel 在军事训练基本概念过渡阶段需作用于调制原始数据的经纬度,同时需适用 RoI-Align 和 Softmax 来作用于所需的微标识,相对来说而言,FKD 确实上复原了经纬度电子邮件和最终微标识格式,因此读取标识份文件不久不需继续做任何额外的后检视就可以确实上军事训练,更极快相对来说 ReLabel 也亦会格外极快。

4. 标识密度分析方法

微标识密度是保证基本概念军事训练准确度的一项最重要的指标,所写通过仿真标识常见于以及分析有所不同基本概念亦同测之有数的交叉熵(cross-entropy)来证明了所驳斥的作法以外好处的微标识密度。

上由此可知展出了 FKD 和 ReLabel 微标识常见于的原因对比,给予如下结论:

(第一行)FKD 相对来说 ReLabel 置信度格外加少于也与回传样本段落格外加一致,所写分析方法原因是 ReLabel 将一个系统由此可知像回传到基本概念中的,而不是局部地区,这使得作用于的一个系统标识映射编码了格外多一个系统并不一定电子邮件同时忽略了历史背景电子邮件,使得作用于的微标识过于近似于单个句法标识。 (第二行)虽然长期存在一些样本 ReLabel 和 FKD 之有数的最大亦同测规格差相似,但 FKD 相关联格外多标识常见于中的的实质上并不一定规格差,而 ReLabel 的常见于中的并很难捕获这些实质上并不一定的电子邮件。 (第三行)对于某些异常原因,FKD 比 ReLabel 格外加瘦削,例如要能框内含有松散国界,或者只有别于其余部分要能等。 (第四行)在有些意味着,ReLabel 的标识常见于意外的崩溃了(均匀常见于),很难造成了一个主要的亦同测,而 FKD 仍然可以亦同测得极好。

5. 标识压缩成、分析解决方案

1)硬质 (Hardening)。在该解决方案中的,样本标识 Y_H 适用 teacher 亦同测的最大 logits 的引文。标识硬质解决方案造成了的依然是 one-hot 的标识,如下公式请注意:

2)纹理 (Smoothing)。纹理分析解决方案是将上述硬质后的标识 Y_H 更换为微标识和均匀常见于的此段函数组合,如下请注意:

3)效用纹理 (Marginal Smoothing with Top-K)。效用纹理分析解决方案相对来说实体亦同测参数保留了格外多的效用电子邮件(Top-K)来纹理标识 Y_S:

4)效用纹理反之亦然 (Marginal Re-Norm with Top-K)。效用纹理反之亦然解决方案亦会将 Top-K 亦同测参数重新反之亦然到和为 1,并保持其他元素参数为零(FKD 适用反之亦然来测定 Top-K 亦同测参数的和为 1,因为 FKD 打印的微标识是 softmax 检视不久的参数):

明确也就是说上述各种分析解决方案的由此可知示如下由此可知请注意:

6. 有所不同标识分析 / 压缩成解决方案的打印大小比较

有所不同标识压缩成方法需的打印空有数如下一栏请注意,所适用的原始数据集为 ImageNet-1K,其中的 M 是微标识作用于过渡阶段每张由此可知像被调制的为数,这里所写所选了 200 作为示例。Nim 是由此可知像数量, ImageNet-1K 原始数据集为 1.2M,SLM 是 ReLabel 标识线性的大小,Cclass 是类的数量,DDA 是需打印的原始数据大幅提低的参数维度。

从一栏中的可以看见,在不继续做任何压缩成的意味着 FKD 微标识需的打印空有数为 0.9T,这在确实适用中的显然是不现实的,标识原始数据的大小仍然远远多达军事训练原始数据本身了。通过标识压缩成可以极大下降打印大小,同时前头科学研究课题也证明了合适的压缩成作法并不亦会损害基本概念准确度。

7. 自督导深造勤务上的分析方法

FKD 的军事训练作法也可以分析方法于自督导深造勤务。所写适用自督导正则所列达式比如 MoCo,SwAV 等来亦同军事训练 teacher 基本概念,然后按照上述作法作用于用于自督导的微标识(unsupervised soft label),这个工序跟督导深造给予的 teacher 很相似。作用于标识检视过程亦会保留原始自督导基本概念中的 projection head 并适用不久的最终输出分量,然后将这个分量作为微标识复原下来。给予该微标识后,可以适用除此以外的督导式的军事训练作法来深造也就是说的 student 基本概念。

8. 科学研究课题结果

1)首先是在 ResNet-50 和 ResNet-101 上的结果,如下所列请注意,FKD 取得了 80.1%/ResNet-50 和 81.9%/ResNet-101 的准确度。同时军事训练时有数相对来说普通军事训练和 ReLabel 都极快了很多。

2)所写还飞行测试了 FKD 在 MEAL V2 上的结果,除此以外给予了 80.91% 的结果。

3)Vision Transformer 上的结果:

接下来所写展出了在 vision transformer 上的结果,在不适用额外原始数据大幅提低的意味着,FKD 就可以比此前专业知识混合物方法给予将近发散的增加,同时军事训练更极快极快了 5 倍以上。

4)Tiny CNNs 上的结果:

5)消融科学研究课题:

首先是有所不同压缩成解决方案,总合考虑打印需求和军事训练准确度,效用纹理解决方案是最佳的。

接下来是军事训练过渡阶段有所不同 crop 为数的对比,MEAL V2 由于适用了 pre-trained 的参数作为codice_举例来说,因此有所不同 crop 为数下性能都比较丰富和近似于。而 vanilla 和 FKD 在 crop=4 的时候展现出得除此以外。特别是在 vanilla,相对来说 crop=1 准确度增加了发散,crop 少于 8 不久准确度下降相对来说。

6)自督导勤务上的结果:

如下所列请注意,在自督导深造勤务上 FKD 作法还是可以极好的深造要能基本概念,同时相对来说双子骨架自督导网路军事训练和混合物军事训练,可以较极快三到四倍。

9. 下游勤务

下所列给出了 FKD 基本概念在 ImageNet ReaL 和 ImageNetV2 两个原始数据集上的结果,可以看见,FKD 在这些原始数据集上取得了稳定的增加。

下所列是 FKD 亦同军事训练基本概念在 COCO 要能检查勤务上的结果,增加除此以外相对来说。

10. 仿真分析方法

如下两张仿真由此可知请注意,所写通过仿真中的有数构造层(attention map)的作法探索 FKD 这种 region-based 军事训练作法对基本概念造成了的制约,所写对比了三种有所不同军事训练作法给予的基本概念:正常 one-hot label,ReLabel 和本文驳斥的 FKD。

(i) FKD 的亦同测的规格差参数相对来说 ReLabel 格外加小(soft),因为 FKD 军事训练检视过程引入的自然语言以及历史背景电子邮件格外多。在 FKD 随机 crop 的军事训练解决方案中的,许多样本调制于历史背景(自然语言)地区,来自 teacher 基本概念的微亦同测标识格外能真实世界的凸显出确实回传段落,并且这些微标识可能与 one-hot 标识完全有所不同,FKD 的军事训练机制可以好处的为了让自然语言中的的额外电子邮件。

(ii) FKD 的构造仿真由此可知在物体地区上具有格外大的低响应参数地区,这所列明 FKD 军事训练的基本概念为了让了格外多地区的藏宝图展开亦同测,进而捕获格外多差异性和细粒度的电子邮件。

(iii)ReLabel 的警觉仿真由此可知与 PyTorch 亦同军事训练基本概念格外加近似于,而 FKD 的结果跟他们相对来说具有清大差异性。这说明 FKD 作法深造到的警觉机制跟此前基本概念有着总体的差别,从这点启程缺乏之处可以必要性研究课题其理论上的原因和工作特异性。

格外多正则所列达式细节欢迎阅读其书名和示例。

胃肠炎吃什么药有效果
肠炎吃益生菌有用吗
食道平散对食道癌真的有效吗
去哈萨克斯坦做试管婴儿多少
慢性肠炎吃什么药
友情链接