谷歌 AI 新方法：可提升 10 倍图像识别效率 - 嘉兴麦特莱博软件开发工作室

功能描述：
在开发以卷积神经网络（CNN）为核心的机器学习模型时，我们通常会先使用固定的资源成本，构建最初的模型，然后增加更多资源（层数）扩展模型，从而获得更高的准确率。

著名的 CNN 模型 ResNet（深度残差网络），就可以用增加层数的方法从ResNet-18 扩展到 ResNet-200。谷歌的 GPipe 模型也通过将基线 CNN 扩展 4 倍，在 ImageNet 数据库上达到 84.3% 的准确率，力压所有模型。

一般来说，模型的扩大和缩小都是任意增加 CNN 的深度或宽度，抑或是使用分辨率更大的图像进行训练和评估。虽然这些传统方法提高准确率的效果不错，但大多需要繁琐的手动调整，还可能无法达到最佳性能。

因此，谷歌AI团队最近提出了新的模型缩放方法“复合缩放（Compound Scaling）”和配套的 EfficientNet 模型。他们使用复合系数和 AutoML 从多个维度均衡缩放 CNN，综合考虑深度和宽度等参数，而不是只单纯地考虑一个，使得模型的准确率和效率大幅提升，图像识别的效率甚至可以大幅提升 10 倍。

这项新方法的根本优势在于实践起来非常简单，背后的原理很好理解，甚至让人怀疑为什么没有被更早发现。该研究成果以论文的形式被 ICML 2019（国际机器学习大会）接收，名为 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相关代码和 TPU 训练数据也已经在 GitHub 上开源。

源码来自：https://github.com/titu1994/keras-efficientnets/blob/master/keras_efficientnets/efficientnet.py

联系：highspeedlogic

QQ ：1224848052

微信：HuangL1121

邮箱：1224848052@qq.com

网站：http://www.mat7lab.com/

网站：http://www.hslogic.com/

微信扫一扫：

首页

业务范围

项目展示

资源共享

业内新闻

合作说明

关于我们

关于我们

业务范围

项目展示

资源共享

联系我们