看到一篇会议论文[1],宣称用lenet-5在fmnist上可以实现超过98%的识别率。
当时看到就惊呆了!
先介绍一下论文主体内容:
第一部分引言强调了CNN在计算机视觉中有广泛的应用,并引出了lenet5是一个重要的CNN模型,并分6个方面阐述Fashion-MNIST是一个复杂的数据集。
第二部分介绍了相关的工作,即识别Fashion-MNIST的工作。
红圈处为本文结果,可达98.8%
第三部分方法部分首先介绍了lenet5的结构,如下图
之后介绍了评价指标,主要关注accuracy
第四部分介绍了实验结果,并对实验结果进行了讨论
恕我无知,这是我第一次看到test acc比train acc还要高,而且对于Fashion-MNIST,竟然在8epochs达到了98.8%,我当然想重复这个实验,毕竟在Fashion-MNIST github页面上,RESNet18[2]也只能实现95%的准确率,最高为96.7%
根据文中给出的十分有限的超参数:学习 = 0.005 batchsize = 32 epochs = 10,我找出了用matlab写的CNN程序,准备重复这个实验,由于论文中未提及用bn核dropout等技术,我也没用,下图是我的结果:
呵呵,下图是我用其他结构跑的结果,超过92%
网络结构为:
XDM,是我对这篇论文的内容理解有误吗?有没有识别过Fashion-MNIST的出来发个话啊
[1](PDF) Classification of Garments from Fashion MNIST Dataset Using CNN LeNet-5 Architecture (http://researchgate.net)
[2]https://github.com/zalandoresearch/fashion-mnist