MNIST数据集:机器学习的“Hello, World!”

内容分享1周前发布
3 0 0

简介

MNIST(Modified National Institute of Standards and Technology database)是一个大型的手写数字数据库,广泛用于训练和测试图像处理领域的机器学习模型。它由来自NIST的特殊数据库3(SD-3,人口普查局员工书写)和特殊数据库1(SD-1,高中生书写)的样本组成,并经过了一系列的预处理和规范化,使其成为机器学习初学者的完美起点。

由于其简单性和易用性,MNIST成为了评估新机器学习算法事实上的基准测试,堪称机器学习领域的“Hello, World!”程序。

数据集结构与内容

内容: 70,000 张手写数字(0到9)的灰度图像。

分割

训练集: 60,000 张图像

测试集: 10,000 张图像

图像格式

每张图像是 28×28像素 的灰度图。

每个像素用一个 0到255之间 的整数表示其亮度(0代表黑色,255代表白色)。

在代码中,它通常被表示为一个形状为 (70000, 28, 28) 的数字矩阵。

© 版权声明

相关文章

暂无评论

none
暂无评论...