简介
MNIST(Modified National Institute of Standards and Technology database)是一个大型的手写数字数据库,广泛用于训练和测试图像处理领域的机器学习模型。它由来自NIST的特殊数据库3(SD-3,人口普查局员工书写)和特殊数据库1(SD-1,高中生书写)的样本组成,并经过了一系列的预处理和规范化,使其成为机器学习初学者的完美起点。
由于其简单性和易用性,MNIST成为了评估新机器学习算法事实上的基准测试,堪称机器学习领域的“Hello, World!”程序。
数据集结构与内容
内容: 70,000 张手写数字(0到9)的灰度图像。
分割:
训练集: 60,000 张图像
测试集: 10,000 张图像
图像格式:
每张图像是 28×28像素 的灰度图。
每个像素用一个 0到255之间 的整数表示其亮度(0代表黑色,255代表白色)。
在代码中,它通常被表示为一个形状为 (70000, 28, 28)
的数字矩阵。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...