7,454 讀數

你需要知道的 11 个用于计算机视觉的 Torchvision 数据集

路过 Open Datasets Compiled by HackerNoon13m2023/03/26

太長; 讀書

Torchvision 提供对专为计算机视觉任务设计的预构建数据集、模型和转换的访问。数据集经过预处理、标记并组织成可以轻松加载和使用的格式。 Torchvision 还支持 CPU 和 GPU 加速，使其成为开发计算机视觉应用程序的灵活而强大的工具。

featured image - 你需要知道的 11 个用于计算机视觉的 Torchvision 数据集

估算机视觉图片一个还在经历英语显大成长的研究方向，因此有许许多多现场软件应用，从自行行驶汽车汽车到脸型分辨装置。既使，该研究方向的最主要的探索其一是收获优性能的参数集来训练课丝机借鉴模式。

为了能应该对一项挑战赛，torchvision 打造了对专为折算机设计艺术世界任务方案的预引入数值集、模式和转换成的访问共享。 Torchvision 还不支持 CPU 和 GPU 提速，使其成為开发设计折算机设计艺术应用程度的灵便而强悍的工貝。

什么是“Torchvision 数据集”？

Torchvision 数据集是计算机视觉中常用的流行数据集的集合，用于开发和测试机器学习模型。借助 torchvision 数据集，开发人员可以在一系列任务上训练和测试他们的机器学习模型，例如图像分类、对象检测和分割。

数剧集也经途预清理、标志和集体成可不可以枯燥载入和的使用的格试。

Torchvision 数据集列表

MNIST
CIFAR-10
CIFAR-100
图像网
可可
时尚-MNIST
SVHN
STL-10
名人A
帕斯卡挥发性有机化合物
Places365

1.

该 torchvision 数据显示集很大受欢迎图文，具有广泛性APP于系统自学和计算公式机听觉研究方向。它由 70,000 张笔写加数 0-9 的灰度图案文件分为，这当中 60,000 张图案文件使用训练学习，10,000 张图案文件使用公测。每个图文的的大小为 28x28 手机像素，并有个一定的那些固化的标签来意味着它意味着的是哪方面的加数。

要访问此数据集，您可以直接从或者使用 torchvision 加载数据集：

 import torchvision.datasets as datasets # Load the training dataset train_dataset = datasets.MNIST(root='data/', train=True, transform=None, download=True) # Load the testing dataset test_dataset = datasets.MNIST(root='data/', train=False, transform=None, download=True)

使用 PyTorch torchvision 包加载 MNIST 数据集的代码。从于 20/3/2023 检索。

2.

CIFAR-10 数据源集涉及到 10 个品目的 60,000 张 32x32 彩色的画像，每一位品目有 6,000 张画像。它共分有 50,000 张练习画像和 10,000 张测验画像，进几步可分五练习提前生产批号和一家测验提前生产批号，每一位提前生产批号有 10,000 张画像。

这个数据集可以从下载，或使用 torchvision 在此处加载：

 import torch import torchvision import torchvision.transforms as transforms transform = transforms.Compose( [transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))]) trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)

请重视，您可不可以给出想要变动数据资料读取器的批操作各个和工作任务任务管理器数。

使用 PyTorch torchvision 包加载 CIFAR-10 数据集的代码。于 20/3/2023 从检索。

3.

CIFAR-100 数剧集有 60,000 张（50,000 张体能训练方法图案和 10,000 张測試图案）32x32 颜色图案，分成 100 个类，每一个类有 600 张图案。这 100 个类被分成 20 个超类，用细标贴表达它的类，用粗标贴表达它单位隶属的超类。

要从 Kaggle 下载 torchvision 数据集，请访问 Kaggle并按照那里提供的说明进行操作。或者，如果您更喜欢使用 torchvision 库加载数据集，您可以这样做：

 import torchvision.datasets as datasets import torchvision.transforms as transforms # Define transform to normalize data transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]) ]) # Load CIFAR-100 train and test datasets trainset = datasets.CIFAR100(root='./data', train=True, download=True, transform=transform) testset = datasets.CIFAR100(root='./data', train=False, download=True, transform=transform) # Create data loaders for train and test datasets trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True) testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

使用 PyTorch torchvision 包加载 CIFAR-100 数据集的代码。于 20/3/2023 从检索。

4.

torchvision 中的 ImageNet 统计资料集是指较为基本比较便宜 120 万张训练方法图案、50,000 张验正图案和 100,000 张软件测试图案。统计资料网络化的好几张图案都标着 1,000 个行业类别之1，譬如“猫”、“狗”、“小汽车”、“战机”等。

要下载此 torchvision 数据集，您必须访问或加载 torchvision：

 import torchvision.datasets as datasets import torchvision.transforms as transforms # Set the path to the ImageNet dataset on your machine data_path = "/path/to/imagenet" # Create the ImageNet dataset object with custom options imagenet_train = datasets.ImageNet( root=data_path, split='train', transform=transforms.Compose([ transforms.Resize(256), transforms.RandomCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]), download=False ) imagenet_val = datasets.ImageNet( root=data_path, split='val', transform=transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]), download=False ) # Print the number of images in the training and validation sets print("Number of images in the training set:", len(imagenet_train)) print("Number of images in the validation set:", len(imagenet_val))

使用 PyTorch torchvision 包加载 ImageNet 数据集的代码。于 2023 年 3 月 21 日从检索。

5.

Microsoft Common Objects in Context(MS Coco) 资料集带有 328,000 张台账方式和人们的优質量感觉画像，经常用到是比较雷达回波图方式查测数学模型耐热性的规范。

要下载此 torchvision 数据集，请访问或加载 torchvision：

 import torch from torchvision import datasets, transforms # Define transformation transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) # Load training dataset train_dataset = datasets.CocoDetection(root='/path/to/dataset/train2017', annFile='/path/to/dataset/annotations/instances_train2017.json', transform=transform) train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True) # Load validation dataset val_dataset = datasets.CocoDetection(root='/path/to/dataset/val2017', annFile='/path/to/dataset/annotations/instances_val2017.json', transform=transform) val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False)

确保安全将 /path/to/dataset 占位符转换为资料集分类目录的现实情况线路。除此以外，调正 batch_size 性能以够满足您的需求。

使用 PyTorch torchvision 包加载 MS Coco 数据集的代码。从于 21/3/2023 检索。

6.

Fashion MNIST 统计的数据源集由 Zalando Research 创建活动，使用在用于默认 MNIST 统计的数据源集。 Fashion MNIST 统计的数据源集由 70,000 张灰度画像（操练集 60,000 张和测试方法集 10,000 张）组成的。

全部图片强弱为 28x28 清晰度，代表人 10 种其他品目的女式牛仔服装，涉及 T 恤/裙子、裤装、套头衫、连裙子、长外套、凉鞋、西装外套、行动鞋、包和踝靴。它近似于原使 MNIST 动态数据集，但因女式牛仔服装内容的错综本质和复杂化性越来越高，为此划分钓鱼任务极具挑战赛性。

这个 torchvision 数据集可以从下载，或使用此代码加载：

 import torch import torchvision import torchvision.transforms as transforms # Define transformations transform = transforms.Compose( [transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))]) # Load the dataset trainset = torchvision.datasets.FashionMNIST(root='./data', train=True, download=True, transform=transform) testset = torchvision.datasets.FashionMNIST(root='./data', train=False, download=True, transform=transform) # Create data loaders trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2) testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)

使用 PyTorch torchvision 包加载 Fashion-MNIST 数据集的代码。于 2023 年 3 月 21 日从检索。

7.

SVHN (Street View House Numbers) 数据库显示集开始 Google 的街景图象派生的图象数据库显示集，它由从社区图象中抓取的门钢种截剪图象根据。它以构成拥有门钢种非常疆界框的完正文件类型和仅构成门钢种的截剪文件类型带来了。完正文件类型大多数使用對象判断目标，而截剪文件类型大多数使用几大类目标。

SVHN 的数剧集也是指在 torchvision 包中，它是指主要广泛使用于操练的 73,257 张图文、主要广泛使用于测验的 26,032 张图文和主要广泛使用于另外操练的数剧的 531,131 张扣除图文。

要下载这个 torchvision 数据集，你可以去或者你可以在这里加载它：

 import torchvision import torch # Load the train and test sets train_set = torchvision.datasets.SVHN(root='./data', split='train', download=True, transform=torchvision.transforms.ToTensor()) test_set = torchvision.datasets.SVHN(root='./data', split='test', download=True, transform=torchvision.transforms.ToTensor()) # Create data loaders train_loader = torch.utils.data.DataLoader(train_set, batch_size=64, shuffle=True) test_loader = torch.utils.data.DataLoader(test_set, batch_size=64, shuffle=False)

使用 PyTorch torchvision 包加载 SVHN 数据集的代码。于 22/3/2023 从检索。

8.

STL-10 统计数剧库集不是个图片识别系统统计数剧库集，由 10 个类组合，共分约有 6,000+ 张图片。 STL-10 意味着“Standard Training and Test Set for Image Recognition-10 classes”，统计数剧库低效的 10 个类是：

飞机
鸟
车
猫
鹿
狗
马
猴
船
卡车

要访问此数据集，您可以直接从或者使用 torchvision 加载数据集：

 import torchvision.datasets as datasets import torchvision.transforms as transforms # Define the transformation to apply to the data transform = transforms.Compose([ transforms.ToTensor(), # Convert PIL image to PyTorch tensor transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) # Normalize the data ]) # Load the STL-10 dataset train_dataset = datasets.STL10(root='./data', split='train', download=True, transform=transform) test_dataset = datasets.STL10(root='./data', split='test', download=True, transform=transform)

使用 PyTorch torchvision 包加载 STL-10 数据集的代码。 2023 年 3 月 22 日从检索。

9.

在这个 torchvision 资料报告集是一种个流行时尚的大产值人面技能资料报告集，蕴含不超 200,000 张名家图形。它于 2015 年由香港保险中文版高中的调查相关人员第一次上线。CelebA 中的图形蕴含 40 种整体技能，诸如多少岁的、头顶头发的颜色、整体聊天表情和年龄选择。不仅，这样图形是由车联网络检索式到的，含盖了普遍的整体外观设计，包扩有所不同的人种、多少岁的和年龄选择。每一图形中整体地方的边际框参考文献标注，或双眼、鼻尖和舌头的 5 个标制点。

你可以下载这个数据集或使用此代码加载它：

 import torchvision.datasets as datasets import torchvision.transforms as transforms transform = transforms.Compose([ transforms.CenterCrop(178), transforms.Resize(128), transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) ]) celeba_dataset = datasets.CelebA(root='./data', split='train', transform=transform, download=True)

使用 PyTorch torchvision 包加载 CelebA 数据集的代码。 2023 年 3 月 22 日从检索。

10.

VOC 数据显示集（错觉艺术喜欢的人图片类）于 2005 年最为 PASCAL VOC 挑战性赛的那方面首先投放市场，意在实施错觉艺术鉴别科技领域的公布科技技术。它由 20 个各种喜欢的人图片种类的图相主成，还涉及到哺乳动物、此车和熟悉的门窗工具。这个图相中的任一都用图相中喜欢的人图片的地理位置和各类做了参考文献标注。参考文献标注还涉及到的边界框和象素级划分掩码。

大参数集蕴含两个人一般集：培训集和手机认证集。培训集蕴含大概需要 5,000 张有引用的图象，而手机认证集蕴含大概需要 5,000 张无引用的图象。不但，该大参数集还还包括一家蕴含大概需要 10,000 张图象的测试仪集，但该集的引用未政府信息。

要访问最近的数据集，您可以从,或将其加载到 torchvision 中：

 import torch import torchvision from torchvision import transforms # Define transformations to apply to the images transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) # Load the train and validation datasets train_dataset = torchvision.datasets.VOCDetection(root='./data', year='2007', image_set='train', transform=transform) val_dataset = torchvision.datasets.VOCDetection(root='./data', year='2007', image_set='val', transform=transform) # Create data loaders train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True) val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False)

使用 PyTorch torchvision 包加载 PASCAL VOC 数据集的代码。 2023 年 3 月 22 日从中检索。

11.

Places365 信息集就是个大大小的消费应用场景正常区分信息集，拥有着高于 180 万张图形，是指 365 个消费应用场景类属。 Places365 原则信息集涉及到约 180 万张图形，而 Places365-Challenge 信息集涉及到 50,000 张三倍的安全验证图形，这么多图形对正常区分型号极具竞技性性。

要访问此数据集，您可以使用或在此处加载 torchvision：

 import torch import torchvision from torchvision import transforms # Define transformations to apply to the images transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) # Load the train and validation datasets train_dataset = torchvision.datasets.Places365(root='./data', split='train-standard', transform=transform) val_dataset = torchvision.datasets.Places365(root='./data', split='val', transform=transform) # Create data loaders train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True) val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False)

使用 PyTorch torchvision 包加载 Places365 数据集的代码。 2023 年 3 月 22 日从检索。