1. torch.nonzero()基础解析
torch.nonzero()是PyTorch中一个非常实用的函数,它的核心功能是找出张量中所有非零元素的索引位置。这个函数在数据处理、特征提取和模型训练中经常用到,特别是在处理稀疏数据或者需要定位特定元素时非常有用。
先来看一个最简单的例子:
import torch
x = torch.tensor([0, 1, 0, 2])
indices = torch.nonzero(x)
print(indices)
# 输出:
# tensor([[1],
# [3]])
这个例子中,我们创建了一个一维张量x,其中有两个非零元素:位置1的值是1,位置3的值是2。torch.nonzero()返回的是一个二维张量,每一行对应一个非零元素的索引。
在实际项目中,我经常用这个函数来处理图像分割任务中的掩码数据。比如要从一个二值化的分割掩码中提取前景像素的坐标,torch.nonzero()就能派上大用场:
mask = torch.tensor([
[0, 0, 1],
[0, 1, 0],
[1, 0, 0]
])
foreground = torch.nonzero(mask)
print(foreground)
# 输出:
# tensor([[0, 2],
# [1, 1],
# [2, 0]])
这里输出的每一行都代表一个前景像素的坐标,比如[0,2]表示第0行第2列是前景像素。
2. as_tuple参数的高级用法
torch.nonzero()最强大的特性在于它的as_tuple参数。默认情况下(as_tuple=False),函数返回一个二维张量。但当设置as_tuple=True时,它会返回一个元组,其中每个元素都是一个一维张量,对应输入张量在某个维度上的非零索引。
这个特性在高级索引操作中特别有用。来看


被折叠的 条评论
为什么被折叠?



