paddlex.seg.transforms

对用于分割任务的数据进行操作。可以利用Compose类将图像预处理/增强操作进行组合。

Compose

paddlex.seg.transforms.Compose(transforms)

根据数据预处理/数据增强列表对输入数据进行操作。使用示例

参数

  • transforms (list): 数据预处理/数据增强列表。

RandomHorizontalFlip

paddlex.seg.transforms.RandomHorizontalFlip(prob=0.5)

以一定的概率对图像进行水平翻转,模型训练时的数据增强操作。

参数

  • prob (float): 随机水平翻转的概率。默认值为0.5。

RandomVerticalFlip

paddlex.seg.transforms.RandomVerticalFlip(prob=0.1)

以一定的概率对图像进行垂直翻转,模型训练时的数据增强操作。

参数

  • prob (float): 随机垂直翻转的概率。默认值为0.1。

Resize

paddlex.seg.transforms.Resize(target_size, interp='LINEAR')

调整图像大小(resize)。

  • 当目标大小(target_size)类型为int时,根据插值方式, 将图像resize为[target_size, target_size]。
  • 当目标大小(target_size)类型为list或tuple时,根据插值方式, 将图像resize为target_size, target_size的输入应为[w, h]或(w, h)。

参数

  • target_size (int|list|tuple): 目标大小
  • interp (str): resize的插值方式,与opencv的插值方式对应, 可选的值为[’NEAREST’, ‘LINEAR’, ‘CUBIC’, ‘AREA’, ‘LANCZOS4’],默认为”LINEAR”。

ResizeByLong

paddlex.seg.transforms.ResizeByLong(long_size)

对图像长边resize到固定值,短边按比例进行缩放。

参数

  • long_size (int): resize后图像的长边大小。

ResizeRangeScaling

paddlex.seg.transforms.ResizeRangeScaling(min_value=400, max_value=600)

对图像长边随机resize到指定范围内,短边按比例进行缩放,模型训练时的数据增强操作。

参数

  • min_value (int): 图像长边resize后的最小值。默认值400。
  • max_value (int): 图像长边resize后的最大值。默认值600。

ResizeStepScaling

paddlex.seg.transforms.ResizeStepScaling(min_scale_factor=0.75, max_scale_factor=1.25, scale_step_size=0.25)

对图像按照某一个比例resize,这个比例以scale_step_size为步长,在[min_scale_factor, max_scale_factor]随机变动,模型训练时的数据增强操作。

参数

  • min_scale_factor(float), resize最小尺度。默认值0.75。
  • max_scale_factor (float), resize最大尺度。默认值1.25。
  • scale_step_size (float), resize尺度范围间隔。默认值0.25。

Normalize

paddlex.seg.transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5], min_val=[0, 0, 0], max_val=[255.0, 255.0, 255.0])

对图像进行标准化。

1.像素值减去min_val 2.像素值除以(max_val-min_val), 归一化到区间 [0.0, 1.0]。 3.对图像进行减均值除以标准差操作。

参数

  • mean (list): 图像数据集的均值。默认值[0.5, 0.5, 0.5]。长度应与图像通道数量相同。
  • std (list): 图像数据集的标准差。默认值[0.5, 0.5, 0.5]。长度应与图像通道数量相同。
  • min_val (list): 图像数据集的最小值。默认值[0, 0, 0]。长度应与图像通道数量相同。
  • max_val (list): 图像数据集的最大值。默认值[255.0, 255.0, 255.0]。长度应与图像通道数量相同。

Padding

paddlex.seg.transforms.Padding(target_size, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)

对图像或标注图像进行padding,padding方向为右和下。根据提供的值对图像或标注图像进行padding操作。

参数

  • target_size (int|list|tuple): padding后图像的大小。
  • im_padding_value (list): 图像padding的值。默认为[127.5, 127.5, 127.5]。长度应与图像通道数量相同。
  • label_padding_value (int): 标注图像padding的值。默认值为255(仅在训练时需要设定该参数)。

RandomPaddingCrop

paddlex.seg.transforms.RandomPaddingCrop(crop_size=512, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)

对图像和标注图进行随机裁剪,当所需要的裁剪尺寸大于原图时,则进行padding操作,模型训练时的数据增强操作。

参数

  • crop_size(int|list|tuple): 裁剪图像大小。默认为512。
  • im_padding_value (list): 图像padding的值。默认为[127.5, 127.5, 127.5]。长度应与图像通道数量相同。
  • label_padding_value (int): 标注图像padding的值。默认值为255。

RandomBlur

paddlex.seg.transforms.RandomBlur(prob=0.1)

以一定的概率对图像进行高斯模糊,模型训练时的数据增强操作。

参数

  • prob (float): 图像模糊概率。默认为0.1。

RandomRotate

paddlex.seg.transforms.RandomRotate(rotate_range=15, im_padding_value=[127.5, 127.5, 127.5], label_padding_value=255)

对图像进行随机旋转,模型训练时的数据增强操作。目前支持多通道的RGB图像,例如支持多张RGB图像沿通道轴做concatenate后的图像数据,不支持通道数量不是3的倍数的图像数据。

在旋转区间[-rotate_range, rotate_range]内,对图像进行随机旋转,当存在标注图像时,同步进行, 并对旋转后的图像和标注图像进行相应的padding。

参数

  • rotate_range (float): 最大旋转角度。默认为15度。
  • im_padding_value (list): 图像padding的值。默认为[127.5, 127.5, 127.5]。长度应与图像通道数量相同。
  • label_padding_value (int): 标注图像padding的值。默认为255。

RandomScaleAspect

paddlex.seg.transforms.RandomScaleAspect(min_scale=0.5, aspect_ratio=0.33)

裁剪并resize回原始尺寸的图像和标注图像,模型训练时的数据增强操作。

按照一定的面积比和宽高比对图像进行裁剪,并reszie回原始图像的图像,当存在标注图时,同步进行。

参数

  • min_scale (float):裁取图像占原始图像的面积比,取值[0,1],为0时则返回原图。默认为0.5。
  • aspect_ratio (float): 裁取图像的宽高比范围,非负值,为0时返回原图。默认为0.33。

RandomDistort

paddlex.seg.transforms.RandomDistort(brightness_range=0.5, brightness_prob=0.5, contrast_range=0.5, contrast_prob=0.5, saturation_range=0.5, saturation_prob=0.5, hue_range=18, hue_prob=0.5)

以一定的概率对图像进行随机像素内容变换,模型训练时的数据增强操作。

【注意】如果输入是uint8/uint16的RGB图像,该数据增强必须在数据增强Normalize之前使用。如果输入是由多张RGB图像数据沿通道方向做拼接而成的图像数据,则会把每3个通道数据视为一张RGB图像数据,依次对每3个通道数据做随机像素内容变化。

  1. 对变换的操作顺序进行随机化操作。
  2. 按照1中的顺序以一定的概率对图像进行随机像素内容变换。

参数

  • brightness_range (float): 明亮度的缩放系数范围。从[1-brightness_range, 1+brightness_range]中随机取值作为明亮度缩放因子scale,按照公式image = image * scale调整图像明亮度。默认值为0.5。
  • brightness_prob (float): 随机调整明亮度的概率。默认为0.5。
  • contrast_range (float): 对比度的缩放系数范围。从[1-contrast_range, 1+contrast_range]中随机取值作为对比度缩放因子scale,按照公式image = image * scale + (image_mean + 0.5) * (1 - scale)调整图像对比度。默认为0.5。
  • contrast_prob (float): 随机调整对比度的概率。默认为0.5。
  • saturation_range (float): 饱和度的缩放系数范围。从[1-saturation_range, 1+saturation_range]中随机取值作为饱和度缩放因子scale,按照公式image = gray * (1 - scale) + image * scale,其中gray = R * 299/1000 + G * 587/1000+ B * 114/1000。默认为0.5。
  • saturation_prob (float): 随机调整饱和度的概率。默认为0.5。
  • hue_range (int): 调整色相角度的差值取值范围。从[-hue_range, hue_range]中随机取值作为色相角度调整差值delta,按照公式hue = hue + delta调整色相角度 。默认为18,取值范围[0, 360]。
  • hue_prob (float): 随机调整色调的概率。默认为0.5。

Clip

paddlex.seg.transforms.Clip(min_val=[0, 0, 0], max_val=[255.0, 255.0, 255.0])

对图像上超出一定范围的数据进行截断。

参数

  • min_val (list): 裁剪的下限,小于min_val的数值均设为min_val. 默认值0。
  • max_val (list): 裁剪的上限,大于max_val的数值均设为max_val. 默认值255.0。