paddlex.cls.transforms

对图像分类任务的数据进行操作。可以利用Compose类将图像预处理/增强操作进行组合。

Compose

paddlex.cls.transforms.Compose(transforms)

根据数据预处理/增强算子对输入数据进行操作。 使用示例

参数

  • transforms (list): 数据预处理/数据增强列表。

Normalize

paddlex.cls.transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225], min_val=[0, 0, 0], max_val=[255.0, 255.0, 255.0])

对图像进行标准化。

1.像素值减去min_val 2.像素值除以(max_val-min_val), 归一化到区间 [0.0, 1.0]。 3.对图像进行减均值除以标准差操作。

参数

  • mean (list): 图像数据集的均值。默认为[0.485, 0.456, 0.406]。长度应与图像通道数量相同。
  • std (list): 图像数据集的标准差。默认为[0.229, 0.224, 0.225]。长度应与图像通道数量相同。
  • min_val (list): 图像数据集的最小值。默认值[0, 0, 0]。长度应与图像通道数量相同。
  • max_val (list): 图像数据集的最大值。默认值[255.0, 255.0, 255.0]。长度应与图像通道数量相同。

ResizeByShort

paddlex.cls.transforms.ResizeByShort(short_size=256, max_size=-1)

根据图像的短边调整图像大小(resize)。

  1. 获取图像的长边和短边长度。
  2. 根据短边与short_size的比例,计算长边的目标长度,此时高、宽的resize比例为short_size/原图短边长度。
  3. 如果max_size>0,调整resize比例: 如果长边的目标长度>max_size,则高、宽的resize比例为max_size/原图长边长度。
  4. 根据调整大小的比例对图像进行resize。

参数

  • short_size (int): 调整大小后的图像目标短边长度。默认为256。
  • max_size (int): 长边目标长度的最大限制。默认为-1。

CenterCrop

paddlex.cls.transforms.CenterCrop(crop_size=224)

以图像中心点扩散裁剪长宽为crop_size的正方形

  1. 计算剪裁的起始点。
  2. 剪裁图像。

参数

  • crop_size (int): 裁剪的目标边长。默认为224。

RandomCrop

paddlex.cls.transforms.RandomCrop(crop_size=224, lower_scale=0.08, lower_ratio=3. / 4, upper_ratio=4. / 3)

对图像进行随机剪裁,模型训练时的数据增强操作。

  1. 根据lower_scale、lower_ratio、upper_ratio计算随机剪裁的高、宽。
  2. 根据随机剪裁的高、宽随机选取剪裁的起始点。
  3. 剪裁图像。
  4. 调整剪裁后的图像的大小到crop_size*crop_size。

参数

  • crop_size (int): 随机裁剪后重新调整的目标边长。默认为224。
  • lower_scale (float): 裁剪面积相对原面积比例的最小限制。默认为0.08。
  • lower_ratio (float): 宽变换比例的最小限制。默认为3. / 4。
  • upper_ratio (float): 宽变换比例的最大限制。默认为4. / 3。

RandomHorizontalFlip

paddlex.cls.transforms.RandomHorizontalFlip(prob=0.5)

以一定的概率对图像进行随机水平翻转,模型训练时的数据增强操作。

参数

  • prob (float): 随机水平翻转的概率。默认为0.5。

RandomVerticalFlip

paddlex.cls.transforms.RandomVerticalFlip(prob=0.5)

以一定的概率对图像进行随机垂直翻转,模型训练时的数据增强操作。

参数

  • prob (float): 随机垂直翻转的概率。默认为0.5。

RandomRotate

paddlex.cls.transforms.RandomRotate(rotate_range=30, prob=0.5)

以一定的概率对图像在[-rotate_range, rotaterange]角度范围内进行旋转,模型训练时的数据增强操作。

参数

  • rotate_range (int): 旋转度数的范围。默认为30。
  • prob (float): 随机旋转的概率。默认为0.5。

RandomDistort

paddlex.cls.transforms.RandomDistort(brightness_range=0.9, brightness_prob=0.5, contrast_range=0.9, contrast_prob=0.5, saturation_range=0.9, saturation_prob=0.5, hue_range=18, hue_prob=0.5)

以一定的概率对图像进行随机像素内容变换,模型训练时的数据增强操作。

  1. 对变换的操作顺序进行随机化操作。
  2. 按照1中的顺序以一定的概率对图像进行随机像素内容变换。

【注意】如果输入是uint8/uint16的RGB图像,该数据增强必须在数据增强Normalize之前使用。

参数

  • brightness_range (float): 明亮度的缩放系数范围。从[1-brightness_range, 1+brightness_range]中随机取值作为明亮度缩放因子scale,按照公式image = image * scale调整图像明亮度。默认值为0.9。
  • brightness_prob (float): 随机调整明亮度的概率。默认为0.5。
  • contrast_range (float): 对比度的缩放系数范围。从[1-contrast_range, 1+contrast_range]中随机取值作为对比度缩放因子scale,按照公式image = image * scale + (image_mean + 0.5) * (1 - scale)调整图像对比度。默认为0.9。
  • contrast_prob (float): 随机调整对比度的概率。默认为0.5。
  • saturation_range (float): 饱和度的缩放系数范围。从[1-saturation_range, 1+saturation_range]中随机取值作为饱和度缩放因子scale,按照公式image = gray * (1 - scale) + image * scale,其中gray = R * 299/1000 + G * 587/1000+ B * 114/1000。默认为0.9。
  • saturation_prob (float): 随机调整饱和度的概率。默认为0.5。
  • hue_range (int): 调整色相角度的差值取值范围。从[-hue_range, hue_range]中随机取值作为色相角度调整差值delta,按照公式hue = hue + delta调整色相角度 。默认为18,取值范围[0, 360]。
  • hue_prob (float): 随机调整色调的概率。默认为0.5。