augmentation

`sleap_nn.data.augmentation` ¶

This module implements data pipeline blocks for augmentation operations.

Classes:

Name	Description
`RandomUniformNoise`	Data transformer for applying random uniform noise to input images.

Functions:

Name	Description
`apply_geometric_augmentation`	Apply kornia geometric augmentation on image and instances.
`apply_intensity_augmentation`	Apply kornia intensity augmentation on image and instances.

`RandomUniformNoise` ¶

Bases: IntensityAugmentationBase2D

Data transformer for applying random uniform noise to input images.

This is a custom Kornia augmentation inheriting from IntensityAugmentationBase2D. Uniform noise within (min_val, max_val) is applied to the entire input image.

Note: Inverse transform is not implemented and re-applying the same transformation in the example below does not work when included in an AugmentationSequential class.

Parameters:

Name	Type	Description	Default
`noise`	`Tuple[float, float]`	2-tuple (min_val, max_val); 0.0 <= min_val <= max_val <= 1.0.	required
`p`	`float`	probability for applying an augmentation. This param controls the augmentation probabilities element-wise for a batch.	`0.5`
`p_batch`	`float`	probability for applying an augmentation to a batch. This param controls the augmentation probabilities batch-wise.	`1.0`
`same_on_batch`	`bool`	apply the same transformation across the batch.	`False`
`keepdim`	`bool`	whether to keep the output shape the same as input `True` or broadcast it to the batch form `False`.	`False`

Examples:

>>> rng = torch.manual_seed(0)
>>> img = torch.rand(1, 1, 2, 2)
>>> RandomUniformNoise(min_val=0., max_val=0.1, p=1.)(img)
tensor([[[[0.9607, 0.5865],
          [0.2705, 0.5920]]]])

To apply the exact augmentation again, you may take the advantage of the previous parameter state: >>> input = torch.rand(1, 3, 32, 32) >>> aug = RandomUniformNoise(min_val=0., max_val=0.1, p=1.) >>> (aug(input) == aug(input, params=aug._params)).all() tensor(True)

Ref: kornia.augmentation._2d.intensity.gaussian_noise <https://kornia.readthedocs.io/en/latest/_modules/kornia/augmentation/_2d/intensity/gaussian_noise.html#RandomGaussianNoise>_.

Methods:

Name	Description
`__init__`	Initialize the class.
`apply_transform`	Compute the uniform noise, add, and clamp output.

Source code in sleap_nn/data/augmentation.py

class RandomUniformNoise(IntensityAugmentationBase2D):
    """Data transformer for applying random uniform noise to input images.

    This is a custom Kornia augmentation inheriting from `IntensityAugmentationBase2D`.
    Uniform noise within (min_val, max_val) is applied to the entire input image.

    Note: Inverse transform is not implemented and re-applying the same transformation
    in the example below does not work when included in an AugmentationSequential class.

    Args:
        noise: 2-tuple (min_val, max_val); 0.0 <= min_val <= max_val <= 1.0.
        p: probability for applying an augmentation. This param controls the augmentation probabilities
          element-wise for a batch.
        p_batch: probability for applying an augmentation to a batch. This param controls the augmentation
          probabilities batch-wise.
        same_on_batch: apply the same transformation across the batch.
        keepdim: whether to keep the output shape the same as input `True` or broadcast it
          to the batch form `False`.

    Examples:
        >>> rng = torch.manual_seed(0)
        >>> img = torch.rand(1, 1, 2, 2)
        >>> RandomUniformNoise(min_val=0., max_val=0.1, p=1.)(img)
        tensor([[[[0.9607, 0.5865],
                  [0.2705, 0.5920]]]])

    To apply the exact augmentation again, you may take the advantage of the previous parameter state:
        >>> input = torch.rand(1, 3, 32, 32)
        >>> aug = RandomUniformNoise(min_val=0., max_val=0.1, p=1.)
        >>> (aug(input) == aug(input, params=aug._params)).all()
        tensor(True)

    Ref: `kornia.augmentation._2d.intensity.gaussian_noise
    <https://kornia.readthedocs.io/en/latest/_modules/kornia/augmentation/_2d/intensity/gaussian_noise.html#RandomGaussianNoise>`_.
    """

    def __init__(
        self,
        noise: Tuple[float, float],
        p: float = 0.5,
        p_batch: float = 1.0,
        clip_output: bool = True,
        same_on_batch: bool = False,
        keepdim: bool = False,
    ) -> None:
        """Initialize the class."""
        super().__init__(
            p=p, p_batch=p_batch, same_on_batch=same_on_batch, keepdim=keepdim
        )
        self.flags = {
            "uniform_noise": _range_bound(noise, "uniform_noise", bounds=(0.0, 1.0))
        }
        self.clip_output = clip_output

    def apply_transform(
        self,
        input: Tensor,
        params: Dict[str, Tensor],
        flags: Dict[str, Any],
        transform: Optional[Tensor] = None,
    ) -> Tensor:
        """Compute the uniform noise, add, and clamp output."""
        if "uniform_noise" in params:
            uniform_noise = params["uniform_noise"]
        else:
            uniform_noise = (
                torch.FloatTensor(input.shape)
                .uniform_(flags["uniform_noise"][0], flags["uniform_noise"][1])
                .to(input.device)
            )
            self._params["uniform_noise"] = uniform_noise
        if self.clip_output:
            return torch.clamp(
                input + uniform_noise, 0.0, 1.0
            )  # RandomGaussianNoise doesn't clamp.
        return input + uniform_noise

`init(noise, p=0.5, p_batch=1.0, clip_output=True, same_on_batch=False, keepdim=False)` ¶

Initialize the class.

Source code in sleap_nn/data/augmentation.py

def __init__(
    self,
    noise: Tuple[float, float],
    p: float = 0.5,
    p_batch: float = 1.0,
    clip_output: bool = True,
    same_on_batch: bool = False,
    keepdim: bool = False,
) -> None:
    """Initialize the class."""
    super().__init__(
        p=p, p_batch=p_batch, same_on_batch=same_on_batch, keepdim=keepdim
    )
    self.flags = {
        "uniform_noise": _range_bound(noise, "uniform_noise", bounds=(0.0, 1.0))
    }
    self.clip_output = clip_output

`apply_transform(input, params, flags, transform=None)` ¶

Compute the uniform noise, add, and clamp output.

Source code in sleap_nn/data/augmentation.py

def apply_transform(
    self,
    input: Tensor,
    params: Dict[str, Tensor],
    flags: Dict[str, Any],
    transform: Optional[Tensor] = None,
) -> Tensor:
    """Compute the uniform noise, add, and clamp output."""
    if "uniform_noise" in params:
        uniform_noise = params["uniform_noise"]
    else:
        uniform_noise = (
            torch.FloatTensor(input.shape)
            .uniform_(flags["uniform_noise"][0], flags["uniform_noise"][1])
            .to(input.device)
        )
        self._params["uniform_noise"] = uniform_noise
    if self.clip_output:
        return torch.clamp(
            input + uniform_noise, 0.0, 1.0
        )  # RandomGaussianNoise doesn't clamp.
    return input + uniform_noise

`apply_geometric_augmentation(image, instances, rotation_min=-15.0, rotation_max=15.0, scale_min=0.9, scale_max=1.1, translate_width=0.02, translate_height=0.02, affine_p=0.0, erase_scale_min=0.0001, erase_scale_max=0.01, erase_ratio_min=1, erase_ratio_max=1, erase_p=0.0, mixup_lambda_min=0.01, mixup_lambda_max=0.05, mixup_p=0.0)` ¶

Apply kornia geometric augmentation on image and instances.

Parameters:

Name	Type	Description	Default
`image`	`Tensor`	Input image. Shape: (n_samples, C, H, W)	required
`instances`	`Tensor`	Input keypoints. (n_samples, n_instances, n_nodes, 2) or (n_samples, n_nodes, 2)	required
`rotation_min`	`Optional[float]`	Minimum rotation angle in degrees. Default: -15.0.	`-15.0`
`rotation_max`	`Optional[float]`	Maximum rotation angle in degrees. Default: 15.0.	`15.0`
`scale_min`	`Optional[float]`	Minimum scaling factor for isotropic scaling. Default: 0.9.	`0.9`
`scale_max`	`Optional[float]`	Maximum scaling factor for isotropic scaling. Default: 1.1.	`1.1`
`translate_width`	`Optional[float]`	Maximum absolute fraction for horizontal translation. Default: 0.02.	`0.02`
`translate_height`	`Optional[float]`	Maximum absolute fraction for vertical translation. Default: 0.02.	`0.02`
`affine_p`	`float`	Probability of applying random affine transformations. Default: 0.0.	`0.0`
`erase_scale_min`	`Optional[float]`	Minimum value of range of proportion of erased area against input image. Default: 0.0001.	`0.0001`
`erase_scale_max`	`Optional[float]`	Maximum value of range of proportion of erased area against input image. Default: 0.01.	`0.01`
`erase_ratio_min`	`Optional[float]`	Minimum value of range of aspect ratio of erased area. Default: 1.	`1`
`erase_ratio_max`	`Optional[float]`	Maximum value of range of aspect ratio of erased area. Default: 1.	`1`
`erase_p`	`float`	Probability of applying random erase. Default: 0.0.	`0.0`
`mixup_lambda_min`	`Optional[float]`	Minimum mixup strength value. Default: 0.01.	`0.01`
`mixup_lambda_max`	`Optional[float]`	Maximum mixup strength value. Default: 0.05.	`0.05`
`mixup_p`	`float`	Probability of applying random mixup v2. Default: 0.0.	`0.0`

Returns:

Type	Description
`Tuple[Tensor]`	Returns tuple: (image, instances) with augmentation applied.

Source code in sleap_nn/data/augmentation.py

def apply_geometric_augmentation(
    image: torch.Tensor,
    instances: torch.Tensor,
    rotation_min: Optional[float] = -15.0,
    rotation_max: Optional[float] = 15.0,
    scale_min: Optional[float] = 0.9,
    scale_max: Optional[float] = 1.1,
    translate_width: Optional[float] = 0.02,
    translate_height: Optional[float] = 0.02,
    affine_p: float = 0.0,
    erase_scale_min: Optional[float] = 0.0001,
    erase_scale_max: Optional[float] = 0.01,
    erase_ratio_min: Optional[float] = 1,
    erase_ratio_max: Optional[float] = 1,
    erase_p: float = 0.0,
    mixup_lambda_min: Optional[float] = 0.01,
    mixup_lambda_max: Optional[float] = 0.05,
    mixup_p: float = 0.0,
) -> Tuple[torch.Tensor]:
    """Apply kornia geometric augmentation on image and instances.

    Args:
        image: Input image. Shape: (n_samples, C, H, W)
        instances: Input keypoints. (n_samples, n_instances, n_nodes, 2) or (n_samples, n_nodes, 2)
        rotation_min: Minimum rotation angle in degrees. Default: -15.0.
        rotation_max: Maximum rotation angle in degrees. Default: 15.0.
        scale_min: Minimum scaling factor for isotropic scaling. Default: 0.9.
        scale_max: Maximum scaling factor for isotropic scaling. Default: 1.1.
        translate_width: Maximum absolute fraction for horizontal translation. Default: 0.02.
        translate_height: Maximum absolute fraction for vertical translation. Default: 0.02.
        affine_p: Probability of applying random affine transformations. Default: 0.0.
        erase_scale_min: Minimum value of range of proportion of erased area against input image. Default: 0.0001.
        erase_scale_max: Maximum value of range of proportion of erased area against input image. Default: 0.01.
        erase_ratio_min: Minimum value of range of aspect ratio of erased area. Default: 1.
        erase_ratio_max: Maximum value of range of aspect ratio of erased area. Default: 1.
        erase_p: Probability of applying random erase. Default: 0.0.
        mixup_lambda_min: Minimum mixup strength value. Default: 0.01.
        mixup_lambda_max: Maximum mixup strength value. Default: 0.05.
        mixup_p: Probability of applying random mixup v2. Default: 0.0.

    Returns:
        Returns tuple: (image, instances) with augmentation applied.
    """
    aug_stack = []
    if affine_p > 0:
        aug_stack.append(
            K.augmentation.RandomAffine(
                degrees=(rotation_min, rotation_max),
                translate=(translate_width, translate_height),
                scale=(scale_min, scale_max),
                p=affine_p,
                keepdim=True,
                same_on_batch=True,
            )
        )

    if erase_p > 0:
        aug_stack.append(
            K.augmentation.RandomErasing(
                scale=(erase_scale_min, erase_scale_max),
                ratio=(erase_ratio_min, erase_ratio_max),
                p=erase_p,
                keepdim=True,
                same_on_batch=True,
            )
        )
    if mixup_p > 0:
        aug_stack.append(
            K.augmentation.RandomMixUpV2(
                lambda_val=(mixup_lambda_min, mixup_lambda_max),
                p=mixup_p,
                keepdim=True,
                same_on_batch=True,
            )
        )

    augmenter = AugmentationSequential(
        *aug_stack,
        data_keys=["input", "keypoints"],
        keepdim=True,
        same_on_batch=True,
    )

    inst_shape = instances.shape
    # Before (full image): (n_samples, C, H, W), (n_samples, n_instances, n_nodes, 2)
    # or
    # Before (cropped image): (B=1, C, crop_H, crop_W), (n_samples, n_nodes, 2)
    instances = instances.reshape(inst_shape[0], -1, 2)
    # (n_samples, C, H, W), (n_samples, n_instances * n_nodes, 2) OR (n_samples, n_nodes, 2)

    aug_image, aug_instances = augmenter(image, instances)

    # After (full image): (n_samples, C, H, W), (n_samples, n_instances, n_nodes, 2)
    # or
    # After (cropped image): (n_samples, C, crop_H, crop_W), (n_samples, n_nodes, 2)
    return aug_image, aug_instances.reshape(*inst_shape)

`apply_intensity_augmentation(image, instances, uniform_noise_min=0.0, uniform_noise_max=0.04, uniform_noise_p=0.0, gaussian_noise_mean=0.02, gaussian_noise_std=0.004, gaussian_noise_p=0.0, contrast_min=0.5, contrast_max=2.0, contrast_p=0.0, brightness_min=1.0, brightness_max=1.0, brightness_p=0.0)` ¶

Apply kornia intensity augmentation on image and instances.

Parameters:

Name	Type	Description	Default
`image`	`Tensor`	Input image. Shape: (n_samples, C, H, W)	required
`instances`	`Tensor`	Input keypoints. (n_samples, n_instances, n_nodes, 2) or (n_samples, n_nodes, 2)	required
`uniform_noise_min`	`Optional[float]`	Minimum value for uniform noise (uniform_noise_min >=0).	`0.0`
`uniform_noise_max`	`Optional[float]`	Maximum value for uniform noise (uniform_noise_max <=1).	`0.04`
`uniform_noise_p`	`float`	Probability of applying random uniform noise.	`0.0`
`gaussian_noise_mean`	`Optional[float]`	The mean of the gaussian distribution.	`0.02`
`gaussian_noise_std`	`Optional[float]`	The standard deviation of the gaussian distribution.	`0.004`
`gaussian_noise_p`	`float`	Probability of applying random gaussian noise.	`0.0`
`contrast_min`	`Optional[float]`	Minimum contrast factor to apply. Default: 0.5.	`0.5`
`contrast_max`	`Optional[float]`	Maximum contrast factor to apply. Default: 2.0.	`2.0`
`contrast_p`	`float`	Probability of applying random contrast.	`0.0`
`brightness_min`	`Optional[float]`	Minimum brightness factor to apply. Default: 1.0.	`1.0`
`brightness_max`	`Optional[float]`	Maximum brightness factor to apply. Default: 1.0.	`1.0`
`brightness_p`	`float`	Probability of applying random brightness.	`0.0`

Returns:

Type	Description
`Tuple[Tensor]`	Returns tuple: (image, instances) with augmentation applied.

Source code in sleap_nn/data/augmentation.py

def apply_intensity_augmentation(
    image: torch.Tensor,
    instances: torch.Tensor,
    uniform_noise_min: Optional[float] = 0.0,
    uniform_noise_max: Optional[float] = 0.04,
    uniform_noise_p: float = 0.0,
    gaussian_noise_mean: Optional[float] = 0.02,
    gaussian_noise_std: Optional[float] = 0.004,
    gaussian_noise_p: float = 0.0,
    contrast_min: Optional[float] = 0.5,
    contrast_max: Optional[float] = 2.0,
    contrast_p: float = 0.0,
    brightness_min: Optional[float] = 1.0,
    brightness_max: Optional[float] = 1.0,
    brightness_p: float = 0.0,
) -> Tuple[torch.Tensor]:
    """Apply kornia intensity augmentation on image and instances.

    Args:
        image: Input image. Shape: (n_samples, C, H, W)
        instances: Input keypoints. (n_samples, n_instances, n_nodes, 2) or (n_samples, n_nodes, 2)
        uniform_noise_min: Minimum value for uniform noise (uniform_noise_min >=0).
        uniform_noise_max: Maximum value for uniform noise (uniform_noise_max <=1).
        uniform_noise_p: Probability of applying random uniform noise.
        gaussian_noise_mean: The mean of the gaussian distribution.
        gaussian_noise_std: The standard deviation of the gaussian distribution.
        gaussian_noise_p: Probability of applying random gaussian noise.
        contrast_min: Minimum contrast factor to apply. Default: 0.5.
        contrast_max: Maximum contrast factor to apply. Default: 2.0.
        contrast_p: Probability of applying random contrast.
        brightness_min: Minimum brightness factor to apply. Default: 1.0.
        brightness_max: Maximum brightness factor to apply. Default: 1.0.
        brightness_p: Probability of applying random brightness.

    Returns:
        Returns tuple: (image, instances) with augmentation applied.
    """
    aug_stack = []
    if uniform_noise_p > 0:
        aug_stack.append(
            RandomUniformNoise(
                noise=(uniform_noise_min, uniform_noise_max),
                p=uniform_noise_p,
                keepdim=True,
                same_on_batch=True,
            )
        )
    if gaussian_noise_p > 0:
        aug_stack.append(
            K.augmentation.RandomGaussianNoise(
                mean=gaussian_noise_mean,
                std=gaussian_noise_std,
                p=gaussian_noise_p,
                keepdim=True,
                same_on_batch=True,
            )
        )
    if contrast_p > 0:
        aug_stack.append(
            K.augmentation.RandomContrast(
                contrast=(contrast_min, contrast_max),
                p=contrast_p,
                keepdim=True,
                same_on_batch=True,
            )
        )
    if brightness_p > 0:
        aug_stack.append(
            K.augmentation.RandomBrightness(
                brightness=(brightness_min, brightness_max),
                p=brightness_p,
                keepdim=True,
                same_on_batch=True,
            )
        )

    augmenter = AugmentationSequential(
        *aug_stack,
        data_keys=["input", "keypoints"],
        keepdim=True,
        same_on_batch=True,
    )

    inst_shape = instances.shape
    # Before (full image): (n_samples, C, H, W), (n_samples, n_instances, n_nodes, 2)
    # or
    # Before (cropped image): (B=1, C, crop_H, crop_W), (n_samples, n_nodes, 2)
    instances = instances.reshape(inst_shape[0], -1, 2)
    # (n_samples, C, H, W), (n_samples, n_instances * n_nodes, 2) OR (n_samples, n_nodes, 2)

    aug_image, aug_instances = augmenter(image, instances)

    # After (full image): (n_samples, C, H, W), (n_samples, n_instances, n_nodes, 2)
    # or
    # After (cropped image): (n_samples, C, crop_H, crop_W), (n_samples, n_nodes, 2)
    return aug_image, aug_instances.reshape(*inst_shape)

augmentation

sleap_nn.data.augmentation ¶

RandomUniformNoise ¶

__init__(noise, p=0.5, p_batch=1.0, clip_output=True, same_on_batch=False, keepdim=False) ¶

apply_transform(input, params, flags, transform=None) ¶

`sleap_nn.data.augmentation` ¶

`RandomUniformNoise` ¶

`init(noise, p=0.5, p_batch=1.0, clip_output=True, same_on_batch=False, keepdim=False)` ¶

`apply_transform(input, params, flags, transform=None)` ¶