Implicit Reparameterization Trick

A PyTorch library for implicit reparameterization gradients


Authors	Matvei Kreinin, Maria Nikitina, Petr Babkin, Iryna Zabarianska
Consultant	Oleg Bakhteev, PhD
Paper	Figurnov et al., Implicit Reparameterization Gradients, NeurIPS 2018

Overview

This library implements implicit reparameterization gradients for continuous distributions that lack tractable inverse CDFs. It provides drop-in replacements for torch.distributions classes with full support for reparameterized sampling (rsample), enabling gradient-based optimization through stochastic nodes.

The key idea from the paper: instead of inverting the CDF explicitly, compute reparameterization gradients via implicit differentiation:

$$\nabla_\phi z = -\frac{\nabla_\phi F(z \mid \phi)}{q_\phi(z)}$$

Implemented Distributions

Distribution	Parameters	Method
`Normal`	loc, scale	Implicit standardization
`Gamma`	concentration, rate	Implicit CDF + scaling
`Beta`	concentration1, concentration0	Via Gamma ratio
`Dirichlet`	concentration	Via Gamma normalization
`StudentT`	df, loc, scale	Via Gamma-Normal mixture
`VonMises`	loc, concentration	CDF series / normal approx.
`MixtureSameFamily`	mixture, components	Distributional transform
`ImplicitReparam`	any base distribution	Universal CDF wrapper (Eq. 8)

Installation

git clone https://github.com/intsystems/implicit-reparameterization-trick.git
cd implicit-reparameterization-trick
pip install src/

Quick Start

Reparameterized sampling from a Beta distribution:

import torch
from irt.distributions import Beta

alpha = torch.tensor([2.0], requires_grad=True)
beta = torch.tensor([5.0], requires_grad=True)
dist = Beta(alpha, beta)
z = dist.rsample(torch.Size([64]))  # gradients flow to alpha and beta

Wrapping any distribution with a tractable CDF via ImplicitReparam:

import torch
from irt.distributions import ImplicitReparam

loc = torch.tensor(0.0, requires_grad=True)
base = torch.distributions.Laplace(loc, 1.0)
dist = ImplicitReparam(base)
z = dist.rsample(torch.Size([64]))  # gradients flow to loc

Mixture of distributions:

import torch
from torch.distributions import Categorical
from irt.distributions import Normal, MixtureSameFamily

mix_weights = Categorical(torch.tensor([0.3, 0.7]))
components = Normal(
    torch.tensor([-1.0, 1.0], requires_grad=True),
    torch.tensor([0.5, 0.5]),
)
mixture = MixtureSameFamily(mix_weights, components)
z = mixture.rsample(torch.Size([64]))

Experiments

VAE trained on dynamically binarized MNIST following the setup in Table 4 of the paper. Architecture: FC encoder (784-256-128) and decoder (128-256-784), 30 epochs, Adam optimizer with KL annealing. Results are averaged over 3 random seeds. Full reproduction in code/vae_demo.ipynb.

Test Negative ELBO

Lower is better. Each cell shows mean and standard deviation over 3 runs.

2D Latent Spaces

Encodings of the MNIST test set in 2D latent space, colored by digit class. Each panel corresponds to a different posterior distribution family.

Generated Samples (D=2)

Samples drawn from the prior of each D=2 model and decoded into images.

References

M. Figurnov, S. Mohamed, A. Mnih. Implicit Reparameterization Gradients. NeurIPS 2018.
Documentation
Blog Post

Name		Name	Last commit message	Last commit date
Latest commit History 166 Commits
.github/workflows		.github/workflows
blogpost		blogpost
code		code
doc/source		doc/source
images		images
src		src
.flake8		.flake8
.gitignore		.gitignore
.isort.cfg		.isort.cfg
README.md		README.md
README.rst		README.rst
experiments.md		experiments.md
linkreview.md		linkreview.md
planning.md		planning.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Implicit Reparameterization Trick

Overview

Implemented Distributions

Installation

Quick Start

Experiments

Test Negative ELBO

2D Latent Spaces

Generated Samples (D=2)

References

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Implicit Reparameterization Trick

Overview

Implemented Distributions

Installation

Quick Start

Experiments

Test Negative ELBO

2D Latent Spaces

Generated Samples (D=2)

References

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages