pydata · max-sixty · Aug 21, 2024 · May 23, 2024 · Aug 13, 2024 · Aug 13, 2024
diff --git a/xarray/core/dataset.py b/xarray/core/dataset.py
@@ -163,6 +163,7 @@
         ReindexMethodOptions,
         SideOptions,
         T_ChunkDimFreq,
+        T_DatasetPadConstantValues,
         T_Xarray,
     )
     from xarray.core.weighted import DatasetWeighted
@@ -9147,9 +9148,7 @@ def pad(
         stat_length: (
             int | tuple[int, int] | Mapping[Any, tuple[int, int]] | None
         ) = None,
-        constant_values: (
-            float | tuple[float, float] | Mapping[Any, tuple[float, float]] | None
-        ) = None,
+        constant_values: T_DatasetPadConstantValues | None = None,
         end_values: int | tuple[int, int] | Mapping[Any, tuple[int, int]] | None = None,
         reflect_type: PadReflectOptions = None,
         keep_attrs: bool | None = None,
@@ -9205,9 +9204,11 @@ def pad(
             (stat_length,) or int is a shortcut for before = after = statistic
             length for all axes.
             Default is ``None``, to use the entire axis.
-        constant_values : scalar, tuple or mapping of hashable to tuple, default: 0
-            Used in 'constant'.  The values to set the padded values for each
-            axis.
+        constant_values : scalar, tuple, mapping of dim name to scalar or tuple, or \
+            mapping of var name to scalar, tuple or to mapping of dim name to scalar or tuple, default: 0
+            Used in 'constant'. The values to set the padded values for each data variable / axis.
+            ``{var_1: {dim_1: (before_1, after_1), ... dim_N: (before_N, after_N)}, ...
+            var_M: (before, after)}`` unique pad constants per data variable.
             ``{dim_1: (before_1, after_1), ... dim_N: (before_N, after_N)}`` unique
             pad constants along each dimension.
             ``((before, after),)`` yields same before and after constants for each
@@ -9293,6 +9294,12 @@ def pad(
             if not pad_dims.intersection(xindexes.get_all_dims(k)):
                 indexes[k] = idx
 
+        per_data_var_constant_values = {}
+        if isinstance(constant_values, dict):
+            for k in self.data_vars:
+                if v := constant_values.pop(k, None):
+                    per_data_var_constant_values[k] = v
+
         for name, var in self.variables.items():
             var_pad_width = {k: v for k, v in pad_width.items() if k in var.dims}
             if not var_pad_width:
@@ -9302,7 +9309,9 @@ def pad(
                     pad_width=var_pad_width,
                     mode=mode,
                     stat_length=stat_length,
-                    constant_values=constant_values,
+                    constant_values=per_data_var_constant_values.get(
+                        name, constant_values
+                    ),
                     end_values=end_values,
                     reflect_type=reflect_type,
                     keep_attrs=keep_attrs,

diff --git a/xarray/core/types.py b/xarray/core/types.py
@@ -243,6 +243,11 @@ def copy(
     "symmetric",
     "wrap",
 ]
+T_PadConstantValues = float | tuple[float, float]
+T_VarPadConstantValues = T_PadConstantValues | Mapping[Any, T_PadConstantValues]
+T_DatasetPadConstantValues = (
+    T_VarPadConstantValues | Mapping[Any, T_VarPadConstantValues]
+)
 PadReflectOptions = Literal["even", "odd", None]
 
 CFCalendar = Literal[

diff --git a/xarray/core/variable.py b/xarray/core/variable.py
@@ -65,6 +65,7 @@
         Self,
         T_Chunks,
         T_DuckArray,
+        T_VarPadConstantValues,
     )
     from xarray.namedarray.parallelcompat import ChunkManagerEntrypoint
 
@@ -1121,9 +1122,14 @@ def shift(self, shifts=None, fill_value=dtypes.NA, **shifts_kwargs):
 
     def _pad_options_dim_to_index(
         self,
-        pad_option: Mapping[Any, int | tuple[int, int]],
+        pad_option: Mapping[Any, int | float | tuple[int, int] | tuple[float, float]],
         fill_with_shape=False,
     ):
+        # change number values to a tuple of two of those values
+        for k, v in pad_option.items():
+            if isinstance(v, numbers.Number):
+                pad_option[k] = (v, v)
+
         if fill_with_shape:
             return [
                 (n, n) if d not in pad_option else pad_option[d]
@@ -1138,9 +1144,7 @@ def pad(
         stat_length: (
             int | tuple[int, int] | Mapping[Any, tuple[int, int]] | None
         ) = None,
-        constant_values: (
-            float | tuple[float, float] | Mapping[Any, tuple[float, float]] | None
-        ) = None,
+        constant_values: T_VarPadConstantValues | None = None,
         end_values: int | tuple[int, int] | Mapping[Any, tuple[int, int]] | None = None,
         reflect_type: PadReflectOptions = None,
         keep_attrs: bool | None = None,
@@ -1160,7 +1164,7 @@ def pad(
         stat_length : int, tuple or mapping of hashable to tuple
             Used in 'maximum', 'mean', 'median', and 'minimum'.  Number of
             values at edge of each axis used to calculate the statistic value.
-        constant_values : scalar, tuple or mapping of hashable to tuple
+        constant_values : scalar, tuple or mapping of hashable to scalar or tuple
             Used in 'constant'.  The values to set the padded values for each
             axis.
         end_values : scalar, tuple or mapping of hashable to tuple
@@ -1207,10 +1211,6 @@ def pad(
         if stat_length is None and mode in ["maximum", "mean", "median", "minimum"]:
             stat_length = [(n, n) for n in self.data.shape]  # type: ignore[assignment]
 
-        # change integer values to a tuple of two of those values and change pad_width to index
-        for k, v in pad_width.items():
-            if isinstance(v, numbers.Number):
-                pad_width[k] = (v, v)
         pad_width_by_index = self._pad_options_dim_to_index(pad_width)
 
         # create pad_options_kwargs, numpy/dask requires only relevant kwargs to be nonempty

diff --git a/xarray/tests/test_dataset.py b/xarray/tests/test_dataset.py
@@ -6689,17 +6689,45 @@ def test_polyfit_warnings(self) -> None:
             ds.var1.polyfit("dim2", 10, full=True)
             assert len(ws) == 1
 
-    def test_pad(self) -> None:
+    @pytest.mark.parametrize(
+        ["constant_values", "expected"],
+        [
+            pytest.param(None, {"var1": np.nan}, id="default"),
+            pytest.param(42, {"var1": 42, "var2": 42}, id="scalar"),
+            pytest.param((42, 43), {"var1": (42, 43), "var2": (42, 43)}, id="tuple"),
+            pytest.param({"dim2": 42}, {"var1": 42, "var2": 42}, id="per dim scalar"),
+            pytest.param(
+                {"dim2": (42, 43)},
+                {"var1": (42, 43), "var2": (42, 43)},
+                id="per dim tuple",
+            ),
+            pytest.param(
+                {"var1": 42, "var2": (42, 43)},
+                {"var1": 42, "var2": (42, 43)},
+                id="per var",
+            ),
+            pytest.param(
+                {"var1": 42, "dim2": (42, 43)},
+                {"var1": 42, "var2": (42, 43)},
+                id="mixed",
+            ),
+        ],
+    )
+    def test_pad(self, constant_values, expected) -> None:
         ds = create_test_data(seed=1)
-        padded = ds.pad(dim2=(1, 1), constant_values=42)
+        padded = ds.pad(dim2=(1, 1), constant_values=constant_values)
 
         assert padded["dim2"].shape == (11,)
         assert padded["var1"].shape == (8, 11)
         assert padded["var2"].shape == (8, 11)
         assert padded["var3"].shape == (10, 8)
         assert dict(padded.sizes) == {"dim1": 8, "dim2": 11, "dim3": 10, "time": 20}
 
-        np.testing.assert_equal(padded["var1"].isel(dim2=[0, -1]).data, 42)
+        for var, expected_value in expected.items():
+            np.testing.assert_equal(
+                np.unique(padded[var].isel(dim2=[0, -1]).data), expected_value
+            )
+        # np.testing.assert_equal(padded["var1"].isel(dim2=[0, -1]).data, 42)
         np.testing.assert_equal(padded["dim2"][[0, -1]].data, np.nan)
 
     @pytest.mark.parametrize(