diff --git a/conf/l7irishtile.yaml b/conf/l7irishtile.yaml
new file mode 100644
index 00000000000..d1ee668b123
--- /dev/null
+++ b/conf/l7irishtile.yaml
@@ -0,0 +1,37 @@
+module:
+  _target_: torchgeo.trainers.SemanticSegmentationTask
+  loss: "ce"
+  model: "unet"
+  backbone: "resnet18"
+  weights: true
+  learning_rate: 1e-4
+  learning_rate_schedule_patience: 6
+  in_channels: 8
+  num_classes: 5
+  num_filters: 64
+  ignore_index: 0
+  weight_decay: 0
+
+datamodule:
+  _target_: torchgeo.datamodules.L7IrishTileDataModule
+  root: "/home/calebrobinson/ssdprivate/torchgeo/data/L7IrishSimple/"
+  batch_size: 32
+  patch_size: 256
+  train_batches_per_epoch: 2000
+  val_batches_per_epoch: 200
+  num_workers: 6
+
+trainer:
+  _target_: lightning.pytorch.Trainer
+  accelerator: gpu
+  devices:
+    - 3
+  min_epochs: 50
+  max_epochs: 100
+
+program:
+  seed: 0
+  output_dir: output/l7irish/
+  log_dir: logs/l7irish/
+  overwrite: True
+  experiment_name: unet_imagenet_lr1e-4_wd0
\ No newline at end of file
diff --git a/conf/l8biometile.yaml b/conf/l8biometile.yaml
new file mode 100644
index 00000000000..1f3a9cbe110
--- /dev/null
+++ b/conf/l8biometile.yaml
@@ -0,0 +1,37 @@
+module:
+  _target_: torchgeo.trainers.SemanticSegmentationTask
+  loss: "ce"
+  model: "unet"
+  backbone: "resnet18"
+  weights: true
+  learning_rate: 1e-4
+  learning_rate_schedule_patience: 6
+  in_channels: 11
+  num_classes: 5
+  num_filters: 64
+  ignore_index: 0
+  weight_decay: 0
+
+datamodule:
+  _target_: torchgeo.datamodules.L8BiomeTileDataModule
+  root: "/home/calebrobinson/ssdprivate/data/L8BiomeSimple/"
+  batch_size: 32
+  patch_size: 256
+  train_batches_per_epoch: 2000
+  val_batches_per_epoch: 200
+  num_workers: 6
+
+trainer:
+  _target_: lightning.pytorch.Trainer
+  accelerator: gpu
+  devices:
+    - 3
+  min_epochs: 15
+  max_epochs: 100
+
+program:
+  seed: 0
+  output_dir: output/l8biome/
+  log_dir: logs/l8biome/
+  overwrite: True
+  experiment_name: unet_imagenet_lr1e-4_wd0
\ No newline at end of file
diff --git a/experiments/ssl4eo/run_l7irish.py b/experiments/ssl4eo/run_l7irish.py
new file mode 100644
index 00000000000..69931d1bd7a
--- /dev/null
+++ b/experiments/ssl4eo/run_l7irish.py
@@ -0,0 +1,81 @@
+#!/usr/bin/env python3
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+"""Runs the train script with a grid of hyperparameters."""
+import itertools
+import os
+import subprocess
+from multiprocessing import Process, Queue
+
+# list of GPU IDs that we want to use, one job will be started for every ID in the list
+GPUS = [0, 0, 1, 1, 2, 2, 3, 3]
+DRY_RUN = False  # if False then print out the commands to be run, if True then run
+
+# Hyperparameter options
+model_options = ["unet", "fcn"]
+backbone_options = ["resnet18"]
+lr_options = [0.001, 0.0003, 0.0001, 0.00003]
+loss_options = ["ce"]
+wd_options = [0, 0.1, 0.01]
+weight_options = [True, False]
+seed_options = [0, 1, 2]
+
+
+def do_work(work: "Queue[str]", gpu_idx: int) -> bool:
+    """Process for each ID in GPUS."""
+    while not work.empty():
+        experiment = work.get()
+        experiment = experiment.replace("GPU", str(gpu_idx))
+        print(experiment)
+        if not DRY_RUN:
+            subprocess.call(experiment.split(" "))
+    return True
+
+
+if __name__ == "__main__":
+    work: "Queue[str]" = Queue()
+
+    for model, backbone, lr, loss, wd, weights, seed in itertools.product(
+        model_options,
+        backbone_options,
+        lr_options,
+        loss_options,
+        wd_options,
+        weight_options,
+        seed_options,
+    ):
+        if model == "fcn" and not weights:
+            continue
+
+        if model != "unet":
+            experiment_name = f"{model}_{backbone}_{lr}_{loss}_{wd}_{weights}_{seed}"
+        else:
+            experiment_name = f"{model}_{lr}_{loss}_{wd}_{weights}_{seed}"
+
+        config_file = os.path.join("conf", "l7irishtile.yaml")
+
+        command = (
+            "python train.py"
+            + f" config_file={config_file}"
+            + f" module.model={model}"
+            + f" module.backbone={backbone}"
+            + f" module.learning_rate={lr}"
+            + f" module.loss={loss}"
+            + f" module.weight_decay={wd}"
+            + f" module.weights={weights}"
+            + f" program.seed={seed}"
+            + f" program.experiment_name={experiment_name}"
+            + " trainer.devices=[GPU]"
+        )
+        command = command.strip()
+
+        work.put(command)
+
+    processes = []
+    for gpu_idx in GPUS:
+        p = Process(target=do_work, args=(work, gpu_idx))
+        processes.append(p)
+        p.start()
+    for p in processes:
+        p.join()
diff --git a/experiments/ssl4eo/run_l8biome.py b/experiments/ssl4eo/run_l8biome.py
new file mode 100644
index 00000000000..5196f1b9789
--- /dev/null
+++ b/experiments/ssl4eo/run_l8biome.py
@@ -0,0 +1,81 @@
+#!/usr/bin/env python3
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+"""Runs the train script with a grid of hyperparameters."""
+import itertools
+import os
+import subprocess
+from multiprocessing import Process, Queue
+
+# list of GPU IDs that we want to use, one job will be started for every ID in the list
+GPUS = [0, 1, 2, 3]
+DRY_RUN = False  # if False then print out the commands to be run, if True then run
+
+# Hyperparameter options
+model_options = ["fcn"]
+backbone_options = ["resnet18"]
+lr_options = [0.0001]
+loss_options = ["ce"]
+wd_options = [0]
+weight_options = [True]
+seed_options = [1,2,3,4]
+
+
+def do_work(work: "Queue[str]", gpu_idx: int) -> bool:
+    """Process for each ID in GPUS."""
+    while not work.empty():
+        experiment = work.get()
+        experiment = experiment.replace("GPU", str(gpu_idx))
+        print(experiment)
+        if not DRY_RUN:
+            subprocess.call(experiment.split(" "))
+    return True
+
+
+if __name__ == "__main__":
+    work: "Queue[str]" = Queue()
+
+    for model, backbone, lr, loss, wd, weights, seed in itertools.product(
+        model_options,
+        backbone_options,
+        lr_options,
+        loss_options,
+        wd_options,
+        weight_options,
+        seed_options,
+    ):
+        if model == "fcn" and not weights:
+            continue
+
+        if model != "unet":
+            experiment_name = f"{model}_{backbone}_{lr}_{loss}_{wd}_{weights}_{seed}"
+        else:
+            experiment_name = f"{model}_{lr}_{loss}_{wd}_{weights}_{seed}"
+
+        config_file = os.path.join("conf", "l8biometile.yaml")
+
+        command = (
+            "python train.py"
+            + f" config_file={config_file}"
+            + f" module.model={model}"
+            + f" module.backbone={backbone}"
+            + f" module.learning_rate={lr}"
+            + f" module.loss={loss}"
+            + f" module.weight_decay={wd}"
+            + f" module.weights={weights}"
+            + f" program.seed={seed}"
+            + f" program.experiment_name={experiment_name}"
+            + " trainer.devices=[GPU]"
+        )
+        command = command.strip()
+
+        work.put(command)
+
+    processes = []
+    for gpu_idx in GPUS:
+        p = Process(target=do_work, args=(work, gpu_idx))
+        processes.append(p)
+        p.start()
+    for p in processes:
+        p.join()
diff --git a/torchgeo/datamodules/__init__.py b/torchgeo/datamodules/__init__.py
index ba902b0cd61..d769c96f0c7 100644
--- a/torchgeo/datamodules/__init__.py
+++ b/torchgeo/datamodules/__init__.py
@@ -15,8 +15,8 @@
 from .geo import BaseDataModule, GeoDataModule, NonGeoDataModule
 from .gid15 import GID15DataModule
 from .inria import InriaAerialImageLabelingDataModule
-from .l7irish import L7IrishDataModule
-from .l8biome import L8BiomeDataModule
+from .l7irish import L7IrishDataModule, L7IrishTileDataModule
+from .l8biome import L8BiomeDataModule, L8BiomeTileDataModule
 from .landcoverai import LandCoverAIDataModule
 from .loveda import LoveDADataModule
 from .naip import NAIPChesapeakeDataModule
@@ -41,7 +41,9 @@
     # GeoDataset
     "ChesapeakeCVPRDataModule",
     "L7IrishDataModule",
+    "L7IrishTileDataModule",
     "L8BiomeDataModule",
+    "L8BiomeTileDataModule",
     "NAIPChesapeakeDataModule",
     # NonGeoDataset
     "BigEarthNetDataModule",
diff --git a/torchgeo/datamodules/l7irish.py b/torchgeo/datamodules/l7irish.py
index 1f46db59e6b..8d1e91cf3f0 100644
--- a/torchgeo/datamodules/l7irish.py
+++ b/torchgeo/datamodules/l7irish.py
@@ -5,10 +5,12 @@
 
 from typing import Any, Optional, Union
 
+from lightning.pytorch import LightningDataModule
 import torch
+from torch.utils.data import DataLoader
 
-from ..datasets import L7Irish, random_bbox_assignment
-from ..samplers import GridGeoSampler, RandomBatchGeoSampler
+from ..datasets import L7Irish, random_bbox_assignment, TileDataset
+from ..samplers import GridGeoSampler, RandomBatchGeoSampler, RandomTileGeoSampler, GridTileGeoSampler
 from .geo import GeoDataModule
 
 
@@ -74,3 +76,86 @@ def setup(self, stage: str) -> None:
             self.test_sampler = GridGeoSampler(
                 self.test_dataset, self.patch_size, self.patch_size
             )
+
+
+class L7IrishTileDataModule(LightningDataModule):
+
+    @staticmethod
+    def preprocess(sample):
+        sample["image"] = sample["image"] / 255.0
+
+        mask_mapping = {64: 1, 128: 2, 191: 3, 255: 4}
+        if "mask" in sample:
+            mask = sample["mask"].squeeze()
+            for k, v in mask_mapping.items():
+                mask[mask == k] = v
+            sample["mask"] = mask
+        return sample
+
+    def _get_all_the_fns(self, root):
+        import os
+        areas = L7Irish.md5s.keys()
+        image_fns = []
+        mask_fns = []
+        for area in areas:
+            for path_row in os.listdir(os.path.join(root,area)):
+                if path_row == "p46_r14":
+                    continue
+                path, row = path_row.split("_")[:2]
+                image_fns.append(os.path.join(root,area,path_row,f"L7_{path}_{row}_stacked.TIF"))
+                mask_fns.append(os.path.join(root,area,path_row,f"L7_{path}_{row}_newmask2015.TIF"))
+        return image_fns, mask_fns
+
+    def __init__(self, root, batch_size=1, patch_size=32, train_batches_per_epoch=None, val_batches_per_epoch=None, num_workers=0, seed=0):
+        super().__init__()
+        self.image_fns, self.mask_fns = self._get_all_the_fns(root)
+        self.batch_size = batch_size
+        self.patch_size = patch_size
+        self.train_batches_per_epoch = train_batches_per_epoch
+        self.val_batches_per_epoch = val_batches_per_epoch
+        self.num_workers = num_workers
+
+        generator = torch.Generator().manual_seed(seed)
+
+        idxs = torch.randperm(len(self.image_fns), generator=generator)
+        train_idxs = idxs[:int(len(idxs)*0.6)]
+        val_idxs = idxs[int(len(idxs)*0.6):int(len(idxs)*0.8)]
+        test_idxs = idxs[int(len(idxs)*0.8):]
+
+        self.train_image_fns = [self.image_fns[i] for i in train_idxs]
+        self.train_mask_fns = [self.mask_fns[i] for i in train_idxs]
+        self.val_image_fns = [self.image_fns[i] for i in val_idxs]
+        self.val_mask_fns = [self.mask_fns[i] for i in val_idxs]
+        self.test_image_fns = [self.image_fns[i] for i in test_idxs]
+        self.test_mask_fns = [self.mask_fns[i] for i in test_idxs]
+
+    def setup(self, stage):
+        self.train_dataset = TileDataset(self.train_image_fns, self.train_mask_fns, transforms=L7IrishTileDataModule.preprocess)
+        self.val_dataset = TileDataset(self.val_image_fns, self.val_mask_fns, transforms=L7IrishTileDataModule.preprocess)
+        self.test_dataset = TileDataset(self.test_image_fns, self.test_mask_fns, transforms=L7IrishTileDataModule.preprocess)
+
+    # def on_after_batch_transfer(self, batch: Any, dataloader_idx: int) -> Any:
+    #     return super().on_after_batch_transfer(batch, dataloader_idx)
+
+    def train_dataloader(self):
+        sampler = RandomTileGeoSampler(self.train_dataset, self.patch_size, self.batch_size * self.train_batches_per_epoch)
+        return DataLoader(self.train_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def val_dataloader(self):
+        sampler = RandomTileGeoSampler(self.val_dataset, self.patch_size, self.batch_size * self.val_batches_per_epoch)
+        return DataLoader(self.val_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def test_dataloader(self):
+        sampler = GridTileGeoSampler(self.test_dataset, self.patch_size, self.patch_size)
+        return DataLoader(self.test_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def plot(self, sample):
+        import matplotlib.pyplot as plt
+        image = sample["image"].permute(1,2,0).numpy()
+        mask = sample["mask"].numpy().squeeze()
+        fig, axs = plt.subplots(1, 2, figsize=(10, 5))
+        axs[0].imshow(image[:,:,[2,1,0]])
+        axs[0].axis("off")
+        axs[1].imshow(mask, vmin=0, vmax=4)
+        axs[1].axis("off")
+        return fig
\ No newline at end of file
diff --git a/torchgeo/datamodules/l8biome.py b/torchgeo/datamodules/l8biome.py
index 4b9dc4b15ba..94abd136f35 100644
--- a/torchgeo/datamodules/l8biome.py
+++ b/torchgeo/datamodules/l8biome.py
@@ -5,10 +5,12 @@
 
 from typing import Any, Optional, Union
 
+from lightning.pytorch import LightningDataModule
 import torch
+from torch.utils.data import DataLoader
 
-from ..datasets import L8Biome, random_bbox_assignment
-from ..samplers import GridGeoSampler, RandomBatchGeoSampler
+from ..datasets import L8Biome, random_bbox_assignment, TileDataset
+from ..samplers import GridGeoSampler, RandomBatchGeoSampler, RandomTileGeoSampler, GridTileGeoSampler
 from .geo import GeoDataModule
 
 
@@ -74,3 +76,82 @@ def setup(self, stage: str) -> None:
             self.test_sampler = GridGeoSampler(
                 self.test_dataset, self.patch_size, self.patch_size
             )
+
+class L8BiomeTileDataModule(LightningDataModule):
+
+    @staticmethod
+    def preprocess(sample):
+        sample["image"] = sample["image"] / 255.0
+
+        mask_mapping = {64: 1, 128: 2, 192: 3, 255: 4}
+        if "mask" in sample:
+            mask = sample["mask"].squeeze()
+            for k, v in mask_mapping.items():
+                mask[mask == k] = v
+            sample["mask"] = mask
+        return sample
+
+    def _get_all_the_fns(self, root):
+        import os
+        areas = L8Biome.filenames_to_md5.keys()
+        image_fns = []
+        mask_fns = []
+        for area in areas:
+            for scene_idx in os.listdir(os.path.join(root,area)):
+                image_fns.append(os.path.join(root,area,scene_idx,f"{scene_idx}.TIF"))
+                mask_fns.append(os.path.join(root,area,scene_idx,f"{scene_idx}_fixedmask.TIF"))
+        return image_fns, mask_fns
+
+    def __init__(self, root, batch_size=1, patch_size=32, train_batches_per_epoch=None, val_batches_per_epoch=None, num_workers=0, seed=0):
+        super().__init__()
+        self.image_fns, self.mask_fns = self._get_all_the_fns(root)
+        self.batch_size = batch_size
+        self.patch_size = patch_size
+        self.train_batches_per_epoch = train_batches_per_epoch
+        self.val_batches_per_epoch = val_batches_per_epoch
+        self.num_workers = num_workers
+
+        generator = torch.Generator().manual_seed(seed)
+
+        idxs = torch.randperm(len(self.image_fns), generator=generator)
+        train_idxs = idxs[:int(len(idxs)*0.6)]
+        val_idxs = idxs[int(len(idxs)*0.6):int(len(idxs)*0.8)]
+        test_idxs = idxs[int(len(idxs)*0.8):]
+
+        self.train_image_fns = [self.image_fns[i] for i in train_idxs]
+        self.train_mask_fns = [self.mask_fns[i] for i in train_idxs]
+        self.val_image_fns = [self.image_fns[i] for i in val_idxs]
+        self.val_mask_fns = [self.mask_fns[i] for i in val_idxs]
+        self.test_image_fns = [self.image_fns[i] for i in test_idxs]
+        self.test_mask_fns = [self.mask_fns[i] for i in test_idxs]
+
+    def setup(self, stage):
+        self.train_dataset = TileDataset(self.train_image_fns, self.train_mask_fns, transforms=L8BiomeTileDataModule.preprocess)
+        self.val_dataset = TileDataset(self.val_image_fns, self.val_mask_fns, transforms=L8BiomeTileDataModule.preprocess)
+        self.test_dataset = TileDataset(self.test_image_fns, self.test_mask_fns, transforms=L8BiomeTileDataModule.preprocess)
+
+    # def on_after_batch_transfer(self, batch: Any, dataloader_idx: int) -> Any:
+    #     return super().on_after_batch_transfer(batch, dataloader_idx)
+
+    def train_dataloader(self):
+        sampler = RandomTileGeoSampler(self.train_dataset, self.patch_size, self.batch_size * self.train_batches_per_epoch)
+        return DataLoader(self.train_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def val_dataloader(self):
+        sampler = RandomTileGeoSampler(self.val_dataset, self.patch_size, self.batch_size * self.val_batches_per_epoch)
+        return DataLoader(self.val_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def test_dataloader(self):
+        sampler = GridTileGeoSampler(self.test_dataset, self.patch_size, self.patch_size)
+        return DataLoader(self.test_dataset, batch_size=self.batch_size, sampler=sampler, num_workers=self.num_workers)
+
+    def plot(self, sample):
+        import matplotlib.pyplot as plt
+        image = sample["image"].permute(1,2,0).numpy()
+        mask = sample["mask"].numpy().squeeze()
+        fig, axs = plt.subplots(1, 2, figsize=(10, 5))
+        axs[0].imshow(image[:,:,[2,1,0]])
+        axs[0].axis("off")
+        axs[1].imshow(mask, vmin=0, vmax=4)
+        axs[1].axis("off")
+        return fig
\ No newline at end of file
diff --git a/torchgeo/datasets/__init__.py b/torchgeo/datasets/__init__.py
index 92734304a48..1a4857ad7f4 100644
--- a/torchgeo/datasets/__init__.py
+++ b/torchgeo/datasets/__init__.py
@@ -106,6 +106,7 @@
 )
 from .ssl4eo import SSL4EO, SSL4EOL, SSL4EOS12
 from .sustainbench_crop_yield import SustainBenchCropYield
+from .tile import TileDataset
 from .ucmerced import UCMerced
 from .usavars import USAVars
 from .utils import (
@@ -241,4 +242,6 @@
     "random_grid_cell_assignment",
     "roi_split",
     "time_series_split",
+    # TileDataset
+    "TileDataset",
 )
diff --git a/torchgeo/datasets/tile.py b/torchgeo/datasets/tile.py
new file mode 100644
index 00000000000..31275b344d7
--- /dev/null
+++ b/torchgeo/datasets/tile.py
@@ -0,0 +1,59 @@
+import rasterio
+import rasterio.io
+import rasterio.merge
+import rasterio.windows
+import torch
+from torch.utils.data import Dataset
+
+
+class TileDataset(Dataset):
+
+    def __init__(self, image_fns, mask_fns=None, transforms=None, sanity_check=False):
+        super().__init__()
+        self.image_fns = image_fns
+        self.mask_fns = mask_fns
+        if self.mask_fns is not None:
+            assert len(image_fns) == len(mask_fns)
+
+        if sanity_check and mask_fns is not None:
+            for image_fn, mask_fn in zip(image_fns, mask_fns):
+                with rasterio.open(image_fn) as f:
+                    image_height, image_width = f.shape
+                with rasterio.open(mask_fn) as f:
+                    mask_height, mask_width = f.shape
+                assert image_height == mask_height
+                assert image_width == mask_width
+
+        self.transforms = transforms
+
+    def __len__(self):
+        return len(self.image_fns)
+
+    def __getitem__(self, index):
+        i, y, x, patch_size = index
+        assert 0 <= i < len(self.image_fns)
+
+        sample = {
+            "y": y,
+            "x": x,
+        }
+
+        window = rasterio.windows.Window(
+            x, y, patch_size, patch_size
+        )
+
+        image_fn = self.image_fns[i]
+        with rasterio.open(image_fn) as f:
+            image = f.read(window=window)
+        sample["image"] = torch.from_numpy(image).float()
+
+        if self.mask_fns is not None:
+            mask_fn = self.mask_fns[i]
+            with rasterio.open(mask_fn) as f:
+                mask = f.read(window=window)
+            sample["mask"] = torch.from_numpy(mask).long()
+
+        if self.transforms is not None:
+            sample = self.transforms(sample)
+
+        return sample
diff --git a/torchgeo/samplers/__init__.py b/torchgeo/samplers/__init__.py
index ae449228171..b119f362311 100644
--- a/torchgeo/samplers/__init__.py
+++ b/torchgeo/samplers/__init__.py
@@ -7,14 +7,17 @@
 from .constants import Units
 from .single import GeoSampler, GridGeoSampler, PreChippedGeoSampler, RandomGeoSampler
 from .utils import get_random_bounding_box, tile_to_chips
+from .tile import RandomTileGeoSampler, GridTileGeoSampler
 
 __all__ = (
     # Samplers
     "GridGeoSampler",
+    "GridTileGeoSampler",
     "PreChippedGeoSampler",
     "RandomGeoSampler",
     # Batch samplers
     "RandomBatchGeoSampler",
+    "RandomTileGeoSampler",
     # Base classes
     "GeoSampler",
     "BatchGeoSampler",
diff --git a/torchgeo/samplers/tile.py b/torchgeo/samplers/tile.py
new file mode 100644
index 00000000000..ebc80270589
--- /dev/null
+++ b/torchgeo/samplers/tile.py
@@ -0,0 +1,67 @@
+import numpy as np
+import rasterio
+import rasterio.io
+import rasterio.merge
+import rasterio.windows
+
+from ..datasets import TileDataset
+from torch.utils.data import Sampler
+
+class RandomTileGeoSampler(Sampler):
+
+    def __init__(self, dataset: TileDataset, size: int, length: int):
+        self.tile_sample_weights = []
+        self.tile_heights = []
+        self.tile_widths = []
+        self.length = length
+        self.size = size
+
+        for image_fn in dataset.image_fns:
+            with rasterio.open(image_fn) as f:
+                image_height, image_width = f.shape
+            self.tile_sample_weights.append(image_height * image_width)
+            self.tile_heights.append(image_height)
+            self.tile_widths.append(image_width)
+
+        self.tile_sample_weights = np.array(self.tile_sample_weights)
+        self.tile_sample_weights = (
+            self.tile_sample_weights / self.tile_sample_weights.sum()
+        )
+        self.num_tiles = len(self.tile_sample_weights)
+
+    def __iter__(self):
+        for _ in range(len(self)):
+            i = np.random.choice(self.num_tiles, p=self.tile_sample_weights)
+            y = np.random.randint(0, self.tile_heights[i] - self.size)
+            x = np.random.randint(0, self.tile_widths[i] - self.size)
+
+            yield (i, y, x, self.size)
+
+    def __len__(self):
+        return self.length
+
+
+class GridTileGeoSampler(Sampler):
+
+    def __init__(
+        self,
+        dataset: TileDataset,
+        size: int,
+        stride=256,
+    ):
+        self.indices = []
+        for i, image_fn in enumerate(dataset.image_fns):
+            with rasterio.open(image_fn) as f:
+                height, width = f.height, f.width
+
+            for y in list(range(0, height - size, stride)) + [height - size]:
+                for x in list(range(0, width - size, stride)) + [width - size]:
+                    self.indices.append((i, y, x, size))
+        self.num_chips = len(self.indices)
+
+    def __iter__(self):
+        for index in self.indices:
+            yield index
+
+    def __len__(self):
+        return self.num_chips
diff --git a/torchgeo/trainers/segmentation.py b/torchgeo/trainers/segmentation.py
index 826f1824104..00c41bcda1a 100644
--- a/torchgeo/trainers/segmentation.py
+++ b/torchgeo/trainers/segmentation.py
@@ -323,8 +323,10 @@ def configure_optimizers(self) -> dict[str, Any]:
         Returns:
             learning rate dictionary
         """
-        optimizer = torch.optim.Adam(
-            self.model.parameters(), lr=self.hyperparams["learning_rate"]
+        optimizer = torch.optim.AdamW(
+            self.model.parameters(),
+            lr=self.hyperparams["learning_rate"],
+            weight_decay=self.hyperparams["weight_decay"],
         )
         return {
             "optimizer": optimizer,
diff --git a/train.py b/train.py
index 2284402d581..07de7f39769 100755
--- a/train.py
+++ b/train.py
@@ -59,9 +59,12 @@ def set_up_omegaconf() -> DictConfig:
 
 def main(conf: DictConfig) -> None:
     """Main training loop."""
-    experiment_name = (
-        f"{conf.datamodule._target_.lower()}_{conf.module._target_.lower()}"
-    )
+    if conf.program.experiment_name is not None:
+        experiment_name = conf.program.experiment_name
+    else:
+        experiment_name = (
+            f"{conf.datamodule._target_.lower()}_{conf.module._target_.lower()}"
+        )
     if os.path.isfile(conf.program.output_dir):
         raise NotADirectoryError("`program.output_dir` must be a directory")
     os.makedirs(conf.program.output_dir, exist_ok=True)