ray-project · sven1977 · Jun 21, 2024 · Jun 19, 2024 · Jun 20, 2024 · Jun 20, 2024
@@ -447,7 +447,7 @@ def _sample_episodes(
         obs, infos = self.env.reset()
         for env_index in range(self.num_envs):
             episodes[env_index].add_env_reset(
-                observation=obs[env_index],
+                observation=unbatch(obs)[env_index],
                 infos=infos[env_index],
             )
             self._make_on_episode_callback("on_episode_start", env_index, episodes)
@@ -724,6 +724,7 @@ def make_env(self) -> None:
                 asynchronous=self.config.remote_worker_envs,
             )
         )
+
         self.num_envs: int = self.env.num_envs
         assert self.num_envs == self.config.num_envs_per_env_runner