more version handling for v.25 and v.26

SiftingSands · SiftingSands · commit 1015af66648e · 2022-11-04T20:45:27.000-04:00
diff --git a/intermediate_source/reinforcement_q_learning.py b/intermediate_source/reinforcement_q_learning.py
@@ -261,7 +261,10 @@ def forward(self, x):
 # Get number of actions from gym action space
 n_actions = env.action_space.n
 # Get the number of state observations
-state, _ = env.reset()
+if gym.__version__[:4] == '0.26':
+    state, _ = env.reset()
+elif gym.__version__[:4] == '0.25':
+    state, _ = env.reset(return_info=True)
 n_observations = len(state)
 
 policy_net = DQN(n_observations, n_actions).to(device)
@@ -401,7 +404,10 @@ def optimize_model():
 
 for i_episode in range(num_episodes):
     # Initialize the environment and get it's state
-    state, _ = env.reset()
+    if gym.__version__[:4] == '0.26':
+        state, _ = env.reset()
+    elif gym.__version__[:4] == '0.25':
+        state, _ = env.reset(return_info=True)
     state = torch.tensor(state, dtype=torch.float32, device=device).unsqueeze(0)
     for t in count():
         action = select_action(state)