NVIDIA · arendu · Apr 6, 2023 · Mar 30, 2023 · Mar 30, 2023 · Mar 30, 2023
diff --git a/examples/nlp/language_modeling/conf/megatron_gpt_prompt_learning_inference.yaml b/examples/nlp/language_modeling/conf/megatron_gpt_prompt_learning_inference.yaml
@@ -24,6 +24,7 @@ pipeline_model_parallel_size: 1
 gpt_model_file: null  # GPT nemo file path
 virtual_prompt_model_file: ??? # path to a MegatronGPTPromptLearningModel model if you want to use soft prompts
 pred_file_path: ??? # Path will model predictions will be written
+max_seq_length: 8192 # this will filter out inputs whose length is longer than the set value form the generation process.
 data_paths: # paths to .jsonl files you want to perform inference on
 num_workers: 8
 
diff --git a/examples/nlp/language_modeling/megatron_gpt_prompt_learning_eval.py b/examples/nlp/language_modeling/megatron_gpt_prompt_learning_eval.py
@@ -136,12 +136,13 @@ def placeholder():
         "compute_logprob": cfg.inference.compute_logprob,
     }
 
-    max_input_length = model.frozen_model.cfg.encoder_seq_length - length_params["max_length"]
+    max_seq_length = model.frozen_model.cfg.encoder_seq_length - length_params["max_length"]
+    max_seq_length = min(max_seq_length, cfg.get("max_seq_length", 8192))
 
     _, dataloader = model.build_virtual_prompt_dataset(
         data=cfg.data_paths,
         batch_size=cfg.inference.get('batch_size', 1),
-        max_seq_length=max_input_length,
+        max_seq_length=max_seq_length,
         min_seq_length=model.cfg.data.get('min_seq_length', 1),
         add_bos=sampling_params["add_BOS"],
         add_eos=False,

diff --git a/nemo/collections/nlp/models/language_modeling/megatron_gpt_prompt_learning_model.py b/nemo/collections/nlp/models/language_modeling/megatron_gpt_prompt_learning_model.py
@@ -405,7 +405,7 @@ def setup_training_data(self, training_data_config=None):
         if self.cfg.data.get('train_ds', None):
             max_seq_length = self.frozen_model.cfg.encoder_seq_length
             if "max_seq_length" in self.cfg.data and self.cfg.data.max_seq_length:
-                max_seq_length = self.cfg.data.max_seq_length
+                max_seq_length = min(max_seq_length, self.cfg.data.max_seq_length)
             self._train_ds, self._train_dl = self.build_virtual_prompt_dataset(
                 data=self.cfg.data.train_ds,
                 batch_size=self.cfg.global_batch_size,
@@ -426,7 +426,7 @@ def setup_validation_data(self, validation_data_config=None):
         if self.cfg.data.get('validation_ds', None):
             max_seq_length = self.frozen_model.cfg.encoder_seq_length
             if "max_seq_length" in self.cfg.data and self.cfg.data.max_seq_length:
-                max_seq_length = self.cfg.data.max_seq_length
+                max_seq_length = min(max_seq_length, self.cfg.data.max_seq_length)
             self._validation_ds, self._validation_dl = self.build_virtual_prompt_dataset(
                 data=self.cfg.data.validation_ds,
                 batch_size=self.cfg.get('validation_global_batch_size', self.cfg.global_batch_size),