pascalrai
/

nep-summ-BART

Text Generation

text2text-generation

nepali text summary

Model card Files Files and versions

pascalrai commited on Feb 18, 2024

Commit

34fb895

·

verified ·

1 Parent(s): 4aa6f9e

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -89,6 +89,10 @@ tokenizer.decode(summary_ids[0], skip_special_tokens=True, clean_up_tokenization
 The model was pre-trained continuously on a single A10G GPU in an AWS instance for 133 hours with each epoch taking 45 hours using bf16 quantization.
 #### Authors:
 <a href="https://www.linkedin.com/in/bijaya-bhatta-69536018a/">Vijaya Bhatta</a>

 The model was pre-trained continuously on a single A10G GPU in an AWS instance for 133 hours with each epoch taking 45 hours using bf16 quantization.
+#### Possible Future Directions:
+1. Use a decoder only model for pre-training and summarization.
 #### Authors:
 <a href="https://www.linkedin.com/in/bijaya-bhatta-69536018a/">Vijaya Bhatta</a>