Add evaluation results on the samsum config and test split of samsum

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋!\
Your model has been evaluated on the samsum config and test split of the [samsum](https://huggingface.co/datasets/samsum) dataset by

@pszemraj

, using the predictions stored [here](https://huggingface.co/datasets/autoevaluate/autoeval-eval-samsum-samsum-29813b-2390574811).\
Accept this pull request to see the results displayed on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=samsum).\
Evaluate your model on more datasets [here](https://huggingface.co/spaces/autoevaluate/model-evaluator?dataset=samsum).

Files changed (1) hide show

README.md +34 -1

README.md CHANGED Viewed

@@ -9,7 +9,40 @@ datasets:
 - stacked-summaries/stacked-samsum-1024
 model-index:
 - name: flan-t5-large-stacked-samsum1024-WIP3
-  results: []
 ---

 - stacked-summaries/stacked-samsum-1024
 model-index:
 - name: flan-t5-large-stacked-samsum1024-WIP3
+  results:
+  - task:
+      type: summarization
+      name: Summarization
+    dataset:
+      name: samsum
+      type: samsum
+      config: samsum
+      split: test
+    metrics:
+    - name: ROUGE-1
+      type: rouge
+      value: 47.6682
+      verified: true
+    - name: ROUGE-2
+      type: rouge
+      value: 23.3053
+      verified: true
+    - name: ROUGE-L
+      type: rouge
+      value: 39.7678
+      verified: true
+    - name: ROUGE-LSUM
+      type: rouge
+      value: 43.259
+      verified: true
+    - name: loss
+      type: loss
+      value: 2.372586965560913
+      verified: true
+    - name: gen_len
+      type: gen_len
+      value: 17.4237
+      verified: true
 ---