Update README.md
Browse files
README.md
CHANGED
|
@@ -65,6 +65,104 @@ It is a fine-tune of **Qwen 2.5-VL-7B** using ~10k synthetic Doc-to-Reasoning-to
|
|
| 65 |
|
| 66 |
**Model before GRPO loses 80% time vs post-GRPO model (see win-rate matrix)**
|
| 67 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 68 |
|
| 69 |
## Quick start: 🤗 Transformers
|
| 70 |
|
|
|
|
| 65 |
|
| 66 |
**Model before GRPO loses 80% time vs post-GRPO model (see win-rate matrix)**
|
| 67 |
|
| 68 |
+
## Examples:
|
| 69 |
+
|
| 70 |
+
<p align="center">
|
| 71 |
+
<img src="ex1.png" width="500"/>
|
| 72 |
+
</p>
|
| 73 |
+
|
| 74 |
+
```
|
| 75 |
+
<think>
|
| 76 |
+
1. **Analyze the overall structure:** The document consists of two main sections, each containing a header, a set of bullet points, a title, a table, and a footer. The layout is consistent within each section but different between the two.
|
| 77 |
+
|
| 78 |
+
2. **Handle the first section header and bullet points:**
|
| 79 |
+
- The top left corner has "Generalitat de Catalunya Departament d'Educació Institut Gal·lecs". This is a consistent header and should be transcribed as a level 3 heading.
|
| 80 |
+
- The top right corner has "Curs 2021-22". This is a distinct header and should be transcribed as a level 3 heading.
|
| 81 |
+
- Below the header, there are four bullet points. These are standard list items. I will use Markdown's unordered list syntax (`- `).
|
| 82 |
+
|
| 83 |
+
3. **Process the first section's main content - Table 1:**
|
| 84 |
+
- **Identify table structure:** This is a complex table with a clear header row: "MATERIAL", "TÍTOL", "AUTOR", "EDITORIAL", "ISBN".
|
| 85 |
+
- **Determine columns:** There are 5 columns.
|
| 86 |
+
- **Handle merged cells:**
|
| 87 |
+
- "Llengua Catalana" spans two rows.
|
| 88 |
+
- "Llengua Castellana" spans three rows.
|
| 89 |
+
- "Anglès" spans two rows.
|
| 90 |
+
- **Populate table data:** Transcribe all text, including multi-line content within cells (e.g., "Babulinka Books\nEditorialCol·lecció: Pettes\nJoies per a Grans Lectors.\n2013").
|
| 91 |
+
- **Markdown table creation:** Use standard Markdown table syntax, ensuring correct alignment and handling of multi-line content within cells.
|
| 92 |
+
|
| 93 |
+
4. **Handle the first section's footer:**
|
| 94 |
+
- The footer contains "Codí: 04mp02", "Responsable: Coordinador Qualitat", "Versió: 5", "Full d'Informació a l'alumnat i famílies", "Aquest document pot quedar obsolet una vegada imprès", and "Pàgina 1 de 2". This is a simple text block at the bottom. I will transcribe it as a separate paragraph or list, maintaining the original layout if possible, but a simple paragraph is sufficient for a footer.
|
| 95 |
+
|
| 96 |
+
5. **Handle the second section header and bullet points:**
|
| 97 |
+
- The top left corner has "Generalitat de Catalunya Departament d'Educació Institut Gal·lecs". This is a consistent header and should be transcribed as a level 3 heading.
|
| 98 |
+
- The top right corner has "Curs 2021-22". This is a distinct header and should be transcribed as a level 3 heading.
|
| 99 |
+
- Below the header, there are no bullet points, but there is a table.
|
| 100 |
+
|
| 101 |
+
6. **Process the second section's main content - Table 2:**
|
| 102 |
+
- **Identify table structure:** This is a simpler table with a clear header row: "MATERIAL", "TÍTOL", "AUTOR", "EDITORIAL", "ISBN".
|
| 103 |
+
- **Determine columns:** There are 5 columns.
|
| 104 |
+
- **Populate table data:** Transcribe all text, including multi-line content within cells (e.g., "Projecte MOTIMATS-ONMAT (llicència digital) Tekman Books\nES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE").
|
| 105 |
+
- **Markdown table creation:** Use standard Markdown table syntax.
|
| 106 |
+
|
| 107 |
+
7. **Handle the second section's footer:**
|
| 108 |
+
- The footer contains "Codí: 04mp02", "Responsable: Coordinador Qualitat", "Versió: 5", "Full d'Informació a l'alumnat i famílies", "Aquest document pot quedar obsolet una vegada imprès", and "Pàgina 2 de 2". This is a simple text block at the bottom. I will transcribe it as a separate paragraph or list, maintaining the original layout if possible, but a simple paragraph is sufficient for a footer.
|
| 109 |
+
|
| 110 |
+
8. **Final review:** Check for any missed text, incorrect formatting, or issues with table alignment. Ensure all original content is present and accurately represented in GitHub-Flavored Markdown. The image placeholders are not needed as there are no images in the document.
|
| 111 |
+
</think>
|
| 112 |
+
<answer>
|
| 113 |
+
### Generalitat de Catalunya
|
| 114 |
+
### Departament d'Educació
|
| 115 |
+
### Institut Gal·lecs
|
| 116 |
+
|
| 117 |
+
### Curs 2021-22
|
| 118 |
+
|
| 119 |
+
- Els llibres de color blau indiquen que es manté respecte al curs anterior.
|
| 120 |
+
- Els llibres de color groc indiquen que es tracta d'un canvi per a aquest curs.
|
| 121 |
+
- Els llibres de color vermell indiquen que no s'han de comprar perquè van a càrrec del centre.
|
| 122 |
+
- Matèries sense llibre: Dossiers, llicències i el Kit de tecnologia s'hauran de pagar i de recollir a través de l'AMPA a partir de setembre.
|
| 123 |
+
|
| 124 |
+
# 1 ESO
|
| 125 |
+
|
| 126 |
+
| MATERIAL | TÍTOL | AUTOR | EDITORIAL | ISBN |
|
| 127 |
+
|---|---|---|---|---|
|
| 128 |
+
| Llengua Catalana | Punt Volat | | Castellnou (Didacta +) | 9788417803124 |
|
| 129 |
+
| | Duna, Diari d'un estiu. | Muriel Villanueva | Babulinka Books<br>EditorialCol·lecció: Pettes<br>Joies per a Grans Lectors.<br>2013 | 9788494159077 |
|
| 130 |
+
| | El nen que xatejava amb Jack Sparrow. | Francesc Puigpelat | Bromera<br>Col·lecció: L'Elefant. 2015 | 9788490264072 |
|
| 131 |
+
| Llengua Castellana | Proyecto Asterisco | | Castellnou (Didacta +) | 9788417803186 |
|
| 132 |
+
| | Manzanas rojas | Luis Matilla | Ed. Anaya | 978846673989 |
|
| 133 |
+
| | Fàbulas de Esopo | Jerry Pinkney | Vicens Vives | 978843671648 |
|
| 134 |
+
| Anglès | Think Ahead ESO 1. Student's book.<br>Think Ahead ESO 1. Workbook (cat). | | Burlington Books<br>Burlington Books | 9788925300662<br>9789925300686 |
|
| 135 |
+
|
| 136 |
+
Codí: 04mp02
|
| 137 |
+
Responsable: Coordinador Qualitat
|
| 138 |
+
Versió: 5
|
| 139 |
+
Full d'Informació a l'alumnat i famílies
|
| 140 |
+
Aquest document pot quedar obsolet una vegada imprès
|
| 141 |
+
Pàgina 1 de 2
|
| 142 |
+
|
| 143 |
+
### Generalitat de Catalunya
|
| 144 |
+
### Departament d'Educació
|
| 145 |
+
### Institut Gal·lecs
|
| 146 |
+
|
| 147 |
+
### Curs 2021-22
|
| 148 |
+
|
| 149 |
+
| MATERIAL | TÍTOL | AUTOR | EDITORIAL | ISBN |
|
| 150 |
+
|---|---|---|---|---|
|
| 151 |
+
| FRANCÈS | Nouvelle Génération A1-A2 | | Santillana | 9788490494745 |
|
| 152 |
+
| CIÈNCIES EXPERIMENTALS | Science Bits<br>ES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE | | | 9788412213485 (llicència digital) |
|
| 153 |
+
| MATEMÀTIQUES | Projecte MOTIMATS-ONMAT (llicència digital) Tekman Books<br>ES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE | | | |
|
| 154 |
+
| TECNOLOGIA | Tecnologia 1 ESO | TEIDE | | 9788430783175 |
|
| 155 |
+
| VISUAL I PLÀSTICA | SENSE LLIBRE-KIT DE MATERIAL | | | |
|
| 156 |
+
| CIÈNCIES SOCIALS | SENSE LLIBRE-dossier | | | |
|
| 157 |
+
|
| 158 |
+
Codí: 04mp02
|
| 159 |
+
Responsable: Coordinador Qualitat
|
| 160 |
+
Versió: 5
|
| 161 |
+
Full d'Informació a l'alumnat i famílies
|
| 162 |
+
Aquest document pot quedar obsolet una vegada imprès
|
| 163 |
+
Pàgina 2 de 2
|
| 164 |
+
</answer>
|
| 165 |
+
```
|
| 166 |
|
| 167 |
## Quick start: 🤗 Transformers
|
| 168 |
|