Alexandre-Numind commited on
Commit
07f5288
·
verified ·
1 Parent(s): f61ff11

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +98 -0
README.md CHANGED
@@ -65,6 +65,104 @@ It is a fine-tune of **Qwen 2.5-VL-7B** using ~10k synthetic Doc-to-Reasoning-to
65
 
66
  **Model before GRPO loses 80% time vs post-GRPO model (see win-rate matrix)**
67
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
68
 
69
  ## Quick start: 🤗 Transformers
70
 
 
65
 
66
  **Model before GRPO loses 80% time vs post-GRPO model (see win-rate matrix)**
67
 
68
+ ## Examples:
69
+
70
+ <p align="center">
71
+ <img src="ex1.png" width="500"/>
72
+ </p>
73
+
74
+ ```
75
+ <think>
76
+ 1. **Analyze the overall structure:** The document consists of two main sections, each containing a header, a set of bullet points, a title, a table, and a footer. The layout is consistent within each section but different between the two.
77
+
78
+ 2. **Handle the first section header and bullet points:**
79
+ - The top left corner has "Generalitat de Catalunya Departament d'Educació Institut Gal·lecs". This is a consistent header and should be transcribed as a level 3 heading.
80
+ - The top right corner has "Curs 2021-22". This is a distinct header and should be transcribed as a level 3 heading.
81
+ - Below the header, there are four bullet points. These are standard list items. I will use Markdown's unordered list syntax (`- `).
82
+
83
+ 3. **Process the first section's main content - Table 1:**
84
+ - **Identify table structure:** This is a complex table with a clear header row: "MATERIAL", "TÍTOL", "AUTOR", "EDITORIAL", "ISBN".
85
+ - **Determine columns:** There are 5 columns.
86
+ - **Handle merged cells:**
87
+ - "Llengua Catalana" spans two rows.
88
+ - "Llengua Castellana" spans three rows.
89
+ - "Anglès" spans two rows.
90
+ - **Populate table data:** Transcribe all text, including multi-line content within cells (e.g., "Babulinka Books\nEditorialCol·lecció: Pettes\nJoies per a Grans Lectors.\n2013").
91
+ - **Markdown table creation:** Use standard Markdown table syntax, ensuring correct alignment and handling of multi-line content within cells.
92
+
93
+ 4. **Handle the first section's footer:**
94
+ - The footer contains "Codí: 04mp02", "Responsable: Coordinador Qualitat", "Versió: 5", "Full d'Informació a l'alumnat i famílies", "Aquest document pot quedar obsolet una vegada imprès", and "Pàgina 1 de 2". This is a simple text block at the bottom. I will transcribe it as a separate paragraph or list, maintaining the original layout if possible, but a simple paragraph is sufficient for a footer.
95
+
96
+ 5. **Handle the second section header and bullet points:**
97
+ - The top left corner has "Generalitat de Catalunya Departament d'Educació Institut Gal·lecs". This is a consistent header and should be transcribed as a level 3 heading.
98
+ - The top right corner has "Curs 2021-22". This is a distinct header and should be transcribed as a level 3 heading.
99
+ - Below the header, there are no bullet points, but there is a table.
100
+
101
+ 6. **Process the second section's main content - Table 2:**
102
+ - **Identify table structure:** This is a simpler table with a clear header row: "MATERIAL", "TÍTOL", "AUTOR", "EDITORIAL", "ISBN".
103
+ - **Determine columns:** There are 5 columns.
104
+ - **Populate table data:** Transcribe all text, including multi-line content within cells (e.g., "Projecte MOTIMATS-ONMAT (llicència digital) Tekman Books\nES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE").
105
+ - **Markdown table creation:** Use standard Markdown table syntax.
106
+
107
+ 7. **Handle the second section's footer:**
108
+ - The footer contains "Codí: 04mp02", "Responsable: Coordinador Qualitat", "Versió: 5", "Full d'Informació a l'alumnat i famílies", "Aquest document pot quedar obsolet una vegada imprès", and "Pàgina 2 de 2". This is a simple text block at the bottom. I will transcribe it as a separate paragraph or list, maintaining the original layout if possible, but a simple paragraph is sufficient for a footer.
109
+
110
+ 8. **Final review:** Check for any missed text, incorrect formatting, or issues with table alignment. Ensure all original content is present and accurately represented in GitHub-Flavored Markdown. The image placeholders are not needed as there are no images in the document.
111
+ </think>
112
+ <answer>
113
+ ### Generalitat de Catalunya
114
+ ### Departament d'Educació
115
+ ### Institut Gal·lecs
116
+
117
+ ### Curs 2021-22
118
+
119
+ - Els llibres de color blau indiquen que es manté respecte al curs anterior.
120
+ - Els llibres de color groc indiquen que es tracta d'un canvi per a aquest curs.
121
+ - Els llibres de color vermell indiquen que no s'han de comprar perquè van a càrrec del centre.
122
+ - Matèries sense llibre: Dossiers, llicències i el Kit de tecnologia s'hauran de pagar i de recollir a través de l'AMPA a partir de setembre.
123
+
124
+ # 1 ESO
125
+
126
+ | MATERIAL | TÍTOL | AUTOR | EDITORIAL | ISBN |
127
+ |---|---|---|---|---|
128
+ | Llengua Catalana | Punt Volat | | Castellnou (Didacta +) | 9788417803124 |
129
+ | | Duna, Diari d'un estiu. | Muriel Villanueva | Babulinka Books<br>EditorialCol·lecció: Pettes<br>Joies per a Grans Lectors.<br>2013 | 9788494159077 |
130
+ | | El nen que xatejava amb Jack Sparrow. | Francesc Puigpelat | Bromera<br>Col·lecció: L'Elefant. 2015 | 9788490264072 |
131
+ | Llengua Castellana | Proyecto Asterisco | | Castellnou (Didacta +) | 9788417803186 |
132
+ | | Manzanas rojas | Luis Matilla | Ed. Anaya | 978846673989 |
133
+ | | Fàbulas de Esopo | Jerry Pinkney | Vicens Vives | 978843671648 |
134
+ | Anglès | Think Ahead ESO 1. Student's book.<br>Think Ahead ESO 1. Workbook (cat). | | Burlington Books<br>Burlington Books | 9788925300662<br>9789925300686 |
135
+
136
+ Codí: 04mp02
137
+ Responsable: Coordinador Qualitat
138
+ Versió: 5
139
+ Full d'Informació a l'alumnat i famílies
140
+ Aquest document pot quedar obsolet una vegada imprès
141
+ Pàgina 1 de 2
142
+
143
+ ### Generalitat de Catalunya
144
+ ### Departament d'Educació
145
+ ### Institut Gal·lecs
146
+
147
+ ### Curs 2021-22
148
+
149
+ | MATERIAL | TÍTOL | AUTOR | EDITORIAL | ISBN |
150
+ |---|---|---|---|---|
151
+ | FRANCÈS | Nouvelle Génération A1-A2 | | Santillana | 9788490494745 |
152
+ | CIÈNCIES EXPERIMENTALS | Science Bits<br>ES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE | | | 9788412213485 (llicència digital) |
153
+ | MATEMÀTIQUES | Projecte MOTIMATS-ONMAT (llicència digital) Tekman Books<br>ES GESTIONA A TRAVÉS DE L'AMPA AL SETEMBRE | | | |
154
+ | TECNOLOGIA | Tecnologia 1 ESO | TEIDE | | 9788430783175 |
155
+ | VISUAL I PLÀSTICA | SENSE LLIBRE-KIT DE MATERIAL | | | |
156
+ | CIÈNCIES SOCIALS | SENSE LLIBRE-dossier | | | |
157
+
158
+ Codí: 04mp02
159
+ Responsable: Coordinador Qualitat
160
+ Versió: 5
161
+ Full d'Informació a l'alumnat i famílies
162
+ Aquest document pot quedar obsolet una vegada imprès
163
+ Pàgina 2 de 2
164
+ </answer>
165
+ ```
166
 
167
  ## Quick start: 🤗 Transformers
168