RefalMachine/RuadaptQwen2.5-1.5B-instruct · generation_config.json содержит неверный pad_token_id, что приводит к падению при генерации батчами.

{"pad_token_id": 151643, ... }
что превышает размер словаря. При одновременной генерации нескольких промптов это приводит к лютому дампу наподобие такого:

/build/pytorch/aten/src/ATen/native/cuda/Indexing.cu:1500: indexSelectSmallIndex: block: [3,0,0], thread: [0,0,0] Assertion `srcIndex < srcSelectDimSize` failed.
/build/pytorch/aten/src/ATen/native/cuda/Indexing.cu:1500: indexSelectSmallIndex: block: [3,0,0], thread: [1,0,0] Assertion `srcIndex < srcSelectDimSize` failed.
<еще страниц 10>