mergekit-community
/

mergekit-slerp-madwjrw

Text Generation

text-generation-inference

Model card Files Files and versions

mergekit-slerp-madwjrw / mergekit_config.yml

mergekit-uploader's picture

mergekit-uploader

Upload folder using huggingface_hub

67dd6e9 verified 10 months ago

history blame contribute delete

455 Bytes

	slices:
	- sources:
	- model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
	layer_range:
	- 0
	- 48
	- model: Qwen/Qwen2.5-Coder-14B-Instruct
	layer_range:
	- 0
	- 48
	merge_method: slerp
	base_model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
	parameters:
	t:
	- filter: self_attn
	value:
	- 0
	- 0.5
	- 0.3
	- 0.7
	- 1
	- filter: mlp
	value:
	- 1
	- 0.5
	- 0.7
	- 0.3
	- 0
	- value: 0.5
	dtype: bfloat16