|
发表于 2025-2-20 22:40:48
|
显示全部楼层
就是你所谓的蛋鸡版,也就是量化精度降低的意思
C:\Users\washu>ollama show deepseek-r1:14b
Model
architecture qwen2
parameters 14.8B
context length 131072
embedding length 5120
quantization Q4_K_M
Parameters
stop "<|begin▁of▁sentence|>"
stop "<|end▁of▁sentence|>"
stop "<|User|>"
stop "<|Assistant|>"
License
MIT License
Copyright (c) 2023 DeepSeek
从这里看,我跑的 DSR1-14b 不仅是 DSR1 的 14b 残血版,量化精度也降低到 INT4,而原始的 DSR1 是 671b,量化精度 F8 |
|