AI 三月 23, 2025

用不同姿势给 DeepSeek 提示词的效果对比实验

文章字数 47k 阅读约需 42 mins.

在 DeepSeek-R1 的官方 GitHub 仓库 中,有如下一段推荐用法:

其中黑体字高亮的第二点提到:

避免添加系统提示词;所有指令应该被包含进用户提示词中。

这与其他 LLM 的通常用法有...

查看全文

AI 十二月 22, 2024

用 vLLM 在多节点多卡上部署 Qwen2.5 以及进行推理

文章字数 14k 阅读约需 13 mins.

本文记录了在两台机器,每台机器一块 Tesla T4 显卡的环境下,使用 vLLM 部署 Qwen2.5-32B-Instruct-GPTQ-Int4 模型的过程及遇到的问题,供类似环境使用 vLLM 进行多节点多卡推理参考。

  1. Qwen2.5-32B-Instruct-GPTQ-Int4vLLM
  2. docker v27.4.0nvidia-container-toolkit v1.17.3
  3. Tesla T4 显卡驱动 v550.127.08 CUDA12.4
# qwen
$ git clone...
查看全文
0%