Tag: vLLM - Alpha Hinex's Blog

「 AI 」三月 23, 2025

文章字数 47k 阅读约需 42 mins.

在 DeepSeek-R1 的官方 GitHub 仓库中，有如下一段推荐用法：

其中黑体字高亮的第二点提到：

避免添加系统提示词；所有指令应该被包含进用户提示词中。

这与其他 LLM 的通常用法有...

查看全文

「 AI 」十二月 22, 2024

文章字数 14k 阅读约需 13 mins.

本文记录了在两台机器，每台机器一块 Tesla T4 显卡的环境下，使用 vLLM 部署 Qwen2.5-32B-Instruct-GPTQ-Int4 模型的过程及遇到的问题，供类似环境使用 vLLM 进行多节点多卡推理参考。

# qwen
$ git clone...

查看全文