vLLM 入门教程:零基础分步指南
在本教程中,将逐步展示如何配置和运行 vLLM,提供从安装到启动的完整入门指南。
目录
一、安装 vLLM
该教程基于 OpenBayes 云平台操作,该平台已完成 vllm==0.5.4 的安装。如果您在平台上操作,请跳过此步骤。如果您在本地部署,请按照以下步骤进行安装。
安装 vLLM 非常简单:
pip install vllm
请注意,vLLM 是使用 CUDA 12.1 编译的,因此您需要确保机器运行的是该版本的 CUDA。
检查 CUDA 版本,运行:
nvcc --version
如果您的 CUDA 版本不是 12.1,您可以安装与您当前 CUDA 版本兼容的 vLLM 版本(更多信息请参考安装说明),或者安装 CUDA 12.1。