deepseek部署请教

RTX4090(48G显存),i9处理器,128G内存,华硕 rog strix Z790-E,现在要部署一套大语言模型。按照vllm方式,不使用ollama,仅作DeepSeek(部署deepseek,同时再加一个专业小模型)的推理服务器,另外已经部署好了一台openwebui服务器,用于连接本服务器。想尽可能发挥gpu性能,请帮忙介绍一下在欧拉系统上的部署步骤。