vLLM
vLLM 可以把本地或自托管模型暴露为 OpenAI-compatible HTTP API。Fased 通过vllm provider 连接该端点。
默认本地地址:
http://127.0.0.1:8000/v1
快速设置
- 启动 vLLM 的 OpenAI-compatible server。
- 设置一个 opt-in key。如果你的服务没有认证,任意值即可:
- 在 Agent > Models 选择或添加
vllm/<model-id>。
自动发现
当VLLM_API_KEY 存在,并且没有显式配置 models.providers.vllm 时,Fased 会请求:
显式配置
request.allowPrivateNetwork: true。