Hugging Face Inference
Hugging Face Inference Providers 通过一个 router API 提供 OpenAI-compatible chat completions。Fased 使用 chat completions 路由,不把图像生成、embedding 或语音端点暴露为这个 provider。- Provider:
huggingface - Auth:
HUGGINGFACE_HUB_TOKEN或HF_TOKEN - API:OpenAI-compatible
- Base URL:
https://router.huggingface.co/v1
快速设置
- 在 Hugging Face 创建 fine-grained token,并启用 Make calls to Inference Providers 权限。
- 运行 onboarding:
- 在浏览器打开 Agents,选择 Agent,然后使用 Agent > Models 为该 Agent 设置 Hugging Face 模型角色。
模型发现
Fased 会请求:内置示例模型
huggingface/openai/gpt-oss-120bhuggingface/deepseek-ai/DeepSeek-V4-Prohuggingface/moonshotai/Kimi-K2.6huggingface/MiniMaxAI/MiniMax-M2.7huggingface/zai-org/GLM-5.1huggingface/Qwen/Qwen3.6-35B-A3Bhuggingface/Qwen/Qwen3.5-397B-A17Bhuggingface/Qwen/Qwen3-Coder-Nexthuggingface/Qwen/Qwen3-Coder-480B-A35B-Instructhuggingface/google/gemma-4-31B-it
:fastest、:cheapest 或具体 backend 后缀,例如 :together。