2026 年免費 LLM API 完整清單:實測 15 家・無需信用卡(台灣可用)
實測 15 家 2026 年仍真正可用的免費 LLM API:BazaarLink auto:free 永久免費、Groq 最快、Google Gemini 1M context、OpenRouter 模型最廣。台灣可註冊、OpenAI SDK 相容、含三聯式發票方案。
在 2026 年,「免費 LLM API」已經從少數幾家擴張到十幾家。本文實測 15 家目前真正可用、無需信用卡、或提供長期免費額度的供應商,依「上手難度 × 免費額度 × OpenAI 相容性 × 台灣可用性」整理成單一清單。
結論先講: 想用單一 API key、OpenAI SDK 直接接、可同時呼叫 GPT-4o / Claude / Gemini 開源模型的人,BazaarLink 的 auto:free 是上手最快的選擇——無需綁卡、不是試用、簽到額度用完仍可繼續呼叫。需要最快推論速度看 Groq;要最廣模型清單看 OpenRouter;要免費 1M context 看 Google AI Studio。
📅 最後更新:2026-05-18 | 涵蓋 15 家供應商
📝 更新紀錄:
- 2026-05:新增 BazaarLink
auto:free路由、Cerebras、GitHub Models、SiliconFlow;移除已停止運作的 OpenAI Free Trial- 2026-04:初版
快速比較表
| 供應商 | 免費額度 | 信用卡 | OpenAI 相容 | 台灣可用 |
|---|---|---|---|---|
| BazaarLink | auto:free 永久免費 + 10 RPM / 150 req/day | ❌ | ✅ 完整 | ✅ |
| OpenRouter | 多家免費模型,~200 req/day/model | ❌ | ✅ 完整 | ✅ |
| Groq | Llama / Gemma 系列,~6,000 tok/min | ❌ | ✅ 完整 | ✅ |
| Google AI Studio | Gemini 1.5 Flash 1,500 req/day | ❌ | 🟡 部分 | ✅ |
| Together AI | $25 試用點數 | ❌(試用) | ✅ 完整 | ✅ |
| NVIDIA NIM | 150+ 模型免費試用額度 | ❌ | 🟡 部分 | ✅ |
| SiliconFlow | DeepSeek / Qwen 永久免費層 | ❌ | ✅ 完整 | ✅ |
| Mistral La Plateforme | 試用點數 + 部分模型免費 | ❌ | 🟡 自家格式 | ✅ |
| DeepSeek 官方 | DeepSeek-V3 / R1 帳號送點數 | ❌ | ✅ 完整 | ✅ |
| Cerebras | Llama 3.3 70B 免費,速度最快 | ❌ | ✅ 完整 | ✅ |
| GitHub Models | GitHub 帳號送額度 | ❌ | 🟡 自家 SDK | ✅ |
| Cloudflare Workers AI | Workers 帳號免費層 | ❌ | 🟡 部分 | ✅ |
| Fireworks AI | $1 試用點數 | ❌(試用) | ✅ 完整 | ✅ |
| Hugging Face Inference | 公開模型免費呼叫 | ❌ | 🟡 自家 SDK | ✅ |
| Hyperbolic | 註冊送 $10 試用 | ❌(試用) | ✅ 完整 | ✅ |
1. BazaarLink — 最快上手、auto:free 永久免費
BazaarLink 提供 OpenAI 相容的免費 API,無需綁信用卡。核心特色是 auto:free ——一個虛擬 model ID,會自動把你的請求路由到當下可用的免費模型(Llama、Gemma、Qwen、DeepSeek 等 open-weight 系列)。
為什麼上手最快:你寫過 OpenAI SDK 的話,只要改兩個參數就能跑:
from openai import OpenAI
client = OpenAI(
base_url="https://bazaarlink.ai/api/v1",
api_key="sk-bl-YOUR_FREE_KEY",
)
response = client.chat.completions.create(
model="auto:free",
messages=[{"role": "user", "content": "解釋 Transformer 模型"}],
)
print(response.choices[0].message.content)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://bazaarlink.ai/api/v1",
apiKey: "sk-bl-YOUR_FREE_KEY",
});
const res = await client.chat.completions.create({
model: "auto:free",
messages: [{ role: "user", content: "Hello" }],
});
免費額度:10 RPM / 150 req/day。首次儲值(任意金額)後升為 20 RPM / 300 req/day。Signup credit 用完後 auto:free 仍可繼續使用,不是試用制。
對台灣開發者特別有用的點:
- 台幣計費 + 三聯式統一發票(升級到付費模型時)
- 統編支援,可開公司戶發票
- 完整 OpenAI SDK 相容(streaming、function calling、vision、embeddings)
- AI Agent 可程式化自註冊 API key(
POST /api/v1/agents/register),不需人工介入 - 同一支 API key 可呼叫 GPT-4o、Claude、Gemini、DeepSeek(升級到付費後)
限制:免費額度針對個人開發、原型驗證;高頻生產需要儲值升級。免費路由的模型清單會隨供應商可用性調整。
💡 想驗證你接的 API 是不是被偷換模型 / token 注水?BazaarLink Probe 可以實測任何 OpenAI 相容端點的模型一致性,免費。
30 秒拿到 API key
- 到 bazaarlink.ai/free
- Email 註冊(無需信用卡)
- 到
/keys建立 API key - base_url 設成
https://bazaarlink.ai/api/v1,model 設成auto:free,開跑
2. OpenRouter — 最廣模型清單
OpenRouter 聚合全球數百個模型,免費層通常涵蓋 20-30 個 open-source 模型,包括 Llama 3.3、Mistral、Gemma、DeepSeek 等。
免費額度:每個模型約 200 req/day、20 RPM。在尖峰時段限額會收緊。
適合誰:想在多個模型間實驗、比較風格與品質的開發者。模型廣度是業界第一。
限制:免費模型可用性會浮動,不適合單一穩定端點的生產用途。國際信用卡才能升級到付費層。台灣團隊報帳需要的統一發票他們不提供。
3. Groq — 速度王
Groq 自家的 LPU(Language Processing Unit)硬體跑 LLM 推論比 GPU 快 10-20 倍。語音 AI、即時對話、需要低延遲的 pipeline 特別適合。
免費模型:Llama 3.3 70B、Llama 3.1 8B、Mixtral 8x7B、Gemma 2 9B 等。清單會定期更新。
免費額度:Llama 3.3 70B 約 6,000 tok/min、14,400 tok/day。小模型額度更高。
限制:只跑自家上架的模型。沒有 GPT-4o、Claude、Gemini。需要這些就要找別家或聚合平台。
4. Google AI Studio — Gemini 免費入口
Google 官方提供 Gemini 系列的免費 REST API。Gemini 1.5 Flash 是亮點:免費就有 1M token context window、跑得快、原生支援圖片。
免費額度:Gemini 1.5 Flash 1,500 req/day、15 RPM。Pro 模型限額更緊。
限制:原生 API 用 Google 自家格式,不是 OpenAI 標準。雖然有提供 OpenAI 相容端點,但部分 SDK 功能(function calling 細節、streaming chunk 格式)行為不一致。
5. Together AI — Fine-tune 友善
註冊送 $25 點數,是試用而非永久免費,但點數量比一般試用大。唯一一家免費層支援 open-source 模型 fine-tuning 的供應商。
適合誰:要在 Llama / Mistral 上用自己資料做 fine-tune 後再生產的團隊。
一般推論用途:其他家撐得更久。
6. NVIDIA NIM — 黃仁勳的 150+ 模型
NVIDIA 在 build.nvidia.com 提供 NIM(NVIDIA Inference Microservices)平台,註冊送免費試用點數,可呼叫 150+ 個模型包括 DeepSeek、Kimi、GLM、Qwen、MiniMax 等。
免費額度:每個模型約 1,000 次免費呼叫(不同模型不同)。
限制:API 介面是 NVIDIA 自家規格,需要小幅改寫。試用點數用完要轉付費或重新申請。
7. SiliconFlow — 中國聚合,永久免費層
SiliconFlow 提供 OpenAI 相容的聚合 API,部分模型有永久免費層,包括 DeepSeek-V3、Qwen 系列、Llama 系列。
免費額度:依模型,多數約 1,000-2,000 req/day。
台灣可用性:可正常註冊使用,但中國公司運營,企業用戶需評估資料合規性。台灣統一發票他們不提供。
8. Mistral La Plateforme — 歐洲開源
Mistral 自家平台提供註冊試用點數 + 部分模型(如 mistral-small、open-mistral-nemo)的免費層。
免費額度:依模型,新註冊有試用點數。
限制:自家 API 格式,要用他們的 SDK 或 langchain mistral 套件。OpenAI 相容性需透過第三方聚合(OpenRouter、BazaarLink)。
9. DeepSeek 官方 — V3 / R1 強模型
DeepSeek 自家 API,註冊送點數可用 DeepSeek-V3 和 DeepSeek-R1。價格本身在業界最低,即使付費也比多數家便宜。
免費額度:註冊送 $5-10 點數(依活動)。
OpenAI 相容:完整支援,只要改 base_url。
限制:中國公司運營,企業用戶評估資料合規性同上。
10. Cerebras — 全球最快推論
Cerebras 用自家 Wafer-Scale Engine 跑 Llama,Llama 3.3 70B 的推論速度官方宣稱比 Groq 還快(依場景 1.5-3x)。
免費額度:Llama 3.3 70B 免費層每分鐘約 30 req,每小時約 900 req。
OpenAI 相容:完整。
限制:只跑 Llama 系列、模型清單比 Groq 窄。試用穩定性偶有波動。
11. GitHub Models — 微軟陣營免費試玩
GitHub 帳號可以直接到 github.com/marketplace/models 試用 GPT-4o、Claude、Llama、Mistral 等多家模型。
免費額度:每天約 50-150 req(依模型),用於原型驗證足夠。
限制:API 透過 Azure OpenAI 自家 SDK 或 REST,OpenAI SDK 相容需用 azure-openai。生產要轉付費的 Azure 帳號。
12. Cloudflare Workers AI — 邊緣 AI 免費層
Cloudflare Workers 帳號內建 Workers AI 額度,跑 Llama、Mistral、Stable Diffusion 等開源模型,可從 Workers 函式內直接呼叫。
免費額度:每天 10,000 個 Neurons(內部計量單位,約等於數千次小型請求)。
適合誰:已經在 Cloudflare Workers / Pages 上跑邊緣應用、希望就近呼叫 AI 的開發者。
限制:API 是 Workers 內部 binding 或 REST,OpenAI SDK 相容需自己包一層。
13. Fireworks AI — 商用聚合平台
Fireworks 是商用模型聚合,新註冊送 $1 試用點數。模型涵蓋 Llama、Mixtral、DeepSeek 等。
特色:速度快、企業級 SLA。
限制:免費試用量小,主要是讓你驗證再轉付費。
14. Hugging Face Inference API — 模型百科
Hugging Face 公開模型可透過 Inference API 免費呼叫。
免費額度:依模型,公開模型每月有一定額度。
限制:商業模型(GPT-4o、Claude 等)不在範圍,主要適合 BERT、Whisper、Stable Diffusion 等開源研究模型。API 是 HF 自家規格。
15. Hyperbolic — 開源模型 serving
Hyperbolic 註冊送 $10 試用點數,主要跑 open-source 模型(Llama、Qwen、DeepSeek 等)。
OpenAI 相容:完整。
限制:試用而非永久免費,量小。模型清單比 OpenRouter 窄。
怎麼選
| 你的狀況 | 推薦 |
|---|---|
| 剛開始、希望零摩擦上手 | BazaarLink — 無需綁卡、auto:free 永久免費、OpenAI SDK 直接接 |
| 想跨多家模型實驗 | OpenRouter — 模型清單最廣 |
| 需要最快推論(語音 AI、即時對話) | Groq 或 Cerebras |
| 需要 1M context 處理長文件 | Google AI Studio(Gemini Flash) |
| 要 fine-tune 自家資料 | Together AI |
| 在 Cloudflare Workers 上開發 | Cloudflare Workers AI |
| 台灣公司、需要統一發票報帳 | BazaarLink — 目前唯一提供台灣三聯式發票的聚合平台 |
| 建 AI Agent 想程式化拿 API key | BazaarLink — 提供 agent 自註冊 API |
| 想用 DeepSeek-V3 / R1 | DeepSeek 官方 或 BazaarLink |
常見坑與注意事項
「免費」要看細節:
- ❌ 試用點數型(Together、Hyperbolic、Mistral、Fireworks)——用完就停
- ✅ 永久免費層型(BazaarLink
auto:free、Groq、Google AI Studio、SiliconFlow 部分模型)——額度內可一直用
速率限制不是只看 req/day:很多家會額外限 RPM(requests per minute)、TPM(tokens per minute)、並發數。Agent 工作流尤其要看 RPM。
台灣可用性:所有上述 15 家在台灣都可正常註冊使用。但統一發票 / 統編 / TWD 計費只有 BazaarLink 提供,其他家是美金信用卡。報帳需求要先評估。
OpenAI SDK 相容性 ≠ 100% 一致:streaming chunk 格式、function calling 細節、tool_choice 行為、vision input 處理在不同家會有小差異。生產前一定要實測。
30 秒在 BazaarLink 拿免費 API key
✅ 無需信用卡。
auto:free不是試用——簽到額度用完仍可繼續呼叫。
選項 A:網頁註冊(2 分鐘)
- 到 bazaarlink.ai/free
- Email 註冊,無需信用卡
- 到
/keys建立 API key - OpenAI SDK 把 base_url 改成
https://bazaarlink.ai/api/v1
選項 B:AI Agent 程式化自註冊
AI Agent 一個 API 呼叫拿到金鑰,無需人工註冊:
curl -X POST https://bazaarlink.ai/api/v1/agents/register \
-H "Content-Type: application/json" \
-d '{"name": "my-agent"}'
# 回傳:{"api_key": "sk-bl-...", "free_model": "auto:free", "upgrade_url": "..."}
拿到 key 後,OpenAI SDK 所有功能都正常運作——streaming、function calling、vision、embeddings 都支援。
需要升級到付費(GPT-4o、Claude、Gemini)時,直接儲值、台幣計費、開三聯式發票——同一個 API key 不用換。