AI Agent 入門完整指南
從使用到自己做
AI Agent 是 2026 年最熱的概念、也最容易被神化。這篇拆給你看 ─ 什麼是 Agent、跟 ChatBot 差在哪、Claude Code / Cursor Agent / MCP 怎麼用、6 個你今天就能做的實作場景、跟 4 個踩雷區。
※ 本文 AI 工具進展速度極快、寫作當下(2026 年 5 月)為準。具體 API、功能、價格請以官方文件為主。
先講清楚 ─ Agent vs ChatBot
很多人混為一談、其實差很多。
- ChatBot:你問、AI 答。一輪結束。
- Agent:你給目標、AI 自己規劃 + 執行 + 修正、直到完成。
舉例 ─ 「幫我整理上週 email、找出需要回覆的、寫草稿」:
- ChatBot:「好的、請把 email 貼給我」
- Agent:自己連 Gmail API、讀信、判斷哪些要回、寫草稿、放進 draft folder ─ 全自動
差別的核心:Agent 能用工具(tool use)、能多步推理、能自我修正。
Agent 的4 個核心能力
- 計畫(Planning)─ 把大目標拆成可執行的小步驟
- 工具使用(Tool Use)─ 呼叫外部 API、跑指令、讀檔
- 記憶(Memory)─ 記住對話過程跟中間結果
- 反思(Reflection)─ 檢查自己做得對不對、錯了會調整
目前的 AI Agent(Claude Code、Cursor Agent、GitHub Copilot Agent)在這 4 項上的成熟度大概是 ─ 計畫跟工具使用很強、記憶跟反思還在進化。
3 種你現在就能用的 Agent
01 Claude Code(CLI)
Anthropic 出的 terminal-based AI agent。
它能做的:
- 在你的 codebase 跑、讀檔、改檔
- 跑 shell command(包含 git)
- 規劃多步重構
- 讀 error log、自己 debug
- 透過 MCP 接外部工具
用法:在你的 project 目錄跑 claude、給目標、它自己動。
02 Cursor Agent
Cursor IDE 內建的 agent mode(之前叫 Composer)。
它能做的:
- 跨多個檔案改動
- 讀 codebase 找相關 context
- 用
@引用特定 file / docs - 跑指令、看 output
適合:在 IDE 內、需要視覺化看 diff 的人。
03 GitHub Copilot Agent
GitHub 出的 PR-level agent。
它能做的:
- 接 issue、自動寫 PR
- 跑 CI、看結果、修錯
- 跟 reviewer comment 互動
適合:把 well-defined task 整段 outsource 給 AI 的場景。
MCP(Model Context Protocol)─ 讓 Agent 接你的工具
MCP 是 Anthropic 提出的開源協議、目的是讓 AI Agent 跟你的工具 / 資料庫 / 服務「用統一方式對話」。
沒有 MCP 的世界:
- 你要接 Slack → 寫 Slack 串接
- 你要接 GitHub → 寫 GitHub 串接
- 你要接 Postgres → 寫 DB 串接
- 每個 agent 都要重做一次
有 MCP 的世界:
- 有人寫好 Slack MCP server
- 有人寫好 GitHub MCP server
- 你的 agent 一行 config、就能用所有 MCP servers
它在做的事 ─「API 之於程式設計」就是「MCP 之於 AI Agent」。
已經有大量公開 MCP servers:filesystem、GitHub、Slack、Postgres、Linear、Notion⋯⋯ 直接拿來用。
6 個你今天就能做的實作場景
① 自動整理每日 standup
每天早上:Agent 自動讀你昨天的 GitHub commits、PR comments、Slack 訊息、整理成 standup 草稿、貼到你的 Notion / 私訊。
價值:省你每天 10 分鐘整理、且不容易漏。
② Code review 第一輪自動 review
PR 開出來、Agent 自動跑:抓 lint、檢查 typo、看是不是漏寫測試、給初步建議。
價值:人類 reviewer 不用浪費時間挑分號、能專注架構討論。
③ 客服 / FAQ 自動回答
把產品文件丟給 Agent、它讀完、能回答用戶常見問題。複雜問題自動 escalate 給人。
價值:替小團隊省下大量客服時間。
④ 履歷 / 求職信生成
給 Agent 你的經歷、它根據每份 JD 客製化求職信、改履歷重點。
價值:求職期投 100 份履歷不再需要 100 小時。
⑤ 內部知識庫問答
把公司 Notion / Confluence / Slack history 變成 Agent 能查的知識庫。新人不用問人、直接問 Agent。
價值:onboarding 時間大幅縮短。
⑥ 自動爬蟲 + 資料整理
「幫我每天看這 5 個競品網站、有變動就整理寄信給我」 ─ Agent 自己排程、爬、判斷有沒有變動、整理。
價值:市場研究 / 競品追蹤的自動化。
自己做第一個 Agent ─ 3 步驟
步驟 1:選 framework / SDK
- Anthropic SDK ─ 用 Claude、原生支援 tool use + MCP
- OpenAI SDK ─ 用 GPT、有 function calling、生態系大
- LangChain ─ 抽象層、能跨 LLM、但學習曲線陡
- Mastra / Vercel AI SDK ─ TypeScript-first、適合做 web app
新手建議直接用 Anthropic / OpenAI SDK、別急著上 LangChain。
步驟 2:定義 Tools
Tools 是 Agent 能呼叫的「外部能力」。例如:
// 用 Anthropic SDK 為例
const tools = [
{
name: "search_email",
description: "搜尋使用者 Gmail",
input_schema: {
type: "object",
properties: {
query: { type: "string" }
}
}
},
{
name: "send_email",
description: "寄 email",
input_schema: {
type: "object",
properties: {
to: { type: "string" },
subject: { type: "string" },
body: { type: "string" }
}
}
}
]
步驟 3:寫 Agent loop
async function runAgent(userGoal) {
const messages = [{ role: "user", content: userGoal }]
while (true) {
const response = await claude.messages.create({
model: "claude-sonnet",
tools,
messages
})
// Agent 想用工具
if (response.stop_reason === "tool_use") {
const toolCall = response.content.find(c => c.type === "tool_use")
const result = await executeTool(toolCall.name, toolCall.input)
messages.push({ role: "assistant", content: response.content })
messages.push({
role: "user",
content: [{ type: "tool_result", tool_use_id: toolCall.id, content: result }]
})
continue
}
// Agent 做完了
return response.content
}
}
這就是最簡 Agent loop ─ 呼 LLM、執行工具、再呼 LLM、直到 done。
4 個踩雷區
01 把 Agent 當魔法
很多人以為「Agent = 全自動」 ─ 然後給它一個複雜任務、失望它做錯。
現實 ─ Agent 在「well-defined 的小任務」很強、在「模糊的大任務」會卡住。
原則 ─ 你把任務拆得越具體、Agent 跑得越好。
02 給太多權限
Agent 能執行任意指令 → 可能不小心刪掉你 production DB。
安全做法:
- 讀比寫優先:先給讀 API、確認安全再給寫
- 用 read-only credentials 開發、production 才換 write
- 重要操作(delete、deploy)強制人類確認
- 日誌每個 tool call、定期 review
03 沒設成本上限
Agent loop 可能會「停不下來」 ─ 一直思考、一直呼 API、$$$ 就燒光。
一定要設:
- Max iterations(loop 上限、如 20 次)
- Max tokens(單次呼叫上限)
- Daily budget(每日花費上限)
04 用 Agent 取代「不該被自動化的事」
有些事適合 Agent、有些不適合:
- ✅ 重複、規則清楚、錯了影響小 ─ 適合
- ❌ 需要判斷脈絡、責任重大、錯了難挽回 ─ 不適合
別把「跟客戶溝通」「處理付款」「刪除資料」直接交給 Agent。
AI Agent 未來怎麼走
現在(2026 年)的 Agent 階段:
- 1 個任務、Agent 自動完成 ✅
- 多個 Agent 互相協作(Multi-agent) ⚠️ 早期
- Agent 自我學習、修正策略 ⚠️ 研究中
5 年內可能看到的:
- 個人 Agent ─ 像私人助理、長期記得你偏好
- 企業 Agent ─ 取代部分初階 ops 工作
- Agent marketplace ─ 訂閱別人寫好的 Agent
但不要被新聞嚇到。技術曲線會比 hype 慢、實際進入工作流程要 3-5 年。
最後一個提醒
AI Agent 不是取代工程師、是放大工程師。
會用 Agent 的工程師 ─ 1 個人能做 3 個人的事。
不會用的工程師 ─ 跟會用的同事相比、會越來越慢。
這個工具沒有想像中神奇、也沒有想像中簡單。它的價值在「你把它放在哪個工作流程裡」。
這週開始 ─ 找你工作裡最重複、最無聊的 1 件事、想想能不能用 Agent 自動化。做出來、你會明白為什麼這是趨勢。
想做 Agent 但不知道從哪開始?
30 分鐘 1-on-1 諮詢 NT$1,500 ─ 我幫你看你想自動化的場景、給你具體技術選擇 + 第一週實作 SOP。