回到 Blog 中文 EN

AI Agent 入門完整指南
從使用到自己做

AI Agent 是 2026 年最熱的概念、也最容易被神化。這篇拆給你看 ─ 什麼是 Agent、跟 ChatBot 差在哪、Claude Code / Cursor Agent / MCP 怎麼用、6 個你今天就能做的實作場景、跟 4 個踩雷區。

※ 本文 AI 工具進展速度極快、寫作當下(2026 年 5 月)為準。具體 API、功能、價格請以官方文件為主。

先講清楚 ─ Agent vs ChatBot

很多人混為一談、其實差很多。

  • ChatBot:你、AI 。一輪結束。
  • Agent:你給目標、AI 自己規劃 + 執行 + 修正、直到完成。

舉例 ─ 「幫我整理上週 email、找出需要回覆的、寫草稿」:

  • ChatBot:「好的、請把 email 貼給我
  • Agent:自己連 Gmail API、讀信、判斷哪些要回、寫草稿、放進 draft folder ─ 全自動

差別的核心:Agent 能用工具(tool use)、能多步推理、能自我修正


Agent 的4 個核心能力

  1. 計畫(Planning)─ 把大目標拆成可執行的小步驟
  2. 工具使用(Tool Use)─ 呼叫外部 API、跑指令、讀檔
  3. 記憶(Memory)─ 記住對話過程跟中間結果
  4. 反思(Reflection)─ 檢查自己做得對不對、錯了會調整

目前的 AI Agent(Claude Code、Cursor Agent、GitHub Copilot Agent)在這 4 項上的成熟度大概是 ─ 計畫跟工具使用很強、記憶跟反思還在進化。


3 種你現在就能用的 Agent

01 Claude Code(CLI)

Anthropic 出的 terminal-based AI agent。

它能做的:

  • 在你的 codebase 跑、讀檔、改檔
  • 跑 shell command(包含 git)
  • 規劃多步重構
  • 讀 error log、自己 debug
  • 透過 MCP 接外部工具

用法:在你的 project 目錄跑 claude、給目標、它自己動。

02 Cursor Agent

Cursor IDE 內建的 agent mode(之前叫 Composer)。

它能做的:

  • 跨多個檔案改動
  • 讀 codebase 找相關 context
  • @ 引用特定 file / docs
  • 跑指令、看 output

適合:在 IDE 內、需要視覺化看 diff 的人。

03 GitHub Copilot Agent

GitHub 出的 PR-level agent。

它能做的:

  • 接 issue、自動寫 PR
  • 跑 CI、看結果、修錯
  • 跟 reviewer comment 互動

適合:把 well-defined task 整段 outsource 給 AI 的場景。


MCP(Model Context Protocol)─ 讓 Agent 接你的工具

MCP 是 Anthropic 提出的開源協議、目的是讓 AI Agent 跟你的工具 / 資料庫 / 服務「用統一方式對話」。

沒有 MCP 的世界:

  • 你要接 Slack → 寫 Slack 串接
  • 你要接 GitHub → 寫 GitHub 串接
  • 你要接 Postgres → 寫 DB 串接
  • 每個 agent 都要重做一次

有 MCP 的世界:

  • 有人寫好 Slack MCP server
  • 有人寫好 GitHub MCP server
  • 你的 agent 一行 config、就能用所有 MCP servers

它在做的事 ─「API 之於程式設計」就是「MCP 之於 AI Agent」。

已經有大量公開 MCP servers:filesystem、GitHub、Slack、Postgres、Linear、Notion⋯⋯ 直接拿來用。


6 個你今天就能做的實作場景

① 自動整理每日 standup

難度 ⭐⭐ · 工具:Claude Code + GitHub MCP

每天早上:Agent 自動讀你昨天的 GitHub commits、PR comments、Slack 訊息、整理成 standup 草稿、貼到你的 Notion / 私訊。

價值:省你每天 10 分鐘整理、且不容易漏。

② Code review 第一輪自動 review

難度 ⭐⭐⭐ · 工具:GitHub Copilot Agent / CodeRabbit

PR 開出來、Agent 自動跑:抓 lint、檢查 typo、看是不是漏寫測試、給初步建議。

價值:人類 reviewer 不用浪費時間挑分號、能專注架構討論。

③ 客服 / FAQ 自動回答

難度 ⭐⭐⭐ · 工具:Claude API + 你的 docs

把產品文件丟給 Agent、它讀完、能回答用戶常見問題。複雜問題自動 escalate 給人。

價值:替小團隊省下大量客服時間。

④ 履歷 / 求職信生成

難度 ⭐⭐ · 工具:Claude API + 你的背景資料

給 Agent 你的經歷、它根據每份 JD 客製化求職信、改履歷重點。

價值:求職期投 100 份履歷不再需要 100 小時。

⑤ 內部知識庫問答

難度 ⭐⭐⭐⭐ · 工具:Claude + Vector DB + 你的內部資料

把公司 Notion / Confluence / Slack history 變成 Agent 能查的知識庫。新人不用問人、直接問 Agent。

價值:onboarding 時間大幅縮短。

⑥ 自動爬蟲 + 資料整理

難度 ⭐⭐⭐ · 工具:Claude Code + Playwright MCP

幫我每天看這 5 個競品網站、有變動就整理寄信給我」 ─ Agent 自己排程、爬、判斷有沒有變動、整理。

價值:市場研究 / 競品追蹤的自動化。


自己做第一個 Agent ─ 3 步驟

步驟 1:選 framework / SDK

  • Anthropic SDK ─ 用 Claude、原生支援 tool use + MCP
  • OpenAI SDK ─ 用 GPT、有 function calling、生態系大
  • LangChain ─ 抽象層、能跨 LLM、但學習曲線陡
  • Mastra / Vercel AI SDK ─ TypeScript-first、適合做 web app

新手建議直接用 Anthropic / OpenAI SDK、別急著上 LangChain。

步驟 2:定義 Tools

Tools 是 Agent 能呼叫的「外部能力」。例如:

// 用 Anthropic SDK 為例
const tools = [
  {
    name: "search_email",
    description: "搜尋使用者 Gmail",
    input_schema: {
      type: "object",
      properties: {
        query: { type: "string" }
      }
    }
  },
  {
    name: "send_email",
    description: "寄 email",
    input_schema: {
      type: "object",
      properties: {
        to: { type: "string" },
        subject: { type: "string" },
        body: { type: "string" }
      }
    }
  }
]

步驟 3:寫 Agent loop

async function runAgent(userGoal) {
  const messages = [{ role: "user", content: userGoal }]

  while (true) {
    const response = await claude.messages.create({
      model: "claude-sonnet",
      tools,
      messages
    })

    // Agent 想用工具
    if (response.stop_reason === "tool_use") {
      const toolCall = response.content.find(c => c.type === "tool_use")
      const result = await executeTool(toolCall.name, toolCall.input)

      messages.push({ role: "assistant", content: response.content })
      messages.push({
        role: "user",
        content: [{ type: "tool_result", tool_use_id: toolCall.id, content: result }]
      })
      continue
    }

    // Agent 做完了
    return response.content
  }
}

這就是最簡 Agent loop ─ 呼 LLM、執行工具、再呼 LLM、直到 done。


4 個踩雷區

01 把 Agent 當魔法

很多人以為「Agent = 全自動」 ─ 然後給它一個複雜任務、失望它做錯。

現實 ─ Agent 在「well-defined 的小任務」很強、在「模糊的大任務」會卡住。

原則 ─ 你把任務拆得越具體、Agent 跑得越好

02太多權限

Agent 能執行任意指令 → 可能不小心刪掉你 production DB

安全做法:

  • 讀比寫優先:先給讀 API、確認安全再給寫
  • 用 read-only credentials 開發、production 才換 write
  • 重要操作(delete、deploy)強制人類確認
  • 日誌每個 tool call、定期 review

03 沒設成本上限

Agent loop 可能會「停不下來」 ─ 一直思考、一直呼 API、$$$ 就燒光。

一定要設:

  • Max iterations(loop 上限、如 20 次)
  • Max tokens(單次呼叫上限)
  • Daily budget(每日花費上限)

04 用 Agent 取代「不該被自動化的事

有些事適合 Agent、有些不適合:

  • ✅ 重複、規則清楚、錯了影響小 ─ 適合
  • ❌ 需要判斷脈絡、責任重大、錯了難挽回 ─ 不適合

別把「跟客戶溝通」「處理付款」「刪除資料」直接交給 Agent。


AI Agent 未來怎麼走

現在(2026 年)的 Agent 階段:

  • 1 個任務、Agent 自動完成 ✅
  • 多個 Agent 互相協作(Multi-agent) ⚠️ 早期
  • Agent 自我學習、修正策略 ⚠️ 研究中

5 年內可能看到的:

  • 個人 Agent ─ 像私人助理、長期記得你偏好
  • 企業 Agent ─ 取代部分初階 ops 工作
  • Agent marketplace ─ 訂閱別人寫好的 Agent

不要被新聞嚇到。技術曲線會比 hype 慢、實際進入工作流程要 3-5 年。


最後一個提醒

AI Agent 不是取代工程師、是放大工程師
會用 Agent 的工程師 ─ 1 個人能做 3 個人的事。
不會用的工程師 ─ 跟會用的同事相比、會越來越慢。

這個工具沒有想像中神奇、也沒有想像中簡單。它的價值在「你把它放在哪個工作流程裡」

這週開始 ─ 找你工作裡最重複、最無聊的 1 件事、想想能不能用 Agent 自動化。做出來、你會明白為什麼這是趨勢。

想做 Agent 但不知道從哪開始?

30 分鐘 1-on-1 諮詢 NT$1,500 ─ 我幫你看你想自動化的場景、給你具體技術選擇 + 第一週實作 SOP。

LINE 預約諮詢 先訂閱 Newsletter

延伸閱讀 ─ AI 時代工程師系列