AI Agents đang phát triển với tốc độ cực nhanh. Chúng ta có thể dùng ChatGPT để brainstorm, Claude Code để đọc codebase, Gemini CLI để thực thi tác vụ, hay các tool như Antigravity để thao tác trực tiếp với UI.
Nhưng sau giai đoạn “wow”, một vấn đề bắt đầu xuất hiện: AI rất mạnh, nhưng workflow sử dụng AI lại cực kỳ thủ công.
Người dùng phải:
- Copy-paste context giữa nhiều session
- Nhắc lại yêu cầu liên tục
- Theo dõi từng bước agent đang làm
- Chuyển đổi qua lại giữa nhiều model
- Quản lý context bị nhiễu sau thời gian dài
Bài viết này chia sẻ hành trình xây dựng một hệ thống Agent Teams — nơi nhiều AI agents có thể phối hợp, tự báo trạng thái, tự thực thi workflow và giảm tối đa sự can thiệp thủ công của con người.
Vì sao Agent Teams ra đời?
Ý tưởng bắt đầu từ một nhu cầu rất đơn giản: Muốn “nhàn hơn”, nhưng vẫn “chính xác hơn”.
Khi làm việc với AI hàng ngày, có ba vấn đề lớn xuất hiện.
1. Workflow quá thủ công
Một ngày có thể phải:
- Copy-paste giữa Claude, Gemini và Codex hàng chục lần
- Mở nhiều session khác nhau
- Nhắc lại context cho từng agent
- Ngồi canh agent để trả lời câu hỏi phát sinh
AI lúc này giống một intern cực mạnh — nhưng cần người giám sát liên tục.
2. Context ngày càng hỗn loạn
Sau nhiều tác vụ liên tiếp:
- Context bị dài
- Agent bắt đầu “quên” yêu cầu cũ
- Task trước ảnh hưởng task sau
- Câu trả lời lệch hướng dần theo thời gian
Đây là vấn đề phổ biến khi làm việc với AI ở quy mô lớn.
3. Mỗi model mạnh một kiểu
- Claude mạnh reasoning
- Gemini mạnh tốc độ và context lớn
- Codex mạnh coding execution
Nhưng việc phối hợp nhiều model lại rất bất tiện.
Kết quả là:
- Workflow bị phân mảnh
- Chi phí tăng
- Hiệu suất không ổn định
AI Tools Không Hoạt Động Cùng Một Tầng
Một insight quan trọng là: Không phải AI tool nào cũng giống nhau, chúng hoạt động ở các “tầng” khác nhau.
| Tầng | Vai trò | Ví dụ |
| Conversation | Chat, hỏi đáp, tư vấn | ChatGPT, Claude Web, Gemini Web |
| Codebase | Đọc file, chạy lệnh, sửa code | Claude Code, Gemini CLI, Codex |
| Machine | Thao tác UI, browser, screen | Antigravity, Banana Pro |
Nguyên tắc rất thú vị: Càng gần machine → càng có nhiều context thực tế → càng ít phải mô tả bằng chữ.
Ví dụ:
- ChatGPT cần bạn mô tả UI
- Antigravity có thể “thấy” trực tiếp UI
- Claude Code có thể đọc toàn bộ codebase
Điều này thay đổi hoàn toàn cách thiết kế workflow AI.
Quy Trình 3 Bước Hoàn Chỉnh
Một workflow hiệu quả thường có ba giai đoạn.
1. Explore
Dùng đúng AI ở đúng tầng.
Ví dụ:
- Claude Code đọc codebase
- Antigravity phân tích UI
- ChatGPT brainstorm solution
Mục tiêu:
- Khám phá vấn đề
- Thu thập context
- Tạo định hướng
2. Consolidate
Biến kết quả chat thành tài liệu có cấu trúc.
Đây là nơi SDD (Spec Driven Development) phát huy tác dụng.
Thay vì: “Làm giúp tôi feature này”
Ta chuyển thành:
- Ai làm?
- Làm theo workflow nào?
- Output mong muốn là gì?
- Khi nào handoff?
3. Execute
Đẩy spec vào Agent Teams.
Lúc này:
- Agent được phân vai
- Task được chạy song song
- Hooks tự động báo trạng thái
- Con người chỉ review kết quả cuối
Đây là lúc AI bắt đầu hoạt động như một “team”.
TMUX — Infrastructure Quan Trọng Nhất
Một trong những insight thú vị nhất là: TMUX không chỉ là terminal tool.
Nó có thể trở thành: Message Bus cho AI Agents.
Thông qua:
- send-keys
- capture-pane
Các agent có thể:
- Gửi message cho nhau
- Nhận kết quả từ nhau
- Đồng bộ workflow
- Chạy song song độc lập
Điều quan trọng là: TMUX hoàn toàn provider-agnostic.
Nghĩa là:
- Claude
- Gemini
- Codex
- bất kỳ CLI agent nào
… đều có thể tham gia cùng một hệ thống.
Đây là nền tảng để xây dựng multi-agent orchestration.
Từ HITL Sang HOTL
Một vấn đề lớn của AI hiện nay là: Human In The Loop (HITL)
Con người phải:
- Chờ agent hoàn thành
- Trả lời từng câu hỏi
- Cho permission liên tục
- Theo dõi từng bước
Điều này khiến AI giống một công cụ hỗ trợ hơn là hệ thống tự vận hành.
HOTL — Human On The Loop
Thay vì tham gia từng bước, con người chỉ:
- Giám sát
- Nhận notification
- Review kết quả cuối
Để làm được điều đó, hệ thống cần Hooks.
Hooks — Khi Agent Tự Báo Cáo
Claude Code hỗ trợ hooks chạy shell command tại các thời điểm khác nhau trong lifecycle.
Ví dụ:
| Hook | Vai trò |
| SessionStart | Re-inject context |
| Stop | Báo task hoàn thành |
| Notification | Agent cần xác nhận |
| PostToolUse | Theo dõi tool usage |
Khi kết hợp với Squad Station:
- Agent tự gửi trạng thái
- Orchestrator tự điều phối
- Không cần polling
- Không cần ngồi canh terminal
Đây là bước chuyển rất lớn từ: “AI tool” → “AI system”
Context Management — Bài Toán Quan Trọng Nhất
Đa số vấn đề chất lượng AI đều quay về một điểm: Context.
Context Window Không Phải Vô Hạn
Khi conversation quá dài:
- Thông tin cũ bị đẩy ra ngoài
- Agent mất trí nhớ
- Workflow bị lệch hướng
Ô Nhiễm Context
Một vấn đề nguy hiểm hơn: Task trước ảnh hưởng task sau.
Ví dụ:
- Prompt cũ còn sót lại
- Workflow cũ vẫn active
- Rule cũ xung đột rule mới
Kết quả:
- Agent trả lời không ổn định
- Output thiếu nhất quán
- Chất lượng giảm mạnh
Compact — Con Dao Hai Lưỡi
Khi context đầy (~95%), Claude Code sẽ auto compact.
Nó giữ lại:
- CLAUDE.md
- Rules
- Auto Memory
- Git state
- MCP definitions
Nhưng loại bỏ:
- Conversation history
- Tool outputs cũ
- File content đã đọc
Insight cực kỳ quan trọng: Instruction chỉ tồn tại trong chat sẽ biến mất sau compact.
Muốn giữ lâu dài:
- Viết vào CLAUDE.md
- Hoặc Rules
/clear và /re — Hai Lệnh Quan Trọng
/clear
Dùng để:
- Xóa context bị nhiễu
- Làm sạch session
- Reset workflow
Nhưng đồng thời:
- Chat history biến mất
- Agent mất toàn bộ hội thoại
May mắn là:
- CLAUDE.md
- Auto Memory
… vẫn được reload tự động.
/re
Một kỹ thuật rất mạnh.
Thay vì: “Không đúng, thử lại đi”
Ta dùng /re để:
- Quay lại trước khi lỗi xảy ra
- Xóa nhánh reasoning sai
- Tiếp tục từ “điểm sạch”
Điều này giúp giảm context pollution rất nhiều.
SDD — Spec Driven Development
SDD là cách làm việc có cấu trúc với AI.
Thay vì chỉ chat tự do, ta định nghĩa:
- Role
- Workflow
- Output
- Handoff
- Quy trình kiểm tra
Một số framework phổ biến:
| Framework | Định hướng |
| BMAD | Structured workflow |
| Get Shit Done | Execution-focused |
| OpenSpec | Spec-centric |
| Superpowers | Autonomous agents |
SDD giúp AI:
- Giảm ambiguity
- Làm việc ổn định hơn
- Dễ orchestration hơn
Nhưng cũng có nhược điểm:
- Khó nhớ command
- Workflow cứng nhắc
- Cấu hình phức tạp
Đó là lý do cần một hệ thống orchestration tốt hơn.
Agent Teams — Khi AI Hoạt Động Như Một Team
Agent Teams là mô hình:
- Nhiều agent
- Nhiều vai trò
- Chạy song song
- Có orchestrator điều phối
Ví dụ:
- Planner agent
- Developer agent
- Reviewer agent
- QA agent
Mỗi agent:
- Có context riêng
- Có workflow riêng
- Có model phù hợp riêng
Orchestrator sẽ:
- Phân tích mục tiêu lớn
- Chia task
- Giao việc
- Thu kết quả
- Điều phối workflow
Đây là cách mở rộng khả năng AI vượt qua giới hạn của một agent đơn lẻ.
Claude Agent vs Squad Station
Một so sánh thú vị:
| Claude Agent | Squad Station |
| Chỉ dùng Claude | Mix nhiều provider |
| In-process | TMUX-based |
| Ít linh hoạt | Provider-agnostic |
| Workflow cố định | Hỗ trợ nhiều SDD |
Squad Station cho phép:
- Claude + Gemini + Codex cùng hoạt động
- Tự routing message
- Điều phối bằng playbook
- Setup nhanh bằng một lệnh
Ví dụ:
npx squad-station@latest install
Những Insight Quan Trọng Nhất
1. AI không thiếu sức mạnh — chúng thiếu hệ thống
Khả năng model không còn là bottleneck lớn nhất.
Workflow và orchestration mới là thứ quyết định hiệu quả.
2. TMUX là infrastructure
TMUX không chỉ là terminal multiplexer.
Nó có thể trở thành nền tảng giao tiếp cho toàn bộ AI system.
3. HOTL tốt hơn HITL
Con người không bị loại bỏ.
Con người được “nâng cấp” lên vai trò giám sát.
4. Context Management = Quality Control
Ai hiểu context window sẽ dùng AI hiệu quả hơn rất nhiều.
Nhược Điểm Của Agent Teams
Dù mạnh, Agent Teams vẫn có nhiều thách thức.
Độ phức tạp cao
- Khó orchestration
- Khó debug
- Khó maintain
Chi phí cao
- Chạy nhiều model cùng lúc
- Tốn token
- Tốn infrastructure
Hiệu suất không chắc chắn
- Parallelism không phải lúc nào cũng hiệu quả
- Context sync có thể lỗi
- Workflow có thể deadlock
Bảo mật và độ tin cậy
Khi nhiều agent tự động thực thi:
- Permission trở nên quan trọng
- Audit log cần rõ ràng
- Sandboxing cần chặt chẽ
Kết Luận
Hành trình xây dựng Agent Teams cho thấy một điều: Tương lai của AI không nằm ở “một model mạnh hơn”.
Mà nằm ở:
- orchestration
- infrastructure
- context management
- workflow design
Khi nhiều AI agents có thể:
- phối hợp
- tự giao tiếp
- tự báo trạng thái
- tự thực thi workflow
… chúng bắt đầu hoạt động giống một tổ chức thực sự.
Điều thú vị nhất là: Mục tiêu ban đầu chỉ là “muốn nhàn hơn”.
Nhưng kết quả cuối cùng lại là một hệ thống nơi: cả team AI vẫn hoạt động ngay cả khi con người không có mặt.
Vui lòng đăng nhập để bình luận.