AI Agents đang phát triển với tốc độ cực nhanh. Chúng ta có thể dùng ChatGPT để brainstorm, Claude Code để đọc codebase, Gemini CLI để thực thi tác vụ, hay các tool như Antigravity để thao tác trực tiếp với UI.

Nhưng sau giai đoạn “wow”, một vấn đề bắt đầu xuất hiện: AI rất mạnh, nhưng workflow sử dụng AI lại cực kỳ thủ công.

Người dùng phải:

  • Copy-paste context giữa nhiều session
  • Nhắc lại yêu cầu liên tục
  • Theo dõi từng bước agent đang làm
  • Chuyển đổi qua lại giữa nhiều model
  • Quản lý context bị nhiễu sau thời gian dài

Bài viết này chia sẻ hành trình xây dựng một hệ thống Agent Teams — nơi nhiều AI agents có thể phối hợp, tự báo trạng thái, tự thực thi workflow và giảm tối đa sự can thiệp thủ công của con người.

Vì sao Agent Teams ra đời?

Ý tưởng bắt đầu từ một nhu cầu rất đơn giản: Muốn “nhàn hơn”, nhưng vẫn “chính xác hơn”.

Khi làm việc với AI hàng ngày, có ba vấn đề lớn xuất hiện.

1. Workflow quá thủ công

Một ngày có thể phải:

  • Copy-paste giữa Claude, Gemini và Codex hàng chục lần
  • Mở nhiều session khác nhau
  • Nhắc lại context cho từng agent
  • Ngồi canh agent để trả lời câu hỏi phát sinh

AI lúc này giống một intern cực mạnh — nhưng cần người giám sát liên tục.

2. Context ngày càng hỗn loạn

Sau nhiều tác vụ liên tiếp:

  • Context bị dài
  • Agent bắt đầu “quên” yêu cầu cũ
  • Task trước ảnh hưởng task sau
  • Câu trả lời lệch hướng dần theo thời gian

Đây là vấn đề phổ biến khi làm việc với AI ở quy mô lớn.

3. Mỗi model mạnh một kiểu

  • Claude mạnh reasoning
  • Gemini mạnh tốc độ và context lớn
  • Codex mạnh coding execution

Nhưng việc phối hợp nhiều model lại rất bất tiện.

Kết quả là:

  • Workflow bị phân mảnh
  • Chi phí tăng
  • Hiệu suất không ổn định

AI Tools Không Hoạt Động Cùng Một Tầng

Một insight quan trọng là: Không phải AI tool nào cũng giống nhau, chúng hoạt động ở các “tầng” khác nhau.

Tầng Vai trò Ví dụ
Conversation Chat, hỏi đáp, tư vấn ChatGPT, Claude Web, Gemini Web
Codebase Đọc file, chạy lệnh, sửa code Claude Code, Gemini CLI, Codex
Machine Thao tác UI, browser, screen Antigravity, Banana Pro

Nguyên tắc rất thú vị: Càng gần machine → càng có nhiều context thực tế → càng ít phải mô tả bằng chữ.

Ví dụ:

  • ChatGPT cần bạn mô tả UI
  • Antigravity có thể “thấy” trực tiếp UI
  • Claude Code có thể đọc toàn bộ codebase

Điều này thay đổi hoàn toàn cách thiết kế workflow AI.

Quy Trình 3 Bước Hoàn Chỉnh

Một workflow hiệu quả thường có ba giai đoạn.

1. Explore

Dùng đúng AI ở đúng tầng.

Ví dụ:

  • Claude Code đọc codebase
  • Antigravity phân tích UI
  • ChatGPT brainstorm solution

Mục tiêu:

  • Khám phá vấn đề
  • Thu thập context
  • Tạo định hướng

2. Consolidate

Biến kết quả chat thành tài liệu có cấu trúc.

Đây là nơi SDD (Spec Driven Development) phát huy tác dụng.

Thay vì: “Làm giúp tôi feature này”

Ta chuyển thành:

  • Ai làm?
  • Làm theo workflow nào?
  • Output mong muốn là gì?
  • Khi nào handoff?

3. Execute

Đẩy spec vào Agent Teams.

Lúc này:

  • Agent được phân vai
  • Task được chạy song song
  • Hooks tự động báo trạng thái
  • Con người chỉ review kết quả cuối

Đây là lúc AI bắt đầu hoạt động như một “team”.

TMUX — Infrastructure Quan Trọng Nhất

Một trong những insight thú vị nhất là: TMUX không chỉ là terminal tool.

Nó có thể trở thành: Message Bus cho AI Agents.

Thông qua:

  • send-keys
  • capture-pane

Các agent có thể:

  • Gửi message cho nhau
  • Nhận kết quả từ nhau
  • Đồng bộ workflow
  • Chạy song song độc lập

Điều quan trọng là: TMUX hoàn toàn provider-agnostic.

Nghĩa là:

  • Claude
  • Gemini
  • Codex
  • bất kỳ CLI agent nào

… đều có thể tham gia cùng một hệ thống.

Đây là nền tảng để xây dựng multi-agent orchestration.

Từ HITL Sang HOTL

Một vấn đề lớn của AI hiện nay là: Human In The Loop (HITL)

Con người phải:

  • Chờ agent hoàn thành
  • Trả lời từng câu hỏi
  • Cho permission liên tục
  • Theo dõi từng bước

Điều này khiến AI giống một công cụ hỗ trợ hơn là hệ thống tự vận hành.

HOTL — Human On The Loop

Thay vì tham gia từng bước, con người chỉ:

  • Giám sát
  • Nhận notification
  • Review kết quả cuối

Để làm được điều đó, hệ thống cần Hooks.

Hooks — Khi Agent Tự Báo Cáo

Claude Code hỗ trợ hooks chạy shell command tại các thời điểm khác nhau trong lifecycle.

Ví dụ:

Hook Vai trò
SessionStart Re-inject context
Stop Báo task hoàn thành
Notification Agent cần xác nhận
PostToolUse Theo dõi tool usage

Khi kết hợp với Squad Station:

  • Agent tự gửi trạng thái
  • Orchestrator tự điều phối
  • Không cần polling
  • Không cần ngồi canh terminal

Đây là bước chuyển rất lớn từ: “AI tool” → “AI system”

Context Management — Bài Toán Quan Trọng Nhất

Đa số vấn đề chất lượng AI đều quay về một điểm: Context.

Context Window Không Phải Vô Hạn

Khi conversation quá dài:

  • Thông tin cũ bị đẩy ra ngoài
  • Agent mất trí nhớ
  • Workflow bị lệch hướng

Ô Nhiễm Context

Một vấn đề nguy hiểm hơn: Task trước ảnh hưởng task sau.

Ví dụ:

  • Prompt cũ còn sót lại
  • Workflow cũ vẫn active
  • Rule cũ xung đột rule mới

Kết quả:

  • Agent trả lời không ổn định
  • Output thiếu nhất quán
  • Chất lượng giảm mạnh

Compact — Con Dao Hai Lưỡi

Khi context đầy (~95%), Claude Code sẽ auto compact.

Nó giữ lại:

  • CLAUDE.md
  • Rules
  • Auto Memory
  • Git state
  • MCP definitions

Nhưng loại bỏ:

  • Conversation history
  • Tool outputs cũ
  • File content đã đọc

Insight cực kỳ quan trọng: Instruction chỉ tồn tại trong chat sẽ biến mất sau compact.

Muốn giữ lâu dài:

  • Viết vào CLAUDE.md
  • Hoặc Rules

/clear và /re — Hai Lệnh Quan Trọng

/clear

Dùng để:

  • Xóa context bị nhiễu
  • Làm sạch session
  • Reset workflow

Nhưng đồng thời:

  • Chat history biến mất
  • Agent mất toàn bộ hội thoại

May mắn là:

  • CLAUDE.md
  • Auto Memory

… vẫn được reload tự động.

/re

Một kỹ thuật rất mạnh.

Thay vì: “Không đúng, thử lại đi”

Ta dùng /re để:

  • Quay lại trước khi lỗi xảy ra
  • Xóa nhánh reasoning sai
  • Tiếp tục từ “điểm sạch”

Điều này giúp giảm context pollution rất nhiều.

SDD — Spec Driven Development

SDD là cách làm việc có cấu trúc với AI.

Thay vì chỉ chat tự do, ta định nghĩa:

  • Role
  • Workflow
  • Output
  • Handoff
  • Quy trình kiểm tra

Một số framework phổ biến:

Framework Định hướng
BMAD Structured workflow
Get Shit Done Execution-focused
OpenSpec Spec-centric
Superpowers Autonomous agents

SDD giúp AI:

  • Giảm ambiguity
  • Làm việc ổn định hơn
  • Dễ orchestration hơn

Nhưng cũng có nhược điểm:

  • Khó nhớ command
  • Workflow cứng nhắc
  • Cấu hình phức tạp

Đó là lý do cần một hệ thống orchestration tốt hơn.

Agent Teams — Khi AI Hoạt Động Như Một Team

Agent Teams là mô hình:

  • Nhiều agent
  • Nhiều vai trò
  • Chạy song song
  • Có orchestrator điều phối

Ví dụ:

  • Planner agent
  • Developer agent
  • Reviewer agent
  • QA agent

Mỗi agent:

  • Có context riêng
  • Có workflow riêng
  • Có model phù hợp riêng

Orchestrator sẽ:

  • Phân tích mục tiêu lớn
  • Chia task
  • Giao việc
  • Thu kết quả
  • Điều phối workflow

Đây là cách mở rộng khả năng AI vượt qua giới hạn của một agent đơn lẻ.

Claude Agent vs Squad Station

Một so sánh thú vị:

Claude Agent Squad Station
Chỉ dùng Claude Mix nhiều provider
In-process TMUX-based
Ít linh hoạt Provider-agnostic
Workflow cố định Hỗ trợ nhiều SDD

Squad Station cho phép:

  • Claude + Gemini + Codex cùng hoạt động
  • Tự routing message
  • Điều phối bằng playbook
  • Setup nhanh bằng một lệnh

Ví dụ:

npx squad-station@latest install

Những Insight Quan Trọng Nhất

1. AI không thiếu sức mạnh — chúng thiếu hệ thống

Khả năng model không còn là bottleneck lớn nhất.

Workflow và orchestration mới là thứ quyết định hiệu quả.

2. TMUX là infrastructure

TMUX không chỉ là terminal multiplexer.

Nó có thể trở thành nền tảng giao tiếp cho toàn bộ AI system.

3. HOTL tốt hơn HITL

Con người không bị loại bỏ.

Con người được “nâng cấp” lên vai trò giám sát.

4. Context Management = Quality Control

Ai hiểu context window sẽ dùng AI hiệu quả hơn rất nhiều.

Nhược Điểm Của Agent Teams

Dù mạnh, Agent Teams vẫn có nhiều thách thức.

Độ phức tạp cao

  • Khó orchestration
  • Khó debug
  • Khó maintain

Chi phí cao

  • Chạy nhiều model cùng lúc
  • Tốn token
  • Tốn infrastructure

Hiệu suất không chắc chắn

  • Parallelism không phải lúc nào cũng hiệu quả
  • Context sync có thể lỗi
  • Workflow có thể deadlock

Bảo mật và độ tin cậy

Khi nhiều agent tự động thực thi:

  • Permission trở nên quan trọng
  • Audit log cần rõ ràng
  • Sandboxing cần chặt chẽ

Kết Luận

Hành trình xây dựng Agent Teams cho thấy một điều: Tương lai của AI không nằm ở “một model mạnh hơn”.

Mà nằm ở:

  • orchestration
  • infrastructure
  • context management
  • workflow design

Khi nhiều AI agents có thể:

  • phối hợp
  • tự giao tiếp
  • tự báo trạng thái
  • tự thực thi workflow

… chúng bắt đầu hoạt động giống một tổ chức thực sự.

Điều thú vị nhất là: Mục tiêu ban đầu chỉ là “muốn nhàn hơn”. 

Nhưng kết quả cuối cùng lại là một hệ thống nơi: cả team AI vẫn hoạt động ngay cả khi con người không có mặt.

Guest