Tác giả: T.B.H.Nguyên

Post Views: 715

AI Agents đang phát triển với tốc độ cực nhanh. Chúng ta có thể dùng ChatGPT để brainstorm, Claude Code để đọc codebase, Gemini CLI để thực thi tác vụ, hay các tool như Antigravity để thao tác trực tiếp với UI.

Nhưng sau giai đoạn “wow”, một vấn đề bắt đầu xuất hiện: AI rất mạnh, nhưng workflow sử dụng AI lại cực kỳ thủ công.

Người dùng phải:

Copy-paste context giữa nhiều session
Nhắc lại yêu cầu liên tục
Theo dõi từng bước agent đang làm
Chuyển đổi qua lại giữa nhiều model
Quản lý context bị nhiễu sau thời gian dài

Bài viết này chia sẻ hành trình xây dựng một hệ thống Agent Teams — nơi nhiều AI agents có thể phối hợp, tự báo trạng thái, tự thực thi workflow và giảm tối đa sự can thiệp thủ công của con người.

Vì sao Agent Teams ra đời?

Ý tưởng bắt đầu từ một nhu cầu rất đơn giản: Muốn “nhàn hơn”, nhưng vẫn “chính xác hơn”.

Khi làm việc với AI hàng ngày, có ba vấn đề lớn xuất hiện.

1. Workflow quá thủ công

Một ngày có thể phải:

Copy-paste giữa Claude, Gemini và Codex hàng chục lần
Mở nhiều session khác nhau
Nhắc lại context cho từng agent
Ngồi canh agent để trả lời câu hỏi phát sinh

AI lúc này giống một intern cực mạnh — nhưng cần người giám sát liên tục.

2. Context ngày càng hỗn loạn

Sau nhiều tác vụ liên tiếp:

Context bị dài
Agent bắt đầu “quên” yêu cầu cũ
Task trước ảnh hưởng task sau
Câu trả lời lệch hướng dần theo thời gian

Đây là vấn đề phổ biến khi làm việc với AI ở quy mô lớn.

3. Mỗi model mạnh một kiểu

Claude mạnh reasoning
Gemini mạnh tốc độ và context lớn
Codex mạnh coding execution

Nhưng việc phối hợp nhiều model lại rất bất tiện.

Kết quả là:

Workflow bị phân mảnh
Chi phí tăng
Hiệu suất không ổn định

AI Tools Không Hoạt Động Cùng Một Tầng

Một insight quan trọng là: Không phải AI tool nào cũng giống nhau, chúng hoạt động ở các “tầng” khác nhau.

Tầng	Vai trò	Ví dụ
Conversation	Chat, hỏi đáp, tư vấn	ChatGPT, Claude Web, Gemini Web
Codebase	Đọc file, chạy lệnh, sửa code	Claude Code, Gemini CLI, Codex
Machine	Thao tác UI, browser, screen	Antigravity, Banana Pro

Nguyên tắc rất thú vị: Càng gần machine → càng có nhiều context thực tế → càng ít phải mô tả bằng chữ.

Ví dụ:

ChatGPT cần bạn mô tả UI
Antigravity có thể “thấy” trực tiếp UI
Claude Code có thể đọc toàn bộ codebase

Điều này thay đổi hoàn toàn cách thiết kế workflow AI.

Quy Trình 3 Bước Hoàn Chỉnh

Một workflow hiệu quả thường có ba giai đoạn.

1. Explore

Dùng đúng AI ở đúng tầng.

Ví dụ:

Claude Code đọc codebase
Antigravity phân tích UI
ChatGPT brainstorm solution

Mục tiêu:

Khám phá vấn đề
Thu thập context
Tạo định hướng

2. Consolidate

Biến kết quả chat thành tài liệu có cấu trúc.

Đây là nơi SDD (Spec Driven Development) phát huy tác dụng.

Thay vì: “Làm giúp tôi feature này”

Ta chuyển thành:

Ai làm?
Làm theo workflow nào?
Output mong muốn là gì?
Khi nào handoff?

3. Execute

Đẩy spec vào Agent Teams.

Lúc này:

Agent được phân vai
Task được chạy song song
Hooks tự động báo trạng thái
Con người chỉ review kết quả cuối

Đây là lúc AI bắt đầu hoạt động như một “team”.

TMUX — Infrastructure Quan Trọng Nhất

Một trong những insight thú vị nhất là: TMUX không chỉ là terminal tool.

Nó có thể trở thành: Message Bus cho AI Agents.

Thông qua:

send-keys
capture-pane

Các agent có thể:

Gửi message cho nhau
Nhận kết quả từ nhau
Đồng bộ workflow
Chạy song song độc lập

Điều quan trọng là: TMUX hoàn toàn provider-agnostic.

Nghĩa là:

Claude
Gemini
Codex
bất kỳ CLI agent nào

… đều có thể tham gia cùng một hệ thống.

Đây là nền tảng để xây dựng multi-agent orchestration.

Từ HITL Sang HOTL

Một vấn đề lớn của AI hiện nay là: Human In The Loop (HITL)

Con người phải:

Chờ agent hoàn thành
Trả lời từng câu hỏi
Cho permission liên tục
Theo dõi từng bước

Điều này khiến AI giống một công cụ hỗ trợ hơn là hệ thống tự vận hành.

HOTL — Human On The Loop

Thay vì tham gia từng bước, con người chỉ:

Giám sát
Nhận notification
Review kết quả cuối

Để làm được điều đó, hệ thống cần Hooks.

Hooks — Khi Agent Tự Báo Cáo

Claude Code hỗ trợ hooks chạy shell command tại các thời điểm khác nhau trong lifecycle.

Ví dụ:

Hook	Vai trò
SessionStart	Re-inject context
Stop	Báo task hoàn thành
Notification	Agent cần xác nhận
PostToolUse	Theo dõi tool usage

Khi kết hợp với Squad Station:

Agent tự gửi trạng thái
Orchestrator tự điều phối
Không cần polling
Không cần ngồi canh terminal

Đây là bước chuyển rất lớn từ: “AI tool” → “AI system”

Context Management — Bài Toán Quan Trọng Nhất

Đa số vấn đề chất lượng AI đều quay về một điểm: Context.

Context Window Không Phải Vô Hạn

Khi conversation quá dài:

Thông tin cũ bị đẩy ra ngoài
Agent mất trí nhớ
Workflow bị lệch hướng

Ô Nhiễm Context

Một vấn đề nguy hiểm hơn: Task trước ảnh hưởng task sau.

Ví dụ:

Prompt cũ còn sót lại
Workflow cũ vẫn active
Rule cũ xung đột rule mới

Kết quả:

Agent trả lời không ổn định
Output thiếu nhất quán
Chất lượng giảm mạnh

Compact — Con Dao Hai Lưỡi

Khi context đầy (~95%), Claude Code sẽ auto compact.

Nó giữ lại:

CLAUDE.md
Rules
Auto Memory
Git state
MCP definitions

Nhưng loại bỏ:

Conversation history
Tool outputs cũ
File content đã đọc

Insight cực kỳ quan trọng: Instruction chỉ tồn tại trong chat sẽ biến mất sau compact.

Muốn giữ lâu dài:

Viết vào CLAUDE.md
Hoặc Rules

/clear và /re — Hai Lệnh Quan Trọng

/clear

Dùng để:

Xóa context bị nhiễu
Làm sạch session
Reset workflow

Nhưng đồng thời:

Chat history biến mất
Agent mất toàn bộ hội thoại

May mắn là:

CLAUDE.md
Auto Memory

… vẫn được reload tự động.

/re

Một kỹ thuật rất mạnh.

Thay vì: “Không đúng, thử lại đi”

Ta dùng /re để:

Quay lại trước khi lỗi xảy ra
Xóa nhánh reasoning sai
Tiếp tục từ “điểm sạch”

Điều này giúp giảm context pollution rất nhiều.

SDD — Spec Driven Development

SDD là cách làm việc có cấu trúc với AI.

Thay vì chỉ chat tự do, ta định nghĩa:

Role
Workflow
Output
Handoff
Quy trình kiểm tra

Một số framework phổ biến:

Framework	Định hướng
BMAD	Structured workflow
Get Shit Done	Execution-focused
OpenSpec	Spec-centric
Superpowers	Autonomous agents

SDD giúp AI:

Giảm ambiguity
Làm việc ổn định hơn
Dễ orchestration hơn

Nhưng cũng có nhược điểm:

Khó nhớ command
Workflow cứng nhắc
Cấu hình phức tạp

Đó là lý do cần một hệ thống orchestration tốt hơn.

Agent Teams — Khi AI Hoạt Động Như Một Team

Agent Teams là mô hình:

Nhiều agent
Nhiều vai trò
Chạy song song
Có orchestrator điều phối

Ví dụ:

Planner agent
Developer agent
Reviewer agent
QA agent

Mỗi agent:

Có context riêng
Có workflow riêng
Có model phù hợp riêng

Orchestrator sẽ:

Phân tích mục tiêu lớn
Chia task
Giao việc
Thu kết quả
Điều phối workflow

Đây là cách mở rộng khả năng AI vượt qua giới hạn của một agent đơn lẻ.

Claude Agent vs Squad Station

Một so sánh thú vị:

Claude Agent	Squad Station
Chỉ dùng Claude	Mix nhiều provider
In-process	TMUX-based
Ít linh hoạt	Provider-agnostic
Workflow cố định	Hỗ trợ nhiều SDD

Squad Station cho phép:

Claude + Gemini + Codex cùng hoạt động
Tự routing message
Điều phối bằng playbook
Setup nhanh bằng một lệnh

Ví dụ:

npx squad-station@latest install

Những Insight Quan Trọng Nhất

1. AI không thiếu sức mạnh — chúng thiếu hệ thống

Khả năng model không còn là bottleneck lớn nhất.

Workflow và orchestration mới là thứ quyết định hiệu quả.

2. TMUX là infrastructure

TMUX không chỉ là terminal multiplexer.

Nó có thể trở thành nền tảng giao tiếp cho toàn bộ AI system.

3. HOTL tốt hơn HITL

Con người không bị loại bỏ.

Con người được “nâng cấp” lên vai trò giám sát.

4. Context Management = Quality Control

Ai hiểu context window sẽ dùng AI hiệu quả hơn rất nhiều.

Nhược Điểm Của Agent Teams

Dù mạnh, Agent Teams vẫn có nhiều thách thức.

Độ phức tạp cao

Khó orchestration
Khó debug
Khó maintain

Chi phí cao

Chạy nhiều model cùng lúc
Tốn token
Tốn infrastructure

Hiệu suất không chắc chắn

Parallelism không phải lúc nào cũng hiệu quả
Context sync có thể lỗi
Workflow có thể deadlock

Bảo mật và độ tin cậy

Khi nhiều agent tự động thực thi:

Permission trở nên quan trọng
Audit log cần rõ ràng
Sandboxing cần chặt chẽ

Kết Luận

Hành trình xây dựng Agent Teams cho thấy một điều: Tương lai của AI không nằm ở “một model mạnh hơn”.

Mà nằm ở:

orchestration
infrastructure
context management
workflow design

Khi nhiều AI agents có thể:

phối hợp
tự giao tiếp
tự báo trạng thái
tự thực thi workflow

… chúng bắt đầu hoạt động giống một tổ chức thực sự.

Điều thú vị nhất là: Mục tiêu ban đầu chỉ là “muốn nhàn hơn”.

Nhưng kết quả cuối cùng lại là một hệ thống nơi: cả team AI vẫn hoạt động ngay cả khi con người không có mặt.

Công nghệ & Xu hướng

Agent Teams – Khi AI Không Thiếu Sức Mạnh, Mà Thiếu Hệ Thống

Vì sao Agent Teams ra đời?

1. Workflow quá thủ công

2. Context ngày càng hỗn loạn

3. Mỗi model mạnh một kiểu

AI Tools Không Hoạt Động Cùng Một Tầng

Quy Trình 3 Bước Hoàn Chỉnh

1. Explore

2. Consolidate

3. Execute

TMUX — Infrastructure Quan Trọng Nhất

Từ HITL Sang HOTL

HOTL — Human On The Loop

Hooks — Khi Agent Tự Báo Cáo

Context Management — Bài Toán Quan Trọng Nhất

Context Window Không Phải Vô Hạn

Ô Nhiễm Context

Compact — Con Dao Hai Lưỡi

/clear và /re — Hai Lệnh Quan Trọng

/clear

/re

SDD — Spec Driven Development

Agent Teams — Khi AI Hoạt Động Như Một Team

Claude Agent vs Squad Station

Những Insight Quan Trọng Nhất

1. AI không thiếu sức mạnh — chúng thiếu hệ thống

2. TMUX là infrastructure

3. HOTL tốt hơn HITL

4. Context Management = Quality Control

Nhược Điểm Của Agent Teams

Độ phức tạp cao

Chi phí cao

Hiệu suất không chắc chắn

Bảo mật và độ tin cậy

Kết Luận

Bạn là VTIan?

VTI Tech Blog - Insights for Future Builders

Agent Teams – Khi AI Không Thiếu Sức Mạnh, Mà Thiếu Hệ Thống

Vì sao Agent Teams ra đời?

1. Workflow quá thủ công

2. Context ngày càng hỗn loạn

3. Mỗi model mạnh một kiểu

AI Tools Không Hoạt Động Cùng Một Tầng

Quy Trình 3 Bước Hoàn Chỉnh

1. Explore

2. Consolidate

3. Execute

TMUX — Infrastructure Quan Trọng Nhất

Từ HITL Sang HOTL

HOTL — Human On The Loop

Hooks — Khi Agent Tự Báo Cáo

Context Management — Bài Toán Quan Trọng Nhất

Context Window Không Phải Vô Hạn

Ô Nhiễm Context

Compact — Con Dao Hai Lưỡi

/clear và /re — Hai Lệnh Quan Trọng

/clear

/re

SDD — Spec Driven Development

Agent Teams — Khi AI Hoạt Động Như Một Team

Claude Agent vs Squad Station

Những Insight Quan Trọng Nhất

1. AI không thiếu sức mạnh — chúng thiếu hệ thống

2. TMUX là infrastructure

3. HOTL tốt hơn HITL

4. Context Management = Quality Control

Nhược Điểm Của Agent Teams

Độ phức tạp cao

Chi phí cao

Hiệu suất không chắc chắn

Bảo mật và độ tin cậy

Kết Luận

Khám phá các bài viết khác

Retrieval Augmented Generation (RAG) Là Gì? Hướng Dẫn Toàn Diện

7 use case Writing của Backlog AI Assistant cho team

3 use case Planning của Backlog AI Assistant cho PM & team

Bạn là VTIan?