Một agent duy nhất có thể xử lý nhiều nhiệm vụ. Nhưng một số quy trình làm việc quá phức tạp, quá rộng hoặc quá chuyên biệt để một agent có thể thực hiện tốt. Đó là lúc hệ thống multi-agent phát huy tác dụng.
Supervisor phân tích yêu cầu và quyết định chọn (các) worker nào để thực hiện
Worker thực hiện các nhiệm vụ chuyên môn của họ
Kết quả được gửi lại cho Supervisor để tổng hợp kết quả cuối cùng
Ví dụ: Quy trình tạo nội dung
User: "Viết một bài đăng blog về điện toán lượng tử dành cho người mới bắt đầu"
Supervisor → Research Agent: "Tìm 5 nguồn đáng tin cậy về kiến thức cơ bản về điện toán lượng tử"
Supervisor → Write Agent: "Viết một bài đăng blog 1500 từ sử dụng các nguồn này" (chuyển kết quả nghiên cứu)
Supervisor → Review Agent: "Kiểm tra tính chính xác, khả năng đọc hiểu và SEO" (chuyển bản nháp)
Supervisor: Gửi bài đăng cuối cùng đã được kiểm duyệt
✅ Kiểm tra nhanh: Mô hình Supervisor yêu cầu supervisor phải hiểu khả năng của từng nhân viên. Điều gì sẽ xảy ra nếu bạn thêm một "Translation Agent" mới nhưng không cập nhật kiến thức của Supervisor?
Câu trả lời: Supervisor sẽ không bao giờ giao nhiệm vụ dịch thuật cho agent mới vì họ không biết agent đó tồn tại. Hệ thống multi-agent yêu cầu điều phối phải có kiến thức cập nhật về tất cả các agent hiện có - khả năng của chúng, khi nào sử dụng chúng và đầu vào/đầu ra mà chúng mong đợi. Thêm một agent mà không cập nhật bộ điều phối giống như tuyển dụng một nhân viên mà không thông báo cho người quản lý.
Mô hình điều phối 2: Pipeline
Các agent xử lý công việc theo một trình tự cố định, giống như một dây chuyền lắp ráp.
Input → [Agent A] → [Agent B] → [Agent C] → Output
Trích xuất Phân tích Định dạng
Cách hoạt động:
Mỗi agent có một nhiệm vụ
Đầu ra của agent A trở thành đầu vào của agent B
Trình tự được xác định trước - không cần quyết định định tuyến
Ví dụ: Xử lý hóa đơn
Hóa đơn PDF → [Extract Agent] → dữ liệu có cấu trúc
→ [Validate Agent] → dữ liệu đã được xác thực + flag
→ [Accounting Agent] → nhật ký ghi chép
→ [Notify Agent] → email xác nhận
Khi nào sử dụng: Các tác vụ có trình tự rõ ràng, có thể lặp lại, trong đó mỗi bước chuyển đổi dữ liệu cho bước tiếp theo.
Mô hình điều phối 3: Peer-to-Peer
Các agent giao tiếp trực tiếp với nhau mà không cần điều phối viên trung tâm.
┌──────────┐ ┌──────────┐
│ Agent A │◄───►│ Agent B │
└─────┬────┘ └────┬─────┘
│ │
└───────┬───────┘
▼
┌──────────┐
│ Agent C │
└──────────┘
Cách hoạt động:
Các agent tự quyết định sẽ liên lạc với ai
Không có cơ quan trung ương - các agent phối hợp thông qua tin nhắn trực tiếp
Bất kỳ agent nào cũng có thể bắt đầu cuộc trò chuyện với bất kỳ agent nào khác
Ví dụ: Gỡ lỗi cộng tác
Code Agent: "Tôi đã tìm thấy một vấn đề về hiệu suất trong truy vấn ở dòng 47"
Database Agent: "Truy vấn đó thiếu một chỉ mục. Đây là cách khắc phục."
Code Agent: "Đã áp dụng bản sửa lỗi. Testing Agent, bạn có thể xác minh không?"
Testing Agent: "Hiệu suất đã được cải thiện từ 3,2 giây xuống 0,4 giây. Bản sửa lỗi đã được xác nhận."
Cảnh báo: Mô hình ngang hàng (peer-to-peer) khó gỡ lỗi nhất và dễ bị vòng lặp vô hạn nhất. Chỉ sử dụng nó khi các tác vụ thực sự yêu cầu sự cộng tác tức thời.
Mô hình chuyển giao (Handoff Pattern)
Trong nhiều framework (OpenAI Agents SDK, LangGraph), một agent có thể "chuyển giao" cho một agent khác - chuyển giao cuộc trò chuyện và ngữ cảnh:
User: "Tôi cần trả lại sản phẩm và cũng muốn hỏi về
sản phẩm mới."
Triage Agent: Điều này bao gồm cả việc trả lại hàng và bán hàng.
→ Chuyển giao cho nhân viên xử lý hàng trả lại (kèm ngữ cảnh)
Returns Agent: "Tôi đã xử lý yêu cầu trả hàng của bạn cho đơn hàng số 4521.
Nhãn vận chuyển đã được gửi đến email của bạn."
→ Chuyển giao cho nhân viên bán hàng (kèm ngữ cảnh)
Sales Agent: "Tuyệt vời! Bạn quan tâm đến sản phẩm nào?"
Quá trình chuyển giao truyền tải toàn bộ ngữ cảnh hội thoại để agent nhận không phải bắt đầu lại từ đầu.
✅ Kiểm tra nhanh: Trong một hệ thống pipeline, Agent B nhận dữ liệu bị lỗi từ Agent A và bị sập. Lỗi lan truyền — Agent C và D không bao giờ chạy, và người dùng không nhận được kết quả. Làm thế nào để ngăn chặn điều này?
Đáp án: Thêm xác thực ở mỗi giai đoạn của quy trình. Agent B nên xác thực đầu vào trước khi xử lý: Kiểm tra kiểu dữ liệu, các trường bắt buộc và phạm vi giá trị. Nếu xác thực thất bại, Agent B trả về lỗi có cấu trúc cho công cụ điều phối thay vì bị sập. Công cụ điều phối sau đó có thể thử lại Agent A, sử dụng phương án dự phòng hoặc báo cáo lỗi cụ thể cho người dùng. Xác thực đầu vào ở mọi ranh giới là rất quan trọng trong các quy trình multi-agent.
Các chế độ lỗi multi-agent thường gặp
Gartner đã tìm thấy tỷ lệ lỗi từ 41-87% trong các hệ thống multi-agent. Đây là những gì xảy ra sai:
1. Vòng lặp ủy quyền vô hạn
Agent A ủy quyền cho agent B, agent B ủy quyền lại cho agent A.
Khắc phục: Độ sâu ủy quyền tối đa và phát hiện vòng lặp.
2. Mất ngữ cảnh khi chuyển giao
Agent A có ngữ cảnh quan trọng không được chuyển giao cho agent B.
Khắc phục: Thông báo chuyển giao có cấu trúc với các trường ngữ cảnh rõ ràng.
3. Hành động xung đột
Hai agent sửa đổi cùng một tài nguyên đồng thời.
Khắc phục: Khóa tài nguyên hoặc các mẫu truy cập tuần tự.
4. Lỗi lan truyền
Lỗi ở một agent sẽ gây ra lỗi ở tất cả các agent tiếp theo.
Giải pháp: Sử dụng tính năng ngắt và đường dẫn dự phòng.
So sánh các framework
Framework
Độ mạnh của mẫu
Tốt nhất cho
LangGraph
Dựa trên đồ thị, bất kỳ mô hình nào
Điều phối tùy chỉnh phức tạp
CrewAI
Giám sát theo vai trò
Sự hợp tác theo nhóm
OpenAI Agents SDK
Chuyển giao, gọn nhẹ
Hệ thống multi-agent đơn giản với chức năng chuyển giao
AutoGen
Peer dựa trên hội thoại
Các mô hình tranh luận/thảo luận
Bài tập thực hành
Chọn một quy trình làm việc từ công việc của bạn bao gồm 3+ nhiệm vụ riêng biệt
Quyết định: Supervisor, pipeline hay peer-to-peer? Tại sao?
Xác định 3 agent chuyên trách: Vai trò, công cụ của họ và những gì họ chuyển giao cho agent tiếp theo
Xác định chế độ lỗi có khả năng xảy ra nhất và thiết kế cơ chế phòng ngừa
Những điểm chính cần ghi nhớ
Bắt đầu với một agent duy nhất - chỉ chia thành nhiều agent khi một agent rõ ràng không thể xử lý nhiệm vụ
Mô hình Supervisor: Điều phối viên trung tâm giao nhiệm vụ cho các chuyên gia - phổ biến nhất và dễ gỡ lỗi nhất
Mô hình Pipeline: Trình tự cố định các bước xử lý - tốt nhất cho những quy trình chuyển đổi có thể lặp lại
Mô hình Peer-to-peer: Các agent phối hợp trực tiếp - linh hoạt nhất nhưng khó gỡ lỗi nhất và dễ xảy ra lỗi nhất
Việc chuyển giao chuyển ngữ cảnh hội thoại giữa các agent, duy trì tính liên tục
Tỷ lệ lỗi của nhiều agent đạt 41-87% nếu không được điều phối đúng cách - xác thực ở mọi ranh giới
Câu 1:
Khi nào một agent đơn lẻ tốt hơn một hệ thống multi-agent?
GIẢI THÍCH:
Hệ thống multi-agent làm tăng thêm chi phí: Logic phối hợp, giao tiếp giữa các agent, đồng bộ trạng thái và nhiều điểm lỗi hơn. Claude Code và Codex của OpenAI là các hệ thống agent đơn lẻ xử lý hiệu quả những tác vụ lập trình phức tạp. Một agent được hướng dẫn tốt với các công cụ phù hợp có thể xử lý hầu hết mọi tác vụ. Chỉ nên sử dụng nhiều agent khi: (1) Tác vụ thực sự yêu cầu chuyên môn khác nhau, (2) bạn cần thực thi song song, hoặc (3) các yêu cầu về công cụ/ngữ cảnh kết hợp vượt quá khả năng quản lý của một agent.
Câu 2:
Gartner đã tìm thấy tỷ lệ lỗi từ 41-87% trong các hệ thống multi-agent mà không có sự điều phối thích hợp. Nguyên nhân chính của những lỗi này là gì?
GIẢI THÍCH:
Lỗi multi-agent phản ánh lỗi của hệ thống phân tán. Agent A gọi agent B, agent B gọi agent C, agent C lại gọi agent A - vòng lặp vô hạn. Agent A xuất dữ liệu ở định dạng X, agent B mong đợi định dạng Y - lỗi dữ liệu âm thầm. Hai agent cùng sửa đổi cùng một tài nguyên đồng thời - trạng thái xung đột. Đây không phải là vấn đề của trí tuệ nhân tạo - mà là vấn đề kỹ thuật. Cách khắc phục cũng tương tự như trong các hệ thống phân tán: những giao thức rõ ràng, lược đồ thông báo, giới hạn thời gian chờ và xử lý lỗi toàn diện.
Câu 3:
Công ty của bạn muốn xây dựng một hệ thống AI xử lý toàn bộ quy trình hỗ trợ khách hàng: Trả lời câu hỏi, xử lý hàng trả lại và chuyển tiếp các vấn đề phức tạp. Bạn nên sử dụng một agent hay nhiều agent?
GIẢI THÍCH:
Đây là một trường hợp điển hình của mô hình giám sát. Một agent xử lý cả ba nhiệm vụ sẽ cần một prompt hệ thống khổng lồ, tất cả các công cụ được tải đồng thời, và sẽ hoạt động kém hiệu quả ở mọi khía cạnh. Ba chuyên gia, mỗi chuyên gia có hướng dẫn cụ thể và công cụ phù hợp, sẽ thực hiện tốt hơn các nhiệm vụ riêng lẻ của họ. Router agent rất nhẹ - nó chỉ phân loại yêu cầu và chuyển giao. Điều này cũng giúp hệ thống dễ cập nhật hơn: Việc cải thiện Returns Agent không gây nguy cơ làm hỏng chức năng Q&A.
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây: