Hệ thống multi-agent: Nhóm cho các chuyên gia

Trần Mến

Bài trước

Bài sau

Một agent duy nhất có thể xử lý nhiều nhiệm vụ. Nhưng một số quy trình làm việc quá phức tạp, quá rộng hoặc quá chuyên biệt để một agent có thể thực hiện tốt. Đó là lúc hệ thống multi-agent phát huy tác dụng.

🔄 Tóm tắt nhanh: Trong bài học trước, bạn đã học cách các agent sử dụng công cụ thông qua gọi hàm, MCP và đầu ra có cấu trúc. Hệ thống multi-agent tiến xa hơn - bản thân các agent trở thành công cụ mà những agent khác có thể sử dụng.

Khi nào bạn cần nhiều agent?

Không phải mọi nhiệm vụ đều cần một nhóm. Đây là framework quyết định:

Tín hiệu	Agent đơn lẻ	Nhiều agent
Phạm vi tác vụ	Một lĩnh vực, một bộ kỹ năng	Nhiều lĩnh vực chuyên môn hoặc ngành nghề khác nhau
Số lượng công cụ	Dưới 10-15 công cụ	Hơn 20 công cụ làm rối loạn ngữ cảnh
Nhu cầu ngữ cảnh	Vừa vặn trong một cửa sổ ngữ cảnh	Yêu cầu ngữ cảnh riêng biệt cho từng nhiệm vụ phụ
Cấu trúc song song	Các bước được thực hiện tuần tự	Các bước có thể chạy song song
Cách ly lỗi	Một lần thất bại = một lần thử lại	Cần phải giới hạn số lỗi trên từng thành phần

Nguyên tắc chung: Bắt đầu với một agent. Chỉ chia thành nhiều agent khi agent đơn lẻ gặp khó khăn rõ rệt.

Mô hình điều phối 1: Supervisor

Một agent trung tâm phân công nhiệm vụ cho các agent worker chuyên biệt.

                    ┌─────────────┐
                    │  Supervisor  │
                    │  (Router)    │
                    └──────┬──────┘
                   ┌───────┼───────┐
                   ▼       ▼       ▼
            ┌──────────┐ ┌─────┐ ┌──────────┐
            │ Research  │ │Write│ │  Review   │
            │  Agent    │ │Agent│ │  Agent    │
            └──────────┘ └─────┘ └──────────┘

Cách thức hoạt động:

Người dùng gửi yêu cầu đến Supervisor
Supervisor phân tích yêu cầu và quyết định chọn (các) worker nào để thực hiện
Worker thực hiện các nhiệm vụ chuyên môn của họ
Kết quả được gửi lại cho Supervisor để tổng hợp kết quả cuối cùng

Ví dụ: Quy trình tạo nội dung

User: "Viết một bài đăng blog về điện toán lượng tử dành cho người mới bắt đầu"
Supervisor → Research Agent: "Tìm 5 nguồn đáng tin cậy về kiến thức cơ bản về điện toán lượng tử"
Supervisor → Write Agent: "Viết một bài đăng blog 1500 từ sử dụng các nguồn này" (chuyển kết quả nghiên cứu)
Supervisor → Review Agent: "Kiểm tra tính chính xác, khả năng đọc hiểu và SEO" (chuyển bản nháp)
Supervisor: Gửi bài đăng cuối cùng đã được kiểm duyệt

✅ Kiểm tra nhanh: Mô hình Supervisor yêu cầu supervisor phải hiểu khả năng của từng nhân viên. Điều gì sẽ xảy ra nếu bạn thêm một "Translation Agent" mới nhưng không cập nhật kiến thức của Supervisor?

Câu trả lời: Supervisor sẽ không bao giờ giao nhiệm vụ dịch thuật cho agent mới vì họ không biết agent đó tồn tại. Hệ thống multi-agent yêu cầu điều phối phải có kiến thức cập nhật về tất cả các agent hiện có - khả năng của chúng, khi nào sử dụng chúng và đầu vào/đầu ra mà chúng mong đợi. Thêm một agent mà không cập nhật bộ điều phối giống như tuyển dụng một nhân viên mà không thông báo cho người quản lý.

Mô hình điều phối 2: Pipeline

Các agent xử lý công việc theo một trình tự cố định, giống như một dây chuyền lắp ráp.

Input → [Agent A] → [Agent B] → [Agent C] → Output
         Trích xuất      Phân tích     Định dạng

Cách hoạt động:

Mỗi agent có một nhiệm vụ
Đầu ra của agent A trở thành đầu vào của agent B
Trình tự được xác định trước - không cần quyết định định tuyến

Ví dụ: Xử lý hóa đơn

Hóa đơn PDF → [Extract Agent] → dữ liệu có cấu trúc
           → [Validate Agent] → dữ liệu đã được xác thực + flag
           → [Accounting Agent] → nhật ký ghi chép
           → [Notify Agent] → email xác nhận

Khi nào sử dụng: Các tác vụ có trình tự rõ ràng, có thể lặp lại, trong đó mỗi bước chuyển đổi dữ liệu cho bước tiếp theo.

Mô hình điều phối 3: Peer-to-Peer

Các agent giao tiếp trực tiếp với nhau mà không cần điều phối viên trung tâm.

┌──────────┐     ┌──────────┐
│ Agent A   │◄───►│ Agent B   │
└─────┬────┘     └────┬─────┘
      │               │
      └───────┬───────┘
              ▼
        ┌──────────┐
        │ Agent C   │
        └──────────┘

Cách hoạt động:

Các agent tự quyết định sẽ liên lạc với ai
Không có cơ quan trung ương - các agent phối hợp thông qua tin nhắn trực tiếp
Bất kỳ agent nào cũng có thể bắt đầu cuộc trò chuyện với bất kỳ agent nào khác

Ví dụ: Gỡ lỗi cộng tác

Code Agent: "Tôi đã tìm thấy một vấn đề về hiệu suất trong truy vấn ở dòng 47"
Database Agent: "Truy vấn đó thiếu một chỉ mục. Đây là cách khắc phục."
Code Agent: "Đã áp dụng bản sửa lỗi. Testing Agent, bạn có thể xác minh không?"
Testing Agent: "Hiệu suất đã được cải thiện từ 3,2 giây xuống 0,4 giây. Bản sửa lỗi đã được xác nhận."

Cảnh báo: Mô hình ngang hàng (peer-to-peer) khó gỡ lỗi nhất và dễ bị vòng lặp vô hạn nhất. Chỉ sử dụng nó khi các tác vụ thực sự yêu cầu sự cộng tác tức thời.

Mô hình chuyển giao (Handoff Pattern)

Trong nhiều framework (OpenAI Agents SDK, LangGraph), một agent có thể "chuyển giao" cho một agent khác - chuyển giao cuộc trò chuyện và ngữ cảnh:

User: "Tôi cần trả lại sản phẩm và cũng muốn hỏi về
      sản phẩm mới."

Triage Agent: Điều này bao gồm cả việc trả lại hàng và bán hàng.
  → Chuyển giao cho nhân viên xử lý hàng trả lại (kèm ngữ cảnh)

Returns Agent: "Tôi đã xử lý yêu cầu trả hàng của bạn cho đơn hàng số 4521.
  Nhãn vận chuyển đã được gửi đến email của bạn."
  → Chuyển giao cho nhân viên bán hàng (kèm ngữ cảnh)

Sales Agent: "Tuyệt vời! Bạn quan tâm đến sản phẩm nào?"

Quá trình chuyển giao truyền tải toàn bộ ngữ cảnh hội thoại để agent nhận không phải bắt đầu lại từ đầu.

✅ Kiểm tra nhanh: Trong một hệ thống pipeline, Agent B nhận dữ liệu bị lỗi từ Agent A và bị sập. Lỗi lan truyền — Agent C và D không bao giờ chạy, và người dùng không nhận được kết quả. Làm thế nào để ngăn chặn điều này?

Đáp án: Thêm xác thực ở mỗi giai đoạn của quy trình. Agent B nên xác thực đầu vào trước khi xử lý: Kiểm tra kiểu dữ liệu, các trường bắt buộc và phạm vi giá trị. Nếu xác thực thất bại, Agent B trả về lỗi có cấu trúc cho công cụ điều phối thay vì bị sập. Công cụ điều phối sau đó có thể thử lại Agent A, sử dụng phương án dự phòng hoặc báo cáo lỗi cụ thể cho người dùng. Xác thực đầu vào ở mọi ranh giới là rất quan trọng trong các quy trình multi-agent.

Các chế độ lỗi multi-agent thường gặp

Gartner đã tìm thấy tỷ lệ lỗi từ 41-87% trong các hệ thống multi-agent. Đây là những gì xảy ra sai:

1. Vòng lặp ủy quyền vô hạn

Agent A ủy quyền cho agent B, agent B ủy quyền lại cho agent A.

Khắc phục: Độ sâu ủy quyền tối đa và phát hiện vòng lặp.

2. Mất ngữ cảnh khi chuyển giao

Agent A có ngữ cảnh quan trọng không được chuyển giao cho agent B.

Khắc phục: Thông báo chuyển giao có cấu trúc với các trường ngữ cảnh rõ ràng.

3. Hành động xung đột

Hai agent sửa đổi cùng một tài nguyên đồng thời.

Khắc phục: Khóa tài nguyên hoặc các mẫu truy cập tuần tự.

4. Lỗi lan truyền

Lỗi ở một agent sẽ gây ra lỗi ở tất cả các agent tiếp theo.

Giải pháp: Sử dụng tính năng ngắt và đường dẫn dự phòng.

So sánh các framework

Framework	Độ mạnh của mẫu	Tốt nhất cho
LangGraph	Dựa trên đồ thị, bất kỳ mô hình nào	Điều phối tùy chỉnh phức tạp
CrewAI	Giám sát theo vai trò	Sự hợp tác theo nhóm
OpenAI Agents SDK	Chuyển giao, gọn nhẹ	Hệ thống multi-agent đơn giản với chức năng chuyển giao
AutoGen	Peer dựa trên hội thoại	Các mô hình tranh luận/thảo luận

Bài tập thực hành

Chọn một quy trình làm việc từ công việc của bạn bao gồm 3+ nhiệm vụ riêng biệt
Quyết định: Supervisor, pipeline hay peer-to-peer? Tại sao?
Xác định 3 agent chuyên trách: Vai trò, công cụ của họ và những gì họ chuyển giao cho agent tiếp theo
Xác định chế độ lỗi có khả năng xảy ra nhất và thiết kế cơ chế phòng ngừa

Những điểm chính cần ghi nhớ

Bắt đầu với một agent duy nhất - chỉ chia thành nhiều agent khi một agent rõ ràng không thể xử lý nhiệm vụ
Mô hình Supervisor: Điều phối viên trung tâm giao nhiệm vụ cho các chuyên gia - phổ biến nhất và dễ gỡ lỗi nhất
Mô hình Pipeline: Trình tự cố định các bước xử lý - tốt nhất cho những quy trình chuyển đổi có thể lặp lại
Mô hình Peer-to-peer: Các agent phối hợp trực tiếp - linh hoạt nhất nhưng khó gỡ lỗi nhất và dễ xảy ra lỗi nhất
Việc chuyển giao chuyển ngữ cảnh hội thoại giữa các agent, duy trì tính liên tục
Tỷ lệ lỗi của nhiều agent đạt 41-87% nếu không được điều phối đúng cách - xác thực ở mọi ranh giới

Câu 1:
Khi nào một agent đơn lẻ tốt hơn một hệ thống multi-agent?
- A. Khi nhiệm vụ được xác định rõ ràng và một agent có thể xử lý nó từ đầu đến cuối - chi phí phối hợp, truyền thông điệp và các điểm lỗi tiềm ẩn khiến hệ thống multi-agent trở nên kém hiệu quả hơn đối với những nhiệm vụ thực sự không cần chuyên môn hóa.
- B. Không bao giờ - càng nhiều agent càng tốt, bởi vì chuyên môn hóa là cốt lõi của việc làm thế nào để các hệ thống phức tạp trở nên có khả năng hơn. Kiến trúc phần mềm đã chuyển hướng mạnh mẽ sang kiến trúc microservices thay vì monolith vì lý do này, và kiến trúc AI cũng đi theo quỹ đạo tương tự. Một agent đơn lẻ là một monolith; multi-agent là microservices. Hãy chọn mô hình kiến trúc có thể mở rộng đến nơi bạn muốn đến, chứ không phải nơi bạn đang ở hiện tại.
- C. Chỉ đối với các nhiệm vụ tầm thường như trả lời các câu hỏi đơn giản, nơi mà sự phối hợp multi-agent rõ ràng là quá mức cần thiết. Một khi bạn đã vượt qua loại hỏi đáp đơn giản và bước vào bất kỳ thứ gì yêu cầu nhiều bước, lập kế hoạch hoặc truy cập công cụ chuyên dụng, bạn đã bước vào lãnh địa mà mô hình giám sát multi-agent hầu như luôn hoạt động tốt hơn một agent đơn lẻ bất kể nó được hướng dẫn tốt đến mức nào.
GIẢI THÍCH:

Hệ thống multi-agent làm tăng thêm chi phí: Logic phối hợp, giao tiếp giữa các agent, đồng bộ trạng thái và nhiều điểm lỗi hơn. Claude Code và Codex của OpenAI là các hệ thống agent đơn lẻ xử lý hiệu quả những tác vụ lập trình phức tạp. Một agent được hướng dẫn tốt với các công cụ phù hợp có thể xử lý hầu hết mọi tác vụ. Chỉ nên sử dụng nhiều agent khi: (1) Tác vụ thực sự yêu cầu chuyên môn khác nhau, (2) bạn cần thực thi song song, hoặc (3) các yêu cầu về công cụ/ngữ cảnh kết hợp vượt quá khả năng quản lý của một agent.
Câu 2:
Gartner đã tìm thấy tỷ lệ lỗi từ 41-87% trong các hệ thống multi-agent mà không có sự điều phối thích hợp. Nguyên nhân chính của những lỗi này là gì?
- A. Các agent quá chậm. Với mỗi agent bổ sung, độ trễ đầu cuối sẽ tăng lên - mỗi lần ủy quyền sẽ thêm một vòng lặp LLM đầy đủ, và các kiến trúc kiểu giám sát với 3-4 agent trong chuỗi dễ dàng đẩy thời gian phản hồi lên trên một phút. Người dùng bỏ ngang quy trình làm việc trước khi hoàn thành, và điều tưởng chừng như là lỗi multi-agent thực chất lại là lỗi trải nghiệm người dùng do độ trễ gây ra.
- B. Các mô hình LLM hiện chưa đủ thông minh để phối hợp mà không xung đột với nhau. Hệ thống multi-agent yêu cầu mỗi agent phải dự đoán hành động của các agent khác và tích hợp công việc của mình một cách mạch lạc vào quy trình tổng thể, và các mô hình tiên tiến hiện nay không thể suy luận một cách đáng tin cậy về ý định của những agent khác. Chờ thêm một thế hệ mô hình nữa và hầu hết tỷ lệ lỗi sẽ biến mất khi các mô hình cơ bản trở nên nhận thức tốt hơn về hoạt động của những agent.
- C. Lỗi phối hợp: Những agent bỏ qua các bước, truyền dữ liệu không đúng định dạng cho nhau, rơi vào vòng lặp ủy quyền vô hạn hoặc đưa ra các quyết định mâu thuẫn - những vấn đề tương tự gây khó khăn cho bất kỳ hệ thống phân tán nào không có giao thức phù hợp.
GIẢI THÍCH:

Lỗi multi-agent phản ánh lỗi của hệ thống phân tán. Agent A gọi agent B, agent B gọi agent C, agent C lại gọi agent A - vòng lặp vô hạn. Agent A xuất dữ liệu ở định dạng X, agent B mong đợi định dạng Y - lỗi dữ liệu âm thầm. Hai agent cùng sửa đổi cùng một tài nguyên đồng thời - trạng thái xung đột. Đây không phải là vấn đề của trí tuệ nhân tạo - mà là vấn đề kỹ thuật. Cách khắc phục cũng tương tự như trong các hệ thống phân tán: những giao thức rõ ràng, lược đồ thông báo, giới hạn thời gian chờ và xử lý lỗi toàn diện.
Câu 3:
Công ty của bạn muốn xây dựng một hệ thống AI xử lý toàn bộ quy trình hỗ trợ khách hàng: Trả lời câu hỏi, xử lý hàng trả lại và chuyển tiếp các vấn đề phức tạp. Bạn nên sử dụng một agent hay nhiều agent?
- A. Một agent - đơn giản luôn tốt hơn. Một agent được hướng dẫn tốt với các công cụ phù hợp có thể xử lý hỏi đáp, hàng trả lại và chuyển tiếp vấn đề miễn là hệ thống hướng dẫn bao gồm rõ ràng cả ba quy trình. Hệ thống nhiều agent sẽ làm tăng nguy cơ phối hợp kém và phức tạp trong việc gỡ lỗi mà các nhóm hỗ trợ khách hàng không có đủ nguồn lực kỹ thuật để quản lý. Hãy giữ kiến trúc đơn giản, viết hướng dẫn toàn diện và để một agent tự định tuyến nội bộ dựa trên phân loại của chính họ.
- B. Nhiều chuyên gia với một người giám sát: Một Router agent phân loại yêu cầu, sau đó chuyển tiếp cho Q&A Agent, Returns Agent hoặc Escalation Agent - mỗi người được tối ưu hóa cho nhiệm vụ cụ thể của mình với các công cụ và hướng dẫn chuyên biệt.
- C. Một agent cho mỗi khách hàng, được khởi tạo khi cuộc trò chuyện bắt đầu và bị loại bỏ khi kết thúc. Các agent dành riêng cho mỗi khách hàng có thể được điều chỉnh theo lịch sử, sở thích và những yêu cầu trước đây của từng cá nhân, mang lại mức độ cá nhân hóa mà các hệ thống giám sát nhiều agent cố định không thể sánh kịp. Chi phí cơ sở hạ tầng là có thật, nhưng các công ty khởi nghiệp như Sierra và Decagon đã và đang triển khai mô hình này trên quy mô lớn.
GIẢI THÍCH:

Đây là một trường hợp điển hình của mô hình giám sát. Một agent xử lý cả ba nhiệm vụ sẽ cần một prompt hệ thống khổng lồ, tất cả các công cụ được tải đồng thời, và sẽ hoạt động kém hiệu quả ở mọi khía cạnh. Ba chuyên gia, mỗi chuyên gia có hướng dẫn cụ thể và công cụ phù hợp, sẽ thực hiện tốt hơn các nhiệm vụ riêng lẻ của họ. Router agent rất nhẹ - nó chỉ phân loại yêu cầu và chuyển giao. Điều này cũng giúp hệ thống dễ cập nhật hơn: Việc cải thiện Returns Agent không gây nguy cơ làm hỏng chức năng Q&A.

Thứ Tư, 06/05/2026 14:53

5 ★ 1 👨 65

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

AI Agents

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Hệ thống multi-agent: Nhóm cho các chuyên gia

Khi nào bạn cần nhiều agent?

Mô hình điều phối 1: Supervisor

Mô hình điều phối 2: Pipeline

Mô hình điều phối 3: Peer-to-Peer

Mô hình chuyển giao (Handoff Pattern)

Các chế độ lỗi multi-agent thường gặp

1. Vòng lặp ủy quyền vô hạn

2. Mất ngữ cảnh khi chuyển giao

3. Hành động xung đột

4. Lỗi lan truyền

So sánh các framework

Bài tập thực hành

Những điểm chính cần ghi nhớ

Kết quả luyện tập

Bạn nên đọc

Sử dụng công cụ: Tăng thêm sức mạnh cho AI agent

Xây dựng agent đầu tiên của bạn

Kiến trúc agent: Mục tiêu, công cụ và lý luận

4 thành phần trong cấu trúc AI agent

AI Agent và GPT tùy chỉnh trong tự động hóa doanh nghiệp

Suy luận và lập kế hoạch nhiều bước để xây dựng AI agent

AI Agent là gì? Tại sao lại cần đến nó vào thời điểm này?

Tại sao agent lại quan trọng?

Sử dụng công cụ: Cung cấp khả năng cho các agent