Tìm hiểu 4 building block cơ bản của mọi AI agent — trình kích hoạt, hành động, bộ nhớ và công cụ — để bạn có thể thiết kế các quy trình tự động hóa thông minh hơn.
Trước khi xây dựng bất cứ điều gì, bạn cần hiểu rõ mình đang xây dựng cái gì. Mỗi AI agent — dù được lập trình hay không cần code, đơn giản hay phức tạp — đều được tạo thành từ 4 building block. Nắm vững những khối này và bạn sẽ xây dựng được các agent tốt hơn nhanh hơn.
Building block 1: Trình kích hoạt
Trình kích hoạt là thứ khởi động agent của bạn. Một điều gì đó xảy ra, agent sẽ thức dậy và thực hiện công việc của nó.
Các trình kích hoạt phổ biến:
Khách hàng gửi tin nhắn (trò chuyện, email, SMS)
Một biểu mẫu được gửi trên trang web của bạn
Một hàng mới xuất hiện trong bảng tính
Một thời điểm đã lên lịch đến (mỗi ngày lúc 9 giờ sáng)
Một webhook được kích hoạt từ một ứng dụng khác
Ai đó nhắc đến thương hiệu của bạn trên mạng xã hội
Mọi quy trình làm việc đều bắt đầu với chính xác một trình kích hoạt. Không có trình kích hoạt, không có agent. Trình kích hoạt trả lời câu hỏi: "Khi nào agent này nên bắt đầu làm việc?"
Ví dụ: Một khách hàng điền vào biểu mẫu liên hệ trên trang web của bạn. Việc gửi biểu mẫu đó chính là trình kích hoạt. Mọi thứ diễn ra tiếp theo — đọc biểu mẫu, phân loại yêu cầu, gửi phản hồi — đều bắt nguồn từ sự kiện kích hoạt đó.
✅ Kiểm tra nhanh: Bạn muốn một agent gửi email tóm tắt hàng tuần vào thứ Hai lúc 8 giờ sáng. Đây là loại sự kiện kích hoạt nào?
Đáp án: Sự kiện kích hoạt theo lịch trình — còn được gọi là cron trigger hoặc sự kiện kích hoạt dựa trên thời gian. Nó được kích hoạt vào một thời điểm cụ thể bất kể hành động của người dùng. Hầu hết các nền tảng không cần code đều hỗ trợ sự kiện kích hoạt theo lịch trình với các tùy chọn phút, giờ, ngày hoặc tuần.
Building block 2: Hành động
Hành động là những gì agent của bạn làm. Sau khi sự kiện kích hoạt, agent sẽ thực hiện một hoặc nhiều hành động theo trình tự.
Các hành động phổ biến:
Gửi email hoặc tin nhắn Slack
Cập nhật bản ghi trong CRM của bạn
Tạo một hàng mới trong tài liệu hoặc bảng tính
Tạo văn bản bằng mô hình AI (ChatGPT, Claude, v.v...)
Đăng lên mạng xã hội
Tạo sự kiện trên lịch
Hành động là phần "thực hiện". Hầu hết các agent tự động hữu ích đều kết hợp nhiều hành động với nhau: Đọc dữ liệu → xử lý bằng AI → cập nhật bản ghi → gửi thông báo.
Ví dụ: Khách hàng tiềm năng điền vào biểu mẫu (kích hoạt) → agent chấm điểm khách hàng tiềm năng bằng AI (hành động 1) → Cập nhật điểm số vào CRM (hành động 2) → Gửi thông báo trên Slack cho đội ngũ bán hàng (hành động 3) → Nếu điểm số cao, gửi email theo dõi cá nhân hóa (hành động 4).
4 hành động. Không cần sự can thiệp của con người. Toàn bộ quy trình diễn ra trong vài giây.
Building block 3: Công cụ
Công cụ là các dịch vụ bên ngoài và nguồn dữ liệu mà agent của bạn có thể truy cập. Chúng là thứ giúp agent không chỉ đơn thuần là công cụ tạo văn bản.
Các công cụ phổ biến:
Tìm kiếm: Google, trích xuất dữ liệu web, tra cứu cơ sở kiến thức
Dữ liệu: Bảng tính, cơ sở dữ liệu, hệ thống CRM (Salesforce, HubSpot)
Giao tiếp: Email (Gmail, Outlook), nhắn tin (Slack, Teams)
Lịch: Google Calendar, Calendly
File: Google Drive, Dropbox, phần mềm tạo tài liệu
API tùy chỉnh: Bất kỳ dịch vụ nào có API endpoint
Nếu không có công cụ, agent chỉ có thể tạo ra văn bản. Với công cụ, chúng có thể tương tác trực tiếp với hệ thống kinh doanh của bạn. Đây là sự khác biệt giữa "đây là bản nháp email" và "Tôi đã gửi email, cập nhật CRM và đặt lịch gọi lại".
✅ Kiểm tra nhanh: Agent của bạn cần trả lời các câu hỏi của khách hàng về chính sách hoàn trả. Thông tin về chính sách hoàn trả nên được lưu trữ ở đâu?
Câu trả lời: Trong một công cụ cơ sở kiến thức — một tài liệu, cơ sở dữ liệu Câu hỏi thường gặp hoặc trung tâm trợ giúp mà agent có thể tìm kiếm. Đừng đưa toàn bộ chính sách hoàn trả vào prompt của agent. Thay vào đó, hãy cung cấp cho agent một công cụ tìm kiếm trong cơ sở kiến thức của bạn. Bằng cách này, khi chính sách thay đổi, bạn chỉ cập nhật ở một nơi — chứ không phải ở prompt của agent.
Building block 4: Bộ nhớ
Bộ nhớ là cách agent của bạn ghi nhớ mọi thứ. Nếu không có bộ nhớ, mỗi cuộc trò chuyện sẽ bắt đầu lại từ đầu - agent không biết bạn là ai hoặc bạn đã nói về điều gì ngày hôm qua.
Có hai loại bộ nhớ:
Bộ nhớ ngắn hạn (bộ nhớ phiên): Cuộc trò chuyện hiện tại. Agent nhớ những gì bạn đã nói trước đó trong cuộc trò chuyện này. Khi phiên kết thúc, bộ nhớ này sẽ biến mất.
Bộ nhớ dài hạn (bộ nhớ bền vững): Được lưu trữ trong cơ sở dữ liệu hoặc file. Tồn tại qua các phiên. Agent nhớ tên, sở thích, đơn đặt hàng trước đây và các tương tác trước đó của bạn - ngay cả khi đã nhiều tuần kể từ lần cuối bạn nói chuyện.
Ví dụ: Một agent hỗ trợ khách hàng có trí nhớ dài hạn:
Cuộc trò chuyện đầu tiên: Khách hàng giải thích họ thích liên lạc qua email hơn là điện thoại. Agent ghi nhớ sở thích này.
Cuộc trò chuyện thứ hai (hai tuần sau): Agent đã biết nên đề xuất liên lạc qua email mà không cần hỏi lại. Khách hàng cảm thấy được thấu hiểu.
Nếu không có trí nhớ dài hạn, agent sẽ hỏi "Bạn muốn được liên lạc bằng phương thức nào?" mỗi lần liên lạc. Điều đó gây khó chịu - và đó là sự khác biệt giữa một agent giỏi và một agent xuất sắc.
Tổng hợp lại
Đây là cách 4 yếu tố hoạt động cùng nhau trong một agent thực tế:
Trường hợp sử dụng: Agent sàng lọc khách hàng tiềm năng
KÍCH HOẠT: Gửi biểu mẫu mới trên trang web
↓
CÔNG CỤ:
- Đọc dữ liệu biểu mẫu
- Tìm kiếm hồ sơ khách hàng hiện có trong CRM
- Tra cứu thông tin công ty (LinkedIn, trang web)
↓
HÀNH ĐỘNG:
- AI phân tích khách hàng tiềm năng (chấm điểm từ 1-10 dựa trên các tiêu chí)
- Tạo/cập nhật hồ sơ CRM với điểm số và ghi chú
- Nếu điểm > 7: Gửi cho đội ngũ bán hàng qua Slack + lên lịch theo dõi
- Nếu điểm 4-7: Thêm vào chuỗi email chăm sóc khách hàng
- Nếu điểm < 4: Gửi email lịch sự "cảm ơn bạn đã quan tâm"
↓
BỘ NHỚ:
- Lưu trữ lịch sử tương tác với khách hàng tiềm năng để tham khảo trong tương lai
- Ghi nhớ các mẫu chấm điểm để cải thiện theo thời gian
Kích hoạt → Công cụ → Hành động → Bộ nhớ. Đó là mọi agent, từ đơn giản đến phức tạp.
✅ Kiểm tra nhanh: Bạn đang thiết kế một agent lên lịch họp. Hãy liệt kê yếu tố kích hoạt, ít nhất hai công cụ và hai hành động mà hệ thống cần.
Đáp án: Yếu tố kích hoạt: tin nhắn đến yêu cầu cuộc họp. Công cụ: truy cập lịch (kiểm tra tình trạng sẵn có), cơ sở dữ liệu liên hệ (tra cứu thông tin người tham dự). Hành động: tạo sự kiện trên lịch, gửi email xác nhận. Công cụ bổ sung: công cụ chuyển đổi múi giờ, công cụ kiểm tra tình trạng phòng họp.
Ưu điểm của giải pháp không cần code
Trong một agent được lập trình, bạn sẽ phải viết các hàm cho từng building block. Trong giải pháp không cần code, bạn chỉ cần kéo và thả chúng:
Yếu tố kích hoạt là các connector được xây dựng sẵn (Gmail, Slack, webhook, lên lịch)
Hành động là các mô-đun được xây dựng sẵn (gửi email, cập nhật CRM, tạo văn bản)
Công cụ là các tích hợp được cấu hình sẵn (hơn 1000 ứng dụng được kết nối)
Bộ nhớ được quản lý bởi nền tảng (lịch sử hội thoại, kho lưu trữ cặp khóa-giá trị)
Bạn tập trung vào cái gì — agent nên làm gì? Nền tảng sẽ xử lý cách thức — các lần gọi API, xử lý lỗi, định dạng dữ liệu.
Những điểm chính cần ghi nhớ
Mỗi agent đều có 4 building block: trình kích hoạt (điều gì khởi động nó), hành động (nó thực hiện), công cụ (những gì nó có thể truy cập) và bộ nhớ (những gì nó ghi nhớ)
Trình kích hoạt chỉ hoạt động một lần để bắt đầu quy trình làm việc — mọi thứ khác sẽ diễn ra sau đó
Các hành động được xâu chuỗi với nhau: đọc → xử lý → cập nhật → thông báo
Công cụ kết nối các agent với hệ thống kinh doanh thực của bạn — nếu không có công cụ, các agent chỉ tạo ra văn bản
Bộ nhớ giúp các agent trở nên thông minh hơn theo thời gian — ngắn hạn cho phiên hiện tại, dài hạn cho nhiều phiên
Câu 1:
Sự khác biệt giữa bộ nhớ ngắn hạn và bộ nhớ dài hạn đối với một agent là gì?
GIẢI THÍCH:
Bộ nhớ ngắn hạn = cuộc trò chuyện bạn đang có ngay bây giờ. Nó bao gồm các tin nhắn đã trao đổi, ngữ cảnh mà agent đã xây dựng. Khi phiên kết thúc, nó sẽ biến mất. Bộ nhớ dài hạn = được lưu trữ bên ngoài (cơ sở dữ liệu, tệp, cơ sở kiến thức). Agent sẽ truy xuất nó khi bắt đầu các phiên mới. Ví dụ: tên và tùy chọn của khách hàng được lưu trữ trong bộ nhớ dài hạn. Câu hỏi hiện tại của họ được lưu trữ trong bộ nhớ ngắn hạn, được lưu trữ trong cơ sở dữ liệu hoặc file — do đó, agent ghi nhớ các tùy chọn của người dùng, những tương tác trước đây và các mô hình đã học được theo thời gian.
Câu 2:
Tại sao AI agent cần bộ nhớ?
GIẢI THÍCH:
Không có bộ nhớ, mọi cuộc hội thoại đều bắt đầu từ con số không. Khách hàng đã nói với agent của bạn về tùy chọn vận chuyển của họ tuần trước phải nhắc lại điều đó. Agent đã nghiên cứu một chủ đề ngày hôm qua không thể tiếp tục nghiên cứu đó hôm nay. Bộ nhớ giúp agent cảm thấy thông minh và tiết kiệm thời gian cho mọi người.
Câu 3:
Một khách hàng gửi email hỏi về tình trạng đơn hàng. Agent của bạn đọc email, tra cứu đơn hàng trên Shopify và trả lời kèm số vận đơn. Đâu là yếu tố kích hoạt, công cụ và hành động?
GIẢI THÍCH:
Email đến khởi động quy trình làm việc (kích hoạt). Agent sử dụng Shopify để tìm dữ liệu đơn hàng (công cụ). Sau đó, nó soạn thảo và gửi email trả lời (hành động). Chuỗi kích hoạt → công cụ → hành động này là xương sống cho mọi quy trình làm việc của agent. Công cụ: Shopify (tra cứu đơn hàng). Hành động: gửi email trả lời kèm số vận đơn.
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây: