Phân luồng và tích hợp Agent chuyên trách theo nghiệp vụ trong hệ thống AI

Đỗ Minh Đức Đỗ Minh Đức
Chia sẻ bài viết

Khi xây dựng các hệ thống AI, đặc biệt là các conversational AI hay chatbot, việc sử dụng một mô hình all-in-one ban đầu có vẻ đơn giản nhưng nhanh chóng bộc lộ điểm yếu về khả năng mở rộng, bảo trì và độ chính xác. Để giải quyết bài toán này, kiến trúc phân luồng và tích hợp các Agent chuyên trách theo từng nghiệp vụ riêng biệt đang là một phương pháp tiếp cận hiệu quả và mạnh mẽ.

Bài viết này sẽ đi sâu vào khía cạnh kỹ thuật, phân tích chi tiết 4 giai đoạn cốt lõi để xây dựng một hệ thống AI linh hoạt, nơi mỗi Agent là một chuyên gia trong lĩnh vực của nó, được điều phối bởi thông minh.

Giai đoạn 1: Xây dựng Knowledge Base chuyên ngành 

Kiến trúc này có thể hình dung như một team developer, thay vì một full-stack developer làm tất cả, chúng ta có backend dev, frontend dev, DevOps... mỗi người một nhiệm vụ. Trong AI, các dev đó chính là các Agent chuyên trách.

Đây là nền tảng quyết định "IQ" của từng Agent. Một KB chung chung sẽ khiến Agent bị nhiễu và trả lời sai nghiệp vụ. Do đó, việc đầu tiên là phải phân mảnh và chuyên môn hóa dữ liệu.

Tại sao phải chuyên ngành hóa KB?

  • Tăng độ chính xác (Accuracy): Một Support Agent chỉ cần truy vấn dữ liệu về hướng dẫn sử dụng, xử lý lỗi, chính sách bảo hành. Một Sales Agent lại cần dữ liệu về thông số kỹ thuật, giá, chương trình khuyến mãi, so sánh sản phẩm. Việc tách biệt giúp giảm không gian tìm kiếm (search space), từ đó tăng tốc độ và độ chính xác của việc truy xuất thông tin (retrieval).
  • Giảm thiểu Hallucination: Khi context được giới hạn chặt chẽ trong một lĩnh vực, model sẽ ít có xu hướng "chế" ra thông tin không liên quan.

Luồng xử lý và phân luồng Agent

  1. Thu thập dữ liệu (Data Ingestion): Crawl dữ liệu từ nhiều nguồn: trang FAQ, tài liệu kỹ thuật, database sản phẩm, log chat của nhân viên, transcript cuộc gọi...
  2. Tiền xử lý và Embedding: Dữ liệu thô được làm sạch, chia nhỏ thành các chunk có ý nghĩa. Sau đó, sử dụng các model embedding (ví dụ: text-embedding-ada-002 của OpenAI, hoặc các model open-source) để vector hóa các chunk này.
  3. Lưu trữ và gắn Tag: Các vector này được lưu vào một vector database (như Pinecone, ChromaDB, Weaviate). Đây là bước quan trọng: mỗi vector hoặc mỗi collection vector phải được gắn metadata/tag để định danh nghiệp vụ.

Ví dụ: {"source": "faq_support", "topic": "refund_policy", "agent_type": "support"}

Ví dụ: {"source": "product_db", "topic": "specs_iphone15", "agent_type": "sales"}

Khi một Agent được kích hoạt, nó sẽ chỉ thực hiện RAG (Retrieval-Augmented Generation) trên những vùng dữ liệu có tag tương ứng với nghiệp vụ của nó.

Giai đoạn 2: Cách Agent điều phối (Orchestrator & Task Router)

Đây là bộ não của  AI Agent toàn hệ thống, quyết định user request sẽ được giao cho Agent nào xử lý. Phần này thường bao gồm hai phần chính: Intent RecognitionTask Router.

Orchestrator là một LLM hoặc một function trung gian, nhận input đầu vào của người dùng và thực hiện hai nhiệm vụ:

  1. Phân loại ý định (Intent Recognition): Phân tích câu hỏi của người dùng để xác định mục đích chính. Ví dụ: "Sản phẩm này giá bao nhiêu?" -> Intent: sales_inquiry. "Tôi không đăng nhập được" -> Intent: technical_support.
  2. Định tuyến tác vụ (Task Routing): Dựa vào Intent đã xác định, nó sẽ chọn Agent phù hợp nhất để xử lý.

Mô tả chi tiết cách hoạt động:

  1. User gửi một query, ví dụ: "Chính sách đổi trả cho đơn hàng #XYZ123 là gì?"
  2. Orchestrator nhận query này. Nó có một prompt được thiết kế đặc biệt để phân loại.

Ví dụ: You are a smart task router. Based on the user's query, identify the primary intent and choose the most appropriate agent from the following list: [Sales Agent, Support Agent, Marketing Agent, General Agent].

User query: "Chính sách đổi trả cho đơn hàng #XYZ123 là gì?"

Output in JSON format: {"intent": "support_inquiry", "agent": "Support Agent", "entities": {"order_id": "XYZ123"}}

3. Orchestrator parse output JSON. Nó thấy rằng agent được chỉ định là Support Agent.

4. Hệ thống sẽ kích hoạt Support Agent, truyền vào query gốc của người dùng và các thực thể đã được bóc tách (order_id).

5. Support Agent bắt đầu hoạt động, truy vấn vào KB có tag support và thực hiện các tác vụ chuyên môn của nó.

Giai đoạn 3: Thực thi tác vụ nâng cao để thực thi các nghiệp vụ phức tạp

Sau khi đã được giao nhiệm vụ, các Agent chuyên trách không chỉ trả lời câu hỏi dựa trên KB. Chúng cần khả năng thực thi hành động (action) thông qua việc tích hợp với các hệ thống bên ngoài qua API.

Tích hợp Agent phục vụ CRM

Nghiệp vụ: Khi Sales Agent xác định một khách hàng tiềm năng, nó cần tạo một "lead" mới trong hệ thống CRM (ví dụ: Salesforce, HubSpot).

Cách thực thi:

  1. Sales Agent được trang bị một tool (function) tên là create_crm_lead.
  2. Tool này thực chất là một wrapper cho API endpoint POST /api/v1/leads của hệ thống CRM.
  3. Khi Agent quyết định cần tạo lead, nó sẽ gọi function create_crm_lead với các tham số cần thiết (tên, email, sđt) mà nó đã thu thập được từ cuộc trò chuyện.
  4. Hệ thống thực thi lệnh gọi API, tạo lead trong CRM và trả về kết quả (thành công/thất bại) cho Agent.

Agent phục vụ Email/Marketing Automation

Nghiệp vụ: Khi người dùng đồng ý nhận tin khuyến mãi, Marketing Agent cần thêm email của họ vào một danh sách gửi mail trên một platform như BizMail hoặc SendGrid.

Cách thực thi: Tương tự như trên, Marketing Agent sẽ có một tool add_to_mailing_list để gọi API của dịch vụ email marketing.

Agent chăm sóc khách hàng (Customer Support)

Nghiệp vụ: Khi người dùng yêu cầu kiểm tra trạng thái đơn hàng, Support Agent cần truy vấn hệ thống quản lý đơn hàng nội bộ.

Cách thực thi: Agent sử dụng tool get_order_status để gọi API GET /api/orders/{order_id} và trả về thông tin cho người dùng.

Kiến trúc này biến các Agent từ những cỗ máy trả lời đơn thuần thành những nhân viên ảo có khả năng thực thi công việc thực tế.

Giai đoạn 4: Monitoring và tối ưu hệ thống 

Một hệ thống được deploy không có monitoring chẳng khác gì code trong bóng tối. Với hệ thống multi-agent, việc này càng trở nên quan trọng.

Cần theo dõi (track) những gì?

1. Luồng xử lý (Trace): Log lại toàn bộ hành trình của một request:

  • Input của người dùng.
  • Quyết định của Orchestrator (Intent, Agent được chọn).
  • Dữ liệu được truy xuất từ KB bởi Agent.
  • Các tool/API được Agent gọi (request payload, response).
  • Câu trả lời cuối cùng cho người dùng.
  • Các công cụ như LangSmith hay Helicone rất hữu ích cho việc này.

2. Hiệu suất (Performance Metrics):

  • Latency: Độ trễ của từng Agent và của toàn hệ thống. Agent nào đang là "nút cổ chai"?
  • Cost: Chi phí token cho từng Agent, đặc biệt là Orchestrator.
  • Error Rate: Tỷ lệ lỗi API, lỗi parsing, lỗi Agent không chọn được tool phù hợp.

3. Độ chính xác (Accuracy Metrics):

  • Routing Accuracy: Orchestrator có chọn đúng Agent không?
  • Tool Usage Accuracy: Agent có sử dụng đúng tool và đúng tham số không?
  • Answer Relevance: Câu trả lời cuối cùng có giải quyết được vấn đề của người dùng không (thường được đo bằng feedback thumbs up/down).

Tối ưu như thế nào?

  • Dựa vào data monitoring, chúng ta có thể fine-tune prompt của Orchestrator để nó định tuyến tốt hơn.
  • Cập nhật, bổ sung dữ liệu cho KB của Agent nào thường xuyên trả lời sai.
  • Tối ưu các tool/function-calling để giảm latency.
  • Phân tích các failed trace để tìm ra nguyên nhân gốc rễ và fix bug trong logic của Agent.

Có thể bạn quan tâm ==> So sánh Single Agent và Multi-Agent trong giải pháp AI Sales Agent 

Kết luận 

Việc chuyển từ một mô hình AI nguyên khối sang kiến trúc multi-agent chuyên trách là một bước tiến quan trọng để xây dựng các hệ thống AI thực sự mạnh mẽ, dễ quản lý và có khả năng mở rộng. Bằng cách phân chia rõ ràng nhiệm vụ qua từng giai đoạn cho phép Agent thực thi tác vụ qua API, và cuối cùng là monitoring chặt chẽ, chúng ta có thể tạo ra những trợ lý ảo không chỉ biết mà còn làm được việc.

Đỗ Minh Đức
Tác giả
Đỗ Minh Đức
Giám đốc sản phẩm BizChat AI

Với gần 20 năm kinh nghiệm trong ngành công nghệ, Đỗ Minh Đức hiện là Giám đốc Sản phẩm Bizfly Martech tại VCCorp. Anh được biết đến là một trong bốn người đặt nền móng cho BizChatAI, giải pháp ứng dụng trí tuệ nhân tạo để chăm sóc khách hàng tự động đa kênh.

Anh tập trung phát triển BizChatAI như một "trợ lý ảo" cho doanh nghiệp, giúp tự động hóa việc tương tác và CSKH. Công nghệ này đang thay đổi mạnh mẽ cách doanh nghiệp tiếp cận khách hàng, từ việc gửi tin nhắn, quà tri ân tự động đến ứng dụng hiệu quả cho các chuỗi bán lẻ và nhà hàng... Qua các bài viết của mình, anh chia sẻ sâu hơn về những lợi ích và cách thức hoạt động của chatbot trong kinh doanh.

Bài viết nổi bật

Mời bạn trải nghiệm AI Chat Agent - Trợ lý ảo tư vấn khách hàng của Bizfly

Trong thời đại mà khách hàng mong muốn được phản hồi ngay lập tức, việc để họ phải chờ vài phút cũng có thể khiến doanh nghiệp đánh mất cơ hội. Đó là lý do Bizfly phát triển AI Chat Agent - trợ lý ảo có khả năng tư vấn, giải đáp.....