Công nghệ AI Voice Agents đang cách mạng hóa ngành dịch vụ khách hàng với khả năng giao tiếp tự nhiên và hiệu quả, giúp doanh nghiệp giảm chi phí và nâng cao trải nghiệm người dùng.
Công nghệ AI Voice Agents đang được nâng cấp từ những hệ thống cũ kỹ không có hoặc có rất ít trí tuệ nhân tạo (AI) sang các mô hình chuyển đổi giọng nói thành văn bản và văn bản thành giọng nói kết hợp với các mô hình ngôn ngữ lớn (LLM). Những cải tiến này giúp bot giọng nói trở nên giống con người hơn, mang lại trải nghiệm giao tiếp mượt mà và tự nhiên.
Đột nhiên, chúng tôi nhận thấy các tác nhân AI này trở nên rất giống con người. Đến mức khách hàng của chúng tôi không thể phân biệt được giữa con người và AI.
Sự phát triển của AI Voice Agents diễn ra nhanh hơn dự kiến. Theo Tom Coshow, một nhà phân tích tại Gartner, các tác nhân AI giọng nói hiện nay có thể bị gián đoạn, đưa ra các gợi ý logic một cách chủ động và hầu như không có độ trễ trong cuộc hội thoại. Đây là một bước tiến mà nhiều người nghĩ sẽ chỉ xảy ra trong một hoặc hai năm tới.
Đồng thời, đầu tư vốn mạo hiểm vào các startup phát triển công nghệ AI giọng nói đã tăng mạnh từ 315 triệu USD năm 2022 lên 2,1 tỷ USD vào năm 2024, theo dữ liệu từ CB Insights. Điều này thúc đẩy nhiều doanh nghiệp triển khai công nghệ này trong các trung tâm liên lạc, tự động hóa các cuộc gọi bán hàng và đặt lịch hẹn trong các lĩnh vực như dịch vụ gia đình và y tế.
AI Voice Agents đang được ứng dụng rộng rãi trong các trung tâm liên lạc để nâng cao hiệu quả phục vụ khách hàng.
Nhiều mô hình AI hàng đầu cho các ứng dụng giọng nói đến từ các phòng thí nghiệm như OpenAI và Anthropic, cùng với các công ty nhỏ hơn như Deepgram và Assembly AI. Ví dụ, mô hình Whisper của OpenAI chuyên về chuyển đổi giọng nói thành văn bản, trong khi GPT-4o có khả năng tương tác bằng giọng nói theo thời gian thực.
Những tiến bộ này khắc phục hạn chế của các hệ thống điện thoại cũ như IVR (Interactive Voice Response), vốn thường không hiểu được ý định của người gọi và không thể đưa ra phản hồi linh hoạt dựa trên ngữ cảnh. Các mô hình AI mới có khả năng hiểu được nhiều từ ngữ hơn và phản hồi tự nhiên hơn, theo Mike Droesch, một đối tác tại Bessemer Venture Partners.
Chỉ trong 12 đến 18 tháng qua, chúng tôi đã thấy các tác nhân AI giọng nói hoạt động tốt hơn hoặc ngang bằng con người.
Các công ty như eHealth đang sử dụng AI Voice Agents để xử lý các cuộc gọi sàng lọc ban đầu khi nhân viên không thể đáp ứng khối lượng cuộc gọi hoặc ngoài giờ làm việc. Công ty này tiết lộ rằng họ thông báo cho khách hàng rằng họ đang nói chuyện với một tác nhân ảo ngay từ đầu cuộc gọi, coi đây là một thông lệ tốt.
Fertitta Entertainment, công ty mẹ của Golden Nugget và Landrys, cũng sử dụng AI cho các cuộc gọi dịch vụ khách hàng. Tuy nhiên, để tránh vấn đề thông tin sai lệch (hallucination) từ AI, họ kiểm soát chặt chẽ các tác nhân giọng nói để không đi lệch khỏi cơ sở kiến thức đã được xác định trước.
Một thách thức lớn đối với các doanh nghiệp là quyết định giữa việc tiếp tục sử dụng các nhà cung cấp tự động hóa cuộc gọi hiện tại hay chuyển sang các công ty AI giọng nói đổi mới hơn. Tom Coshow từ Gartner khuyến nghị các doanh nghiệp nên thử nghiệm với AI Voice Agents ngay bây giờ, đặc biệt khi tốc độ cải tiến của công nghệ này rất nhanh.
Hiện tại, nhiều doanh nghiệp tập trung vào các tác nhân AI dạng chat và khuyến khích khách hàng tự giải quyết vấn đề trực tuyến. Tuy nhiên, nhu cầu về sự tương tác với con người vẫn tồn tại, đặc biệt trong các giao dịch có giá trị cao, nơi không nên giao phó hoàn toàn cho bot.
Bước tiếp theo là phát triển AI Voice Agents có khả năng thực hiện các tác vụ độc lập qua điện thoại như đặt chỗ nhà hàng, chốt đơn hàng, hoặc đặt hàng. Nikola Mrksic, CEO của PolyAI, tin rằng đây sẽ là tương lai của công nghệ này, mở ra nhiều cơ hội mới cho doanh nghiệp.
Tuy nhiên, việc triển khai rộng rãi vẫn cần thời gian để đảm bảo độ tin cậy và sự chấp nhận từ phía người dùng. Các doanh nghiệp cần cân nhắc kỹ lưỡng để cân bằng giữa tự động hóa và yếu tố con người trong dịch vụ khách hàng.
AI Voice Agents đang trở thành một công cụ mạnh mẽ, thay đổi cách doanh nghiệp tương tác với khách hàng. Với tốc độ phát triển nhanh chóng và khả năng giao tiếp tự nhiên, công nghệ này hứa hẹn sẽ mang lại nhiều lợi ích về chi phí và hiệu quả, đồng thời cải thiện trải nghiệm người dùng.
Tuy nhiên, để tận dụng tối đa tiềm năng của AI giọng nói, các doanh nghiệp cần giải quyết các thách thức về độ tin cậy và sự thoải mái của khách hàng. Trong tương lai, sự kết hợp giữa AI và yếu tố con người sẽ là chìa khóa để tạo ra dịch vụ khách hàng hoàn hảo.