Trí tuệ nhân tạo đang ngày càng đóng vai trò quan trọng trong nhiều lĩnh vực đời sống, biến cuộc sống của con người trở nên hiện đại và tiện nghi hơn. Mới đây, các nhà nghiên cứu đến từ các trường đại học Cambridge và Dundee (Anh Quốc) đã phát triển thành công một công cụ AI mới có thể giúp những người gặp khó khăn trong giao tiếp dễ dàng tương tác với người khác bằng cách loại bỏ từ 50% đến 96% các phím bấm mà người đó phải gõ để giao tiếp.
Thông thường, những người khuyết tật vận động, hoặc gặp khó khăn trong giao tiếp có xu hướng sử dụng các công cụ hỗ trợ chuyển đổi văn bản thành giọng nói theo thời gian thực để có thể giao tiếp với các đối tượng xung quanh. Thật không may, các công cụ này thường chậm và dễ gặp lỗi.
Nghiên cứu cho thấy tốc độ gõ trung bình của mọi người thường là từ 5 đến 20 từ mỗi phút, nhưng có thể nói được từ 100 đến 140 từ mỗi phút. Do đó, những người dựa vào máy móc để giao tiếp thường mất rất nhiều công sức và thời gian để có được một cuộc trò chuyện chất lượng với người khác.
Giáo sư Per Ola Kristensson từ Khoa Kỹ thuật Cambridge, tác giả của nghiên cứu, cho biết, sự khác biệt về tốc độ giao tiếp này được gọi là “khoảng cách giao tiếp”. Khoảng cách thường là từ 80 đến 135 từ mỗi phút và ảnh hưởng đến chất lượng tương tác hàng ngày đối với những người dựa vào máy móc để giao tiếp.
Công cụ AI mới được tạo ra sẽ giúp lấp đầy “khoảng trống” giao tiếp này bằng cách giảm số lượng tổ hợp phím mà một người cần gõ để giao tiếp.
Công cụ này có thể học tập thói quen của người dùng, phân tích khoảng thời gian trong ngày hoặc danh tính đối tác giao tiếp của người dùng và từ đó hỗ trợ đưa ra đề xuất các câu, từ phù hợp nhất để người dùng lựa chọn, thay vì phải gõ từ từng như trước đây.
Ngữ cảnh - yếu tố không kém phần quan trọng
Nhiều nghiên cứu đã chỉ ra rằng chúng ta có xu hướng nhắc lại một số câu và cụm từ nhất định trong cuộc trò chuyện, đó đôi khi chỉ đơn giản là thói quen, giúp cuộc giao tiếp trở nên sinh động hơn. Tuy nhiên, các công nghệ tổng hợp giọng nói hiện thường mất rất nhiều thời gian để truy xuất các nhóm từ này, và đôi khi mức độ chính xác là không cao.
Phương pháp được phát triển bởi Kristensson và các đồng nghiệp sử dụng AI để giúp người dùng nhanh chóng truy xuất các câu họ đã gõ trong quá khứ. Cụ thể khi người dùng bắt đầu gõ, hệ thống sẽ sử dụng thuật toán truy xuất thông tin để tự động truy xuất các câu từ trước đó có liên quan nhất đến ngữ cảnh của cuộc trò chuyện. Ngữ cảnh bao gồm thông tin về cuộc hội thoại như địa điểm, thời gian trong ngày. Đặc biệt, thuật toán thị giác máy tính được đào tạo có thể sử dụng camera trên thiết bị để nhận diện khuôn mặt của người giao tiếp đối diện, từ đó phân tích giới tính, tuổi tác của người này để đề xuất cách dùng từ phù hợp nhất.
Vẫn còn nhiều việc phải làm để ứng dụng đại trà công cụ AI này trong thực tế, tuy nhiên nó mang đến cho chúng ta hy vọng về các hệ thống AI trợ năng sáng tạo hơn dành cho những người khuyết tật.