Một tin vui với cộng đồng người khiếm thính ngay trong những tháng đầu năm 2019. Vừa qua, các kỹ sư thuộc Đại học bang Michigan đã thành công trong trong việc phát triển và xin cấp bằng sáng chế cho một công nghệ hỗ trợ ngôn ngữ ký hiệu đột phá - không giống như các cơ chế dịch thuật trước đây - không xâm lấn, nhỏ gọn và có khả năng di động như một thỏi son Chapstick.
“Chúng tôi tự hào thông báo rằng mình đã thành công trong việc mang đến một giải pháp phiên dịch ngôn ngữ ký hiệu ưu việt, một người bạn đồng hành đáng tin cậy cho những người không may mất khả năng nghe. Làm thế nào để người khiếm thính có thể giao tiếp một cách hiệu quả với một người không hiểu ngôn ngữ ký hiệu? Công nghệ mới này chính là giải pháp, nó sẽ đóng vai trò như một thông dịch viên ảo, cá nhân mà họ có thể mang theo bên mình ở mọi lúc, mọi nơi", Mi Zhang, phó giáo sư kỹ thuật điện - máy tính Đại học Michigan, chủ nhiệm công trình nghiên cứu cho biết.
Theo thống kê, hiện đang có hàng trăm ngàn người khiếm thính hoặc mắc các bệnh lý làm giảm khả năng nghe đang dựa vào hệ thống ngôn ngữ ký hiệu của Mỹ, hay còn gọi là ASL, để giao tiếp hằng ngày. Vấn đề nằm ở chỗ, nếu không có phiên dịch viên, họ sẽ không thế có cơ hội tìm được việc làm phù hợp, và đôi khi gặp rắc rối trong các tình huống nhạy cảm, khiến những người này vốn đã gặp bất lợi trong cuộc sống lại càng trở nên thiệt thòi hơn.
Giả sử, hãy suy nghĩ về việc bạn là người khiếm thính, đang ở trong bệnh viện và cần liên lạc với bác sĩ, bạn sẽ phải đợi người phiên dịch ngôn ngữ ký hiệu của bệnh viện hoặc người thân của mình đến giúp. Hay tệ hơn là chẳng ai có thể hiểu được thông điệp mà bạn cố gắng truyền đạt, điều này có thể dẫn đến những bi kịch thực sự, làm tổn hại đến quyền riêng tư của bạn, hay thậm chí là có thể nguy hiểm đến tính mạng. Đây chỉ là một ví dụ nhỏ thể hiện nhu cầu quan trọng đối với công nghệ dịch thuật ngôn ngữ ký hiệu.
Phó giáo sư Zhang và các đồng nghiệp, bao gồm tiến sĩ Biyi Fang và một số chuyên gia khác đến từ đại học Jillian Co, đã nhìn thấy và hiện thực hóa thành công một cơ hội để giúp những người khiếm thính vượt qua rào cản trong giao tiếp và có một cuộc sống dễ dàng hơn. Cụ thể, công nghệ của Mi Zhang và các đồng nghiệp được gọi là DeepASL, được ứng dụng tính năng học sâu hoặc học máy dựa trên dữ liệu, lấy cảm hứng từ cấu trúc và chức năng của não cùng với các thuật toán liên quan để qua đó, có thể tự động nhận biết ý nghĩa và dịch các ký hiệu sang tiếng Anh.
Công nghệ này hoạt động thông qua một thiết bị cảm ứng dài chừng 3 inch, phát triển bởi Leap Motion, và tất nhiên là sẽ được trang bị thêm cả camera để ghi lại chuyển động của tay cũng như ngón tay một cách liên tục khi sử dụng ngôn ngữ ký hiệu.
"Cảm biến sẽ mô phỏng và chuyển đổi chuyển động của bàn tay, ngón tay của một người thành cấu trúc các khớp xương. Sau đó, thuật toán học sâu của chúng tôi sẽ thu thập dữ liệu từ các khớp xương mà Leap Motion thu được và tiến hành phân tích, so sánh với các ký hiệu của ASL", ông Mi Zhang giải thích.
Tương tự như thiết lập Siri trên iPhone, người dùng có thể ký một số từ nhất định để thuật toán và cảm biến làm quen với chuyển động tay cũng như khớp của mình. Ngoài ra, người dùng cũng có thể tạo các dấu hiệu tùy chỉnh riêng cho tên của mình, hoặc các từ không nằm trong từ điển bằng cách đánh vần chúng, giúp tạo sự dễ dàng và thoải mái hơn khi giao tiếp.
Một đặc điểm tạo nên sự khác biệt của DeepASL là nó có thể dịch toàn bộ câu hoàn chỉnh mà không yêu cầu người dùng phải tạm dừng sau mỗi ký hiệu, trong khi các công nghệ dịch ngôn ngữ ký hiệu trước đây là lại chỉ có thể dịch từng từ và do đó, người dùng sẽ phải tạm dừng giữa các ký hiệu, rất bất tiện, mất thời gian, và thậm chí có thể dẫn đến hiểu sai ý nhau, khiến cho các cuộc trò chuyện trở nên khó khăn và khó xử trong một số tình huống.
"Ngoài ra, công nghệ của chúng tôi cũng không xâm phạm đến người dùng. Không giống như một vài công nghệ phiên dịch khác yêu cầu người dùng phải đeo găng tay, khiến họ cảm thấy bị thiệt thòi vì người khác có thể thấy được khuyết tật của mình theo nghĩa đen".
Ngoài khả năng giúp người khiếm thính giao tiếp với những người xung quanh, DeepASL còn có thể giúp những người học ASL bằng cách đưa ra phản hồi thời gian thực về việc đưa ra ký hiệu của họ. Trước đây, việc tự học thông qua các video hướng dẫn chứa rất nhiều hạn chế.
"Khoảng 90% trẻ em bị điếc bẩm sinh giao tiếp với bố mẹ thông qua ngôn ngữ ký hiệu. Các bậc phụ huynh này đang học ngôn ngữ ký hiệu để giao tiếp với con cái nhưng thường không có thời gian để tham dự các lớp học trực tiếp nên việc tự học sẽ gặp rất nhiều khó khăn. Công nghệ của chúng tôi có thể đưa ra các đánh giá để giúp người học cải thiện trình độ nhanh chóng", ông Zhang chia sẻ.
Cơ chế hoạt động của công nghệ DeepASL là chuyển ngôn ngữ ký hiệu thành cuộc trò chuyện bằng lời nói, nhìn chung sẽ rất hữu ích trong nhiều tình huống chứ không hẳn chỉ để hỗ trợ người khiếm thính. Các nhà nghiên cứu cho biết bước tiếp theo cho công nghệ mới này sẽ là thương mại hóa, giúp sản phẩm có thể đến tay hàng trăm ngàn người khiếm thính đang cần một phiên dịch viên thông minh, nhỏ gọn. Với giá bán lẻ dự kiến rơi vào khoảng 78 USD, thiết bị này hoàn toàn có thể trở thành một lựa chọn hợp lý với những người không quá dư giả. Ngoài ra, nhóm nghiên cứu cũng có kế hoạch phát triển công nghệ này để có thể tương thích được với iPhone, cũng như tự học các ngôn ngữ ký hiệu khác nhau.