IBM cử siêu máy tính Watson dự thi trò chơi truyền hình

Công ty IBM lần đầu tiên tiết lộ cấu hình siêu máy tính Watson vốn được xây dựng để tham dự cuộc thi truyền hình trực tiếp Jeopardy tại Mỹ.

"Để máy tính có thể cạnh tranh được với con người trong cuộc thi này, tốt nhất là chia quá trình tập hợp các phương án trả lời thành nhiều thành phần nhỏ và xử lý chúng trong chế độ song song", các chuyên gia IBM khẳng định. Siêu máy tính Watson của IBM sử dụng chiến lược này để tham gia cuộc thi truyền hình trực tiếp Jeopardy diễn ra tại Trung tâm nghiên cứu Yorktown Heights của IBM. Truyền hình Mỹ sẽ phát sóng trò chơi này trong các kỳ phát sóng từ 14 đến 16/2/2011.

IBM cử siêu máy tính Watson dự thi trò chơi truyền hình
Siêu máy tính Watson của IBM. (Ảnh internet)

IBM giấu kín cấu hình của Watson rất lâu, nhưng mới đây, Giám đốc cao cấp quản lý dự án David Ferrucci đã vén tấm màn bí mật, nói về những đặc điểm kết cấu của hệ thống này. Đối với IBM, sự tham gia của máy tính vào trò chơi Jeopardy đã trở thành bước tiếp theo của sự phát triển trí tuệ nhân tạo. Năm 1997, máy tính Deep Blue của Công ty đã thắng vua cờ lúc đó là Garry Kasparov.

Theo Ferrucci, chiến thắng trong trò chơi Jeopardy là bài toán phức tạp hơn nhiều: "Trong bộ môn cờ vua, không có yếu tố không rõ ràng, không có gì phải đoán dựa trên ngữ cảnh. Ngược lại, các câu hỏi trong Jeopardy chứa đựng những tinh tế trong giao tiếp của con người, trong đó có sử dụng cách nói ám chỉ và gián tiếp. Đây là nhiệm vụ cực kỳ phức tạp. Quá trình xử lý ngôn ngữ tự nhiên rất phức tạp vì cùng một thông tin có thể diễn đạt bằng hàng loạt phương pháp khác nhau. Phương pháp của Watson là "chia để trị". Máy tính xem xét các dữ liệu từ hàng loạt quan điểm khác nhau, sau đó thống nhất kết quả dựa trên thực tế là có nhiều cách khác nhau để diễn đạt một hiểu biết nào đó".

Trong cuộc thi truyền hình Jeopardy, các câu hỏi được đặt ra dưới dạng khẳng định về một điều gì đó, còn các thí sinh phải đưa ra câu trả lời ngược lại dưới dạng câu hỏi! Để làm cho bài toán phức tạp hơn nữa, các câu hỏi thường được trình bày nhập nhằng, đa nghĩa, sao cho các thí sinh buộc phải đoán xem câu chuyện đang nói về vấn đề gì. Ví dụ, câu hỏi như sau: "Tấm vải này đo được 40 mét" (trong câu gốc, từ fabric ngoài nghĩa là "vải" còn có nghĩa là "công trình xây dựng", do vậy có thể hiểu câu này là "Công trình này rộng 40 mét"). Câu trả lời có thể giống thế này: "Đó là một cuộn vải?".

Ngay khi người dẫn chương trình kết thúc câu hỏi, các thí sinh có thể nhấn nút trả lời. Người nào nhấn nút nhanh hơn sẽ được quyền trả lời đầu tiên. Thường để đặt câu hỏi, người dẫn chương trình dùng khoảng gần 3 giây, Ferrucci cho biết. Trong thời gian này, Watson phải kịp chọn câu trả lời phù hợp.

Thoạt nhìn, bài toán có vẻ đơn giản bởi hệ thống tìm kiếm trên Internet tìm các câu trả lời cho các câu hỏi tương tự hàng triệu lần mỗi ngày. Tuy nhiên, không đơn giản thế, Ferrucci khẳng định. "Cho rằng máy tính chỉ tập hợp các câu trả lời là không chính xác. Tôi cũng muốn là công việc chỉ đơn giản như vậy. Google và các nguồn lực Internet khác chỉ đưa ra các tài liệu có thể chứa đựng các câu trả lời cho câu hỏi của bạn chứ không phải là chính những câu trả lời đó. Từ cơ sở dữ liệu có rút ra các tư liệu cần thiết cho câu trả lời, nhưng chỉ với điều kiện là câu hỏi phải cực kỳ rõ ràng. Trên thực tế, hệ thống của chúng tôi buộc phải làm sáng tỏ được nghĩa của câu hỏi và cân nhắc trong rất nhiều lựa chọn tiềm năng để đưa ra câu trả lời".

Hệ thống phần mềm định hướng quá trình tìm kiếm được IBM gọi là DeepQA. Nó tập hợp những chức năng xử lý ngôn ngữ tự nhiên, học máy (machine learning) và truy xuất thông tin. Sau khi nhận được câu hỏi, máy thoạt đầu phân tích nó, nhận dạng tên gọi, ngày giờ, địa danh và các chi tiết khác liên quan cũng như nghiên cứu cấu trúc ngữ pháp của câu văn, tìm các manh mối cho phép hiểu bản chất của câu hỏi.

Đôi khi, câu hỏi là hiển nhiên và khi đó, câu trả lời thực sự có thể tìm được nhờ vào tìm kiếm đơn giản theo cơ sở dữ liệu cụ thể. Tuy nhiên, đúng nguyên tắc, để trả lời phải cùng lúc cho chạy 5 - 10 tác vụ tìm kiếm theo các nguồn khác nhau, mỗi nguồn chọn ra một kiến giải trả lời câu hỏi. Đối với Jeopardy, ở IBM, người ta đã thu thập khối lượng khổng lồ các tài liệu tra cứu, trong đó có hàng loạt bách khoa toàn thư, hàng triệu tác phẩm báo chí và văn chương. Một số trong những tài liệu này lưu trong cơ sở dữ liệu còn một số khác lưu trữ dưới dạng file text thông thường.

Quá trình tìm kiếm câu trả lời là một quá trình lặp đi lặp lại: Sau khi nhận được tổ hợp các kết quả, có thể cần đến một sê-ri mới các tác vụ tìm kiếm. "Tại một giai đoạn nhất định, hàng trăm bộ vi xử lý có thể cùng lúc hoạt động và từng bộ xử lý đó đem lại những phương án trả lời mới - Ferrucci cho biết - Hãy hình dung, sự phân mảnh này sẽ như thế nào". Trong kết quả cuối cùng, máy có thể nhận được vài nghìn các câu trả lời tiềm năng.

Trò chơi Jeopardy cần 1 câu trả lời duy nhất và phải chính xác tuyệt đối. Cho nên, khi tất cả câu trả lời tiềm năng đã được thu thập, nhờ khoảng một trăm thuật toán, hệ thống sẽ đánh giá từng câu trả lời tiềm năng từ các góc tiếp cận khác nhau, ví dụ, câu trả lời có phù hợp về thời gian mà câu hỏi đặt ra hay không; câu trả lời có phù hợp với vùng địa lý cần thiết không; cú pháp câu trả lời có đáp ứng câu hỏi không... Cả việc kiểm tra theo tiêu chí cũng được tiến hành, ví dụ, nếu câu hỏi đòi hỏi gọi tên chất lỏng thì tất cả phương án câu trả lời không mang hình bóng chất lỏng sẽ bị văng ra. Câu trả lời với số điểm phù hợp cao nhất sẽ được máy chọn là câu trả lời cuối cùng.

Nếu chương trình phần mềm thực hiện cách nói trên mà chạy trên máy tính 1 bộ xử lý hiện đại thì việc lựa chọn 1 câu trả lời phải mất 2 giờ, Ferrucci khẳng định. Watson thì cấu thành từ 2 cụm máy chủ IBM Power7 System chứa đựng tổng cộng 2.500 nhân xử lý làm việc theo cấu hình cụm máy. Trong mỗi socket hệ thống có một bộ xử lý 6 hay 8 nhân có khả năng đồng thời xử lý 32 luồng tính toán, theo Tom Rosamilia, Tổng giám đốc IBM phụ trách các hệ thống Power và z cho biết. Trong mỗi luồng tính toán như vậy có thể hoàn tất một quá trình tìm kiếm riêng biệt.

"Ưu thế quan trọng của thết bị IBM nằm ở khả năng hoàn thành nhiều quá trình trên một hệ thống nhân tính toán - Rosamilia giải thích. Nói cách khác, nhờ thực hiện DeepQA đồng thời trên nhiều máy chủ, vận tốc công việc của hệ thống phần mềm được nâng lên rõ rệt".

Mặc dù được dựa trên sức mạnh thiết bị và độ phức tạp của chương trình phần mềm, chiến thắng của Watson trong trò chơi truyền hình còn xa mới có thể nói là sẽ được đảm bảo! Hồi tháng 6/2010, The New York Times đã thông báo rằng hệ thống cần phải được hoàn thiện nhiều để có thể có tốc độ sánh với tư duy trong trò chơi Jeopardy.

Tuy nhiên, không phụ thuộc vào kết quả của cuộc thi truyền hình, những phát triển của đội ngũ do Ferrucci dẫn đầu trong tương lai có thể tìm được những ứng dụng rộng khắp. Cùng với thời gian, tại IBM, trên cơ sở của DeepQA, người ta dự kiến thành lập các hệ thống thương mại hoá tìm kiếm các câu trả lời cho các câu hỏi của nhiều ngành, lĩnh vực như y tế, hỗ trợ kỹ thuật, tư pháp...

"Cuối cùng, kết quả cuộc thi vô địch Jeopardy với Watson không quan trọng lắm - Tổng biên tập tuần tạp chí Pund-IT Charles King viết trên tạp chí của mình - Hệ thống máy tính này đủ mạnh để thi đấu với con người về khả năng trí tuệ, chứng tỏ bước đột phá công nghệ khổng lồ và báo hiệu một sự đổi mới ghê gớm trong các hệ thống CNTT thương mại".

Trong cuộc thi thử trên các kênh truyền hình Mỹ với sự tham gia của Watson và các nhà vô địch Jeopardy là Ken Jennings và Brad Patter, máy tính cho thấy khả năng đánh bại con người. Chính các quán quân của các cuộc thi truyền hình không buồn mà còn khẳng định máy tính chơi ngang ngửa với các kiện tướng của trò chơi Jeopardy.

Về chuyện máy tính sẽ chơi tiếp theo như thế nào, chúng ta sẽ rõ vào tháng 2/2011.

Watson (là tên máy tính + chương trình) sẽ thi trực tiếp trò chơi Jeopardy trên truyền hình Mỹ vào 14 - 16/2/2011. Nó thi đấu cùng 2 người đoạt giải nhất các vòng loại cuộc thi Jeopardy. Máy phải nghe câu hỏi, phân tích, tìm đáp án (không được tìm trên Internet) và trả lời bằng tiếng Anh (voice). Câu hỏi thuộc đủ các lĩnh vực. Mặc dù chưa biết thắng - thua thế nào, đây vẫn là sự kiện lớn của ngành CNTT khi máy tính được dịp chứng tỏ khả năng tư duy như con người.

Thứ Năm, 20/01/2011 11:21
31 👨 446
0 Bình luận
Sắp xếp theo
    ❖ Tổng hợp