DeepMind Technologies, công ty AI con của Alphabet - chuyên nghiên cứu về AI trong nhiều năm trời đã cho ra đời một nền tảng trí tuệ nhân tạo mới với tên gọi AlphaZero. AI này tận dụng mạng thần kinh sâu để có thể nhanh chóng tự học chơi cờ vây, cờ vua và cờ Shogi mà không cần có sự can thiệp nào của con người.
AlphaZero đã được mang ra thi đấu với những AI giỏi nhất thế giới về các trò chơi đánh cờ trên, bao gồm:
- Stockfish: AI vô địch thế giới môn cờ vua.
- Elmo: Quán quân Giải vô địch Cờ Shogi Máy tính Thế giới lần thứ 27 vào năm 2017.
- AlphaGo Zero: AI được cho là đấu thủ cờ vây mạnh nhất trong lịch sử, do chính Deep Mind tạ ra.
Trong cả ba môn thi đấu, AlphaZero chỉ được cung cấp kiến thức cơ bản về luật chơi. Sau đó, nó đã tự học bằng cách tự chơi với mình hàng triệu trận đấu. Ban đầu, AlphaZero chỉ thử nhiều chiến thuật ngẫu nhiên để chiến thắng, sau đó thông qua một quá trình thử đi thử lại gọi là "học tăng cường" nó dần nhận biết được những chiến thuật nào hiệu quả nhất.
Trong trình học và huấn luyện, AlphaZero sử dụng 5.000 đơn vị xử lý tensor (TPU - 1 đơn vị duy nhất có thể xử lý hơn 100 triệu bức ảnh trên Google Photos mỗi ngày) trong thời gian 9 giờ với môn cờ vua, 12 giờ với cờ Shogi, và 13 ngày với cờ vây.
Sau khi hoàn thành quá trình học hỏi, AlphaZero được cho thi đấu với các đối thủ khác. Và tất nhiên, AlphaZero đã nhanh chóng loại bỏ các đối thủ để trở thành đấu thủ mạnh nhất trong lịch sử.
Nhóm DeepMind đã trang bị cho AlphaZero một hệ thống được kết hợp bởi thuật toán học hỏi và "Monte Carlo tree search" (MCTS), một phương thức giúp các AI chơi cờ vây xác định được nên thực hiện bước đi nào tiếp theo, để giúp nó học chơi cờ vua và cờ Shogi. Kết quả cho thấy, MCTS có thể được thích nghi hoá vào các trò chơi phức tạp khác.
Một điều thú vị là AlphaZero không cần con người hướng dẫn mà nó tự nghiên cứu các chiến thuật và đưa ra những ý tưởng mà người ta chưa từng thấy trước đây. AlphaZero có phong cách chơi năng nổ và độ linh hoạt cao khiến Đại kỳ thủ cờ vua Matthew Sadler cũng phải kinh ngạc.
Với những chiến thuật và khả năng độc đáo, AlphaZero trở thành một công cụ giảng dạy chơi cờ tuyệt vời, khuyến khích tạo ra những lối chơi chiến thuật độc đáo chưa từng có cho những người muốn học cờ.
Xem thêm: