AI của Google DeepMind trở thành “game thủ” StarCraft 2 đỉnh nhất thế giới

Các nền tảng trí tuệ nhân tạo của DeepMind đã trở nên nổi tiếng trên khắp thế giới trong vài năm trở lại đây nhờ vào khả năng làm chủ tuyệt vời đối với các trò chơi phức tạp, cần “nhiều não” như cờ vua, shogi và Go. Qua thời gian, chúng dần “tiến hóa”, đánh bại các game thủ bằng da bằng thịt của chúng ta với các kỹ thuật học máy tiên tiến.

Đầu năm nay, một phiên bản mới của mô hình AI được xây dựng riêng cho trò chơi chiến lược thời gian thực StarCraft 2 với tên gọi AlphaStar, đã được DeepMind giới thiệu. AlphaStar cũng đã kế thừa rất tốt truyền thống của đàn anh, đó khiến con người phải xấu hổ với những chiến thắng áp đảo trước không ít tay chơi StarCraft 2 hàng đầu thế giới ở thời điểm hiện tại.

StarCraft 2

Sau gần 10 tháng “tu luyện”, AlphaStar hiện đã trở thành “game thủ” StarCraft 2 đỉnh nhất thế giới theo đúng nghĩa đen! Cụ thể hơn, vào hôm thứ tư 30/10 vừa qua, DeepMind đã công bố một nghiên cứu mới về AlphaStar trên tạp chí Nature, trong đó nêu chi tiết về việc mô hình AI này đã đi được bao xa trong thế giới StarCraft 2, và rất tiếc phải thông báo với cộng đồng game thủ StarCraft 2 rằng AlphaStar hiện đã giành được xếp hạng Grandmaster, nghĩa là mô hình AI này có thể đánh bại 99.8% trong số tất cả các game thủ StarCraft 2 trên toàn thế giới.

Câu hỏi đặt ra ở đây là tại sao các nhà nghiên cứu lại xây dựng những mô hình AI cho một tựa game video thích hợp, và mô hình AI này có thể dạy chúng ta điều gì về công nghệ trí tuệ nhân tạo và học máy?

Nếu bạn chưa biết thì StarCraft 2 là một trò chơi chiến lược thời gian thực, nơi người chơi kiểm soát một trong ba đội (hoặc "chủng tộc" (races), theo cách nói trong game). Mỗi chủng tộc lại sở hữu những thuộc tính đặc trưng và người chơi phải điều khiển một đội quân hàng trăm đơn vị trên một bản đồ rộng lớn. Trong khi quản lý tài nguyên để xây dựng các đơn vị quân đội, người chơi sẽ phải đồng thời tấn công kẻ thù và bảo vệ căn cứ của mình. Với gameplay như vậy, có vô số chiến thuật cũng như chiến lược từ đơn giản đến phức tạp mà người chơi có thể áp dụng nhằm mục đích cuối cùng là giành chiến thắng.

Độ phức tạp và chiều sâu của trò chơi khiến nó trở thành một thách thức quan trọng đối với AI. Không giống như ở cờ vua hoặc cờ vây, trong thế giới StarCraft II, người chơi không thể thấy đối thủ của mình đang làm gì. Ngoài ra, trong khi cờ vua hoặc cờ vây cho phép bạn tạm dừng và suy xét về chiến lược - StarCraft II là tựa game "thời gian thực", vì vậy một khi trò chơi bắt đầu, chỉ có chiến thắng hoặc thất bại mới có thể dừng đồng hồ.

AlphaStar

DeepMind đưa AlphaStar qua một chế độ đào tạo khá đơn giản. Đầu tiên, nó được xem gần một triệu replay của những game thủ hàng đầu để học chiến thuật và tìm cách bắt chước. Sau đó, AlphaStar được “tỉ thí” với một mô hình AI khác cũng của DeepMind để nó có thể đúc kết xem chiến lược nào mang lại hiệu quả tối ưu nhất trong một kỹ thuật được gọi là "học tăng cường" (reinforcement learning). Quá trình này đào tạo AI bằng cách cho nó thấy rằng chiến thắng là “tốt” và thua là “xấu”.

Trên thực tế, AlphaStar cũng sở hữu một số lợi thế so với con người. Ví dụ, đối với một người bình thường, có không ít yếu tố khách quan có thể làm hạn chế khả năng tuy duy và tốc độ phản ứng của não bộ trước mỗi tình huống. Để cho công bằng, nhóm DeepMind đã cố tình cản trở AlphaStar, trì hoãn thời gian tính toán, độ trễ và hạn chế số lượng hành động mà nó có thể thực hiện mỗi phút. Tuy nhiên AlphaStar vẫn biết cách tự vượt qua tất cả và thể hiện xuất sắc.

"Tôi thấy lối chơi của AlphaStar cực kỳ ấn tượng", Dario "TLO" Wünsch, một chuyên gia StarCraft II của Đức, cho biết trong một tuyên bố. "Hệ thống này rất thành thạo trong việc đánh giá vị trí chiến lược của mình và biết chính xác khi nào nên tấn công hoặc buông tha với đối thủ".

Việc máy móc có thể đánh bại hoàn toàn con người trong một trò chơi video phức tạp nghe có vẻ đáng sợ như kịch bản về ngày tận thế khi robot xâm chiếm trái đất, nhưng trên thực tế, nhóm DeepMind phát triển các mô hình AI như AlphaStar nhằm cải thiện những hệ thống khác trong thế giới thực.

Đối với các nhà nghiên cứu, việc thành thạo một trò chơi chiến lược thời gian thực phức tạp như StarCraft II là một trong những bước đầu tiên để tạo ra AI tốt hơn, an toàn hơn cho các ứng dụng có thể thay đổi nhân loại như y tế, xe tự hành và robot.

Chủ Nhật, 10/11/2019 00:25
31 👨 432