Các trang mạng xã hội nổi tiếng hiện nay như Facebook, Twitter hay Instagram đang ngày càng phải hứng chịu không ít chỉ trích về sự tiêu cực mà nó mang lại cho xã hội, hết lừa đảo, xuyên tạc, mạo danh, lại đến đánh cắp dữ liệu người dùng. Tuy nhiên nếu chỉ vì vậy mà phủ nhận hết công lao của các nền tảng truyền thông xã hội này thì thật bất công. Mới đây trang mạng xã hội lớn thứ 2 thế giới Twitter vừa mới góp phần lớn vào sự thành công của một công trình nghiên cứu có tác động lớn đến cuộc sống của chúng ta. Cụ thể hơn, mới đây đã xuất hiện thông tin về một công trình nghiên cứu khoa học được đăng tải trên Arxiv.org với tiêu đề: “Integrating Social Media into a Pan-European Flood Awareness System: A Multilingual Approach“ (tạm dịch: Tích hợp các phương tiện truyền thông xã hội vào hệ thống cảnh báo lũ lụt ở châu Âu: Phương pháp tiếp cận đa ngôn ngữ), bằng cách sử dụng một phương pháp có tên gọi Social Media for Flood Risk (SMFR), nhận được khá nhiều sự quan tâm của các chuyên gia khí tượng cũng như người dân trên toàn thế giới.
Theo đó, các nhà khoa học tại Joint Research Center - một trung tâm nghiên cứu tri thức và khoa học thuộc Ủy ban châu Âu, đã mô tả chi tiết cách thức mà những thông tin báo cáo theo thời gian thực được người dùng đăng tải trên các nền tảng truyền thông xã hội (đặc biệt là Twitter) có thể giúp ích hiệu quả cho hệ thống cảnh báo lũ lụt Châu Âu (EFAS).
Trên thực tế, công trình này được xây dựng chủ yếu dựa trên cảm hứng từ 3 công trình nghiên cứu khác đã được tiến hành thành công trước đó. Thứ nhất là những nghiên cứu đã được xuất bản bởi Đại học Harvard và Google vào tháng 8 năm 2018, mô tả chi tiết về một mô hình AI có khả năng dự đoán vị trí của các cơn dư chấn trong vòng một năm sau khi một trận động đất lớn xuất hiện. Thứ hai là một công trình nghiên cứu khác được thực hiện bởi các nhà nghiên cứu AI của Facebook vào tháng 12, trong đó phát triển thành công một phương pháp nhằm phân tích hình ảnh vệ tinh hiệu quả hơn thông qua các mô hình trí tuệ nhân tạo, qua đó có thể giúp định lượng thiệt hại từ các vụ cháy rừng trên diện rộng cũng như những thảm họa thiên nhiên khác một cách chính xác hơn. Bên cạnh đó, các nhà khoa học tại Google mới đây cũng đã công bố một bản hồi cứu về một hệ thống học máy (machine learning) có khả năng dự đoán chính xác tình hình lũ lụt trên các con sông với độ chính xác lên tới 75%.
Ở một nghiên cứu có liên quan khác, các chuyên gia máy tính ở Anh đã dùng các thuật toán học máy, trong đó sử dụng các bài tweet để tìm ra những địa điểm mà tình trạng bạo lực có thể xảy ra trong các cuộc bạo loạn, đồng thời cho phép họ có thể dự đoán tương đối chính xác thời gian các cuộc biểu tình lớn có thể xảy ra, cũng như xác định đích danh những kẻ kích động đứng sau các cuộc biểu tình.
“Trong vòng một thập kỷ qua, các phương tiện truyền thông xã hội đã nổi lên như một nguồn cung cấp thông tin có liên quan chặt chẽ đối với các thảm họa, và chính điều này đã thu hút các nhà nghiên cứu từ nhiều lĩnh vực khác nhau quan tâm hơn đến việc làm sao để tận dụng được nguồn thông tin hữu ích này. Qua phân tích và đánh giá thực tế, các nền tảng truyền thông xã hội đã chứng minh được tiềm năng to lớn trong việc có thể cung cấp thông tin kịp thời, quý giá về sự phát triển liên quan đến không gian và thời gian của một cuộc khủng hoảng, hay một thảm họa bất kỳ, cũng như hỗ trợ xác định các sự kiện quan trọng liên quan đến thảm họa đó”, các nhà nghiên cứu cho biết.
Trở lại với công trình nghiên cứu mới của EU. Nếu bạn chưa biết thì EFAS là một phần của Dịch vụ quản lý khẩn cấp Copernicus (Copernicus EMS) và được điều hành trực tiếp bởi Trung tâm điều phối ứng phó khẩn cấp của Ủy ban châu Âu (ERCC). Đồng thời, ERCC cũng là một bộ phận của Ủy ban châu Âu, được thành lập để chịu trách nhiệm về các hoạt động viện trợ và bảo vệ nhân đạo, cũng như hỗ trợ các phản ứng phối hợp ứng phó trước, trong và sau các thảm họa xảy ra cả bên trong và ngoài châu Âu. Nói một cách cụ thể hơn thì nhiệm vụ chính của ERCC là giám sát các mối nguy hiểm và rủi ro tiềm tàng, thu thập và phân tích dữ liệu về thảm họa nhằm chuẩn bị kế hoạch cho các phương án triển khai hỗ trợ kịp thời. Bên cạnh đó, ERCC cũng sẽ cung cấp các dự báo cho EFAS - chủ yếu là dự báo về tình hình bão lũ, dự báo thời tiết theo mùa, cũng như đánh giá tác động và cảnh báo sớm.
Nhìn chung, hệ thống cảnh báo của các nhà nghiên cứu có nhiệm vụ xác định xem khi nào nguy cơ lũ lụt ở một khu vực địa lý nhất định vượt quá ngưỡng an toàn cho phép. Chính điều này đã khiến nhóm nghiên cứu của EFAS nảy ra ý tưởng thu thập dữ liệu có liên quan từ các trang mạng xã hội, đặc biệt là Twitter bằng cách điều chỉnh và chọn lọc tối đa 400 từ khóa cùng một lúc.
Tuy nhiên, việc trích xuất các bài tweet với những từ khóa có liên quan (tức là các từ có thể chỉ ra thông tin về trận lụt sắp xảy ra hoặc đã xảy ra gần đây) không phải là một nhiệm vụ dễ dàng với các nhà nghiên cứu tại EFAS, bởi đơn giản châu Âu là một khu vực rộng lớn với dân số lên đến hơn 741 triệu người và sử dụng 27 ngôn ngữ khác nhau. Giải pháp được đặt ra ở đây là sử dụng một hệ thống phân loại đa ngôn ngữ. Hệ thống phân loại này sẽ dùng các biểu diễn toán học phi ngôn ngữ, hoặc từ nhúng, để suy ra sự tương đồng giữa các từ khóa trong 4 loại ngôn ngữ chính ở châu Âu là tiếng Đức, tiếng Anh, tiếng Tây Ban Nha và tiếng Pháp.
Hệ thống này thực ra là một mô hình học máy, và để đào tạo nó, các nhà khoa học đã phải sử dụng đến một kho dữ liệu chứa hơn 7.000 tin nhắn có chú thích (từ 1.200 đến 2.300 tin nhắn cho mỗi loại ngôn ngữ). Trong khi đó, họ cũng sử dụng một mô hình riêng biệt để đưa ra những thông điệp “đại diện” (các tweet có ít nhất 90% khả năng liên quan đến lũ lụt) cho các khu vực có nguy cơ bị lũ lụt được dự đoán từ trước.
Để kiểm tra tính khả thi trong cách tiếp cận này, các nhà khoa học đã tích hợp SMFR vào EFAS và triển khai nó trong trận lũ lụt gây ảnh hưởng đến Calabria, Ý, vào đầu tháng 10 năm 2018. SMFR đã thu thập được tổng cộng 14.347 bài tweet có giá trị trong vòng 2 ngày, sau đó tiến hành các phân tích có liên quan. Nhóm nghiên cứu báo cáo rằng các thông điệp được lọc bằng mô hình AI này có mối tương quan vô cùng chặt chẽ với tình hình lũ lụt thực tế, và đồng thời cho rằng đây là bước khởi đầu đầy hứa hẹn đối với một hệ thống có thể giúp rút ngắn đáng kể thời gian ứng phó trong các giai đoạn đầu của thảm họa:
“Trong suốt diễn biến của một thảm họa bất kỳ, những thông điệp thu thập được có thể mang lại giá trị cực lớn đối với các điều phối viên cứu hộ quốc tế, bởi chúng góp phần cung cấp cái nhìn sâu sắc hơn về phản ứng cụ thể của địa phương, và về những tình huống mà người bị ảnh hưởng bởi thảm họa hay cảnh báo thảm họa có thể sẽ phải đối mặt. Đối với các hoạt động nghiên cứu trong tương lai, chúng ta có thể hình dung về một hệ thống tương tự nhưng được áp dụng trên quy mô toàn cầu, bao gồm hàng chục ngôn ngữ khác nhau, đồng thời đẩy mạnh việc sử dụng nhiều hơn nữa các nền tảng truyền thông xã hội khác nhau như nguồn dữ liệu có thể cung cấp thông tin cho các mô hình dự đoán dựa trên trí tuệ nhân tạo một cách thực sự hiệu quả”.