Các nhà nghiên cứu AI của Microsoft vô tình để lộ hàng terabyte dữ liệu nhạy cảm nội bộ

Các nhà nghiên cứu AI của Microsoft đã vô tình làm lộ hàng chục terabyte dữ liệu nhạy cảm, bao gồm cả private key và mật khẩu, trong khi xuất bản kho lưu trữ dữ liệu đào tạo nguồn mở trên GitHub.

Trong nghiên cứu được chia sẻ với TechCrunch, startup bảo mật đám mây Wiz cho biết họ đã phát hiện ra kho lưu trữ GitHub thuộc bộ phận nghiên cứu AI của Microsoft như một phần trong công việc đang tiến hành của họ về việc vô tình làm lộ dữ liệu được lưu trữ trên đám mây.

Người đọc kho lưu trữ GitHub, nơi cung cấp mã nguồn mở và các mô hình AI để nhận dạng hình ảnh, được hướng dẫn tải xuống những model từ Azure Storage URL. Tuy nhiên, Wiz nhận thấy rằng URL này đã được cấu hình để cấp quyền trên toàn bộ tài khoản lưu trữ, do nhầm lẫn làm lộ thêm dữ liệu riêng tư.

Dữ liệu này bao gồm 38 terabyte thông tin nhạy cảm, bao gồm cả bản sao lưu trên máy tính cá nhân của hai nhân viên Microsoft. Dữ liệu này cũng chứa nhiều thông tin cá nhân nhạy cảm khác, bao gồm mật khẩu các dịch vụ của Microsoft, key bí mật và hơn 30.000 tin nhắn Microsoft Teams nội bộ từ hàng trăm nhân viên Microsoft.

Theo Wiz, URL đã tiết lộ dữ liệu này kể từ năm 2020 cũng bị cấu hình sai, cho phép các quyền "toàn quyền" thay vì "chỉ đọc", điều đó có nghĩa là bất kỳ ai biết nơi cần tìm đều có thể xóa, thay thế và đưa nội dung độc hại vào chúng.

Wiz lưu ý rằng tài khoản lưu trữ không bị lộ trực tiếp. Thay vào đó, các nhà phát triển AI của Microsoft đã bao gồm token SAS (Shared Access Signature) quá dễ dãi trong URL. Token SAS là một cơ chế được Azure sử dụng cho phép người dùng tạo các liên kết có thể chia sẻ để cấp quyền truy cập vào dữ liệu của tài khoản Azure Storage.

“AI mở ra tiềm năng to lớn cho các công ty công nghệ”, đồng sáng lập Wiz và CTO Ami Luttwak nói với TechCrunch. “Tuy nhiên, khi các nhà khoa học và kỹ sư dữ liệu chạy đua để đưa các giải pháp AI mới vào sản xuất, lượng dữ liệu khổng lồ mà họ xử lý đòi hỏi phải có các biện pháp bảo vệ và kiểm tra bảo mật bổ sung. Với việc nhiều nhóm phát triển cần thao tác với lượng dữ liệu khổng lồ, chia sẻ dữ liệu đó với các đồng nghiệp của họ hoặc cộng tác trong những dự án nguồn mở công cộng, những trường hợp như của Microsoft ngày càng khó theo dõi và tránh khỏi”.

Wiz cho biết họ đã chia sẻ những phát hiện của mình với Microsoft vào ngày 22 tháng 6 và Microsoft đã thu hồi token SAS hai ngày sau đó vào ngày 24 tháng 6. Microsoft cho biết họ đã hoàn tất cuộc điều tra về tác động tiềm tàng của tổ chức vào ngày 16 tháng 8.

Trong một bài đăng trên blog được chia sẻ với TechCrunch trước khi xuất bản, Trung tâm phản hồi bảo mật của Microsoft cho biết “không có dữ liệu khách hàng nào bị lộ và không có dịch vụ nội bộ nào khác gặp rủi ro vì vấn đề này”.

Microsoft cho biết, nhờ nghiên cứu của Wiz, họ đã mở rộng dịch vụ bí mật của GitHub, dịch vụ này giám sát tất cả các thay đổi mã nguồn mở công khai để phát hiện thông tin xác thực dạng plaintext và những bí mật khác bao gồm bất kỳ token SAS nào có thể có các đặc quyền hoặc hết hạn quá mức cho phép.

Thứ Tư, 20/09/2023 07:06
51 👨 300
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ