Biết cách xử lý dữ liệu lớn (big data) gồm dữ liệu phi cấu trúc từ cảm biến, video, trang mạng xã hội…, các tổ chức, doanh nghiệp có thể tăng hàng tỷ USD doanh thu và nâng cao hiệu quả hoạt động.
Giá trị tiềm tàng
Trao đổi với báo giới Việt Nam sáng 5/4/2012, ông Kaleem Chaudhry, Giám đốc Khối Công nghệ doanh nghiệp của Oracle Khu vực Châu Á - Thái Bình Dương, cho biết big data (những dữ liệu phi cấu trúc) đang thu hút sự chú ý của các giám đốc điều hành (CEO) trên thế giới bởi khả năng gia tăng giá trị cho tổ chức, doanh nghiệp. Cụ thể, nhờ ứng dụng công nghệ xử lý big data, hệ thống chăm sóc y tế của Mỹ đã gia tăng giá trị 300 tỷ USD; các doanh nghiệp cung cấp dịch vụ gia tăng doanh thu hàng năm tới 100 tỷ USD, còn ngành bán lẻ Mỹ tăng lãi ròng mỗi năm trên 60%…
Khái niệm và những giá trị của dữ liệu lớn vừa được Oracle giới thiệu với báo giới Việt Nam
sáng 5/4/2012, tại Hà Nội.
Để “diễn nôm” khái niệm big data, ông Kaleem đưa ra 3 dẫn chứng.
Dẫn chứng đầu tiên ông nêu lên là tại một cửa hàng bán lẻ lớn, đột nhiên thấy doanh thu tự nhiên xuống dốc, nếu chỉ nhìn vào kho dữ liệu truyền thống (các dữ liệu có cấu trúc như word, excel) thì chỉ có thể nắm bắt hiện trạng các giao dịch đang diễn ra, sản phẩm nào bán chạy hơn,... nhưng khó có thể biết được lý do vì sao doanh thu giảm. Tuy nhiên, thông qua việc thu thập thông tin có liên quan tới cửa hàng được thể hiện qua các câu chuyện bàn tán từ các cư dân của các trang mạng xã hội như Facebook, Twitter… (ví dụ sản phẩm hot của cửa hàng không có kích cỡ phù hợp với đối tượng khách hàng tiềm năng; hoặc sản phẩm chưa được chào bán tại một địa điểm đang có nhiều người chờ đón…), cửa hàng có thể tổng hợp thành những báo cáo cụ thể, qua đó có thể có câu trả lời cho việc sụt giảm doanh thu.
Tiếp đến, ông Kaleem nêu ra dẫn chứng tại một doanh nghiệp viễn thông có hàng trăm ngàn bộ chuyển mạch khác nhau, công nghệ xử lý big data sẽ khai thác dữ liệu từ các log file, phân tích sâu để nắm bắt thông tin của khách hàng (ví dụ có vấn đề trục trặc về thiết bị viễn thông, hoặc lỗi phủ sóng,...). Qua đó, doanh nghiệp viễn thông có thể đặt ra những cách thức ứng xử phù hợp, chẳng hạn như kịp thời đưa ra những gói ưu đãi cho người dùng…
Dẫn chứng thứ ba, tại một cơ quan an ninh quốc gia, big data đã hỗ trợ bộ phận điều tra tội phạm truy soát thông tin về tội phạm, chẳng hạn dữ liệu từ các thiết bị cảm biến tại các trạm soát vé (ghi biển số xe tội phạm chạy qua), hoặc giao dịch tài chính qua ngân hàng điện tử, hoặc các cuộc gọi điện thoại,…
“Khai phá” bằng 1 thiết bị tích hợp
Big data có đặc điểm là dung lượng lớn, định dạng đa dạng, nên muốn xử lý được big data thì đòi hỏi phải có công nghệ xử lý đặc biệt.
Theo ông Kaleem Chaudhry, Oracle hiện đang là hãng duy nhất có công nghệ xử lý big data. Cùng với 2 sản phẩm khác là Exadata (công nghệ xử lý dữ liệu có cấu trúc từ nhiều nguồn khác nhau) và Exalytics (chuyên hỗ trợ phân tích để ra báo cáo với định dạng thân thiện, dễ sử dụng), Bigdata góp phần giúp các tổ chức, doanh nghiệp nâng cao hiệu suất tài sản thông tin của mình để đưa ra quyết định điều hành đúng đắn, hiệu quả.
Ưu điểm vượt trội trong công nghệ xử lý big data của Oracle là tích hợp nhiều phần mềm vào một hộp thiết bị, trong đó có các phần mềm Oracle Linux, Oracle NoSQL, Open-source R distribution, Cloudera's Distribution (gồm cả Apache Hadoop), Cloudera Manager. Nhờ việc tích hợp này, khách hàng sẽ không phải vất vả tìm mua các sản phẩm rời rạc và tính toán cách thức xây dựng, kết nối các sản phẩm rời này thành một sản phẩm tích hợp có tính năng hiệu quả.
Điều kiện để có thể sử dụng công nghệ xử lý dữ liệu lớn của Oracle là tổ chức, doanh nghiệp phải có cấu hình phần cứng rất mạnh, với các thông số cụ thể gồm: phần cứng 216 lõi CPU, 864 GB RAM, 648TB dung lượng đĩa; 40Gb/s InfiniBand, kết nối liên tủ rack, node; 10 Gb/s Ethernet, kết nối trung tâm dữ liệu.