Làm sao có thể biết Website của bạn đang thực thi tốt công việc của nó? Câu trả lời bạn tìm kiếm có thể đã nằm ngay trên máy chủ của bạn. Bí mật nằm trong việc theo dõi cách thức khách hàng truy nhập website, nhờ đó người quản trị có thể biết được những nơi nào của Website thu hút khách hàng truy nhập và nơi nào không được khách hàng quan tâm.
Thuật ngữ được biết đến như là “phân tích web” (web analytics) không mô tả hết những công đoạn trong quá trình này. Đôi khi việc không tuân theo đúng “thủ tục” có thể khiến bạn mất đi những lợi thế rất lớn trong các hoạt động liên quan tới website.
Trước đây người ta thường chỉ quan tâm tới số lượt truy nhập (hit) và coi đó là chỉ số quan trọng duy nhất đánh giá sự phát triển của website. Tuy nhiên, hiện tại việc theo dõi sự truy nhập của khách hàng đã được nhìn nhận một cách toàn diện hơn nhiều và cho ta không ít con số thống kê. Nếu bạn nghiêm túc với những con số, kết quả thống kê sẽ hỗ trợ bạn đưa ra những quyết định sáng suốt nhất về thiết kế, nội dung, cấu trúc thông tin và sơ đồ điều hướng của website. Thông tin mà bạn có thể có bao gồm số hit của từng trang trong website, mức độ của các công cụ tìm kiếm trong việc lôi kéo người truy nhập tới website của bạn, thông tin về người truy nhập, hệ điều hành và trình duyệt họ đang sử dụng v.v… Với lượng thông tin phong phú như vậy, vấn đề nằm ở chỗ làm sao tận dụng tốt những thông tin đó.
Các bộ đếm miễn phí
Thông tin quan trọng hay vô ích tuỳ thuộc vào nhu cầu của bạn. Chẳng hạn, bạn muốn phát triển các tổ hợp từ khoá (keyword) để lôi kéo thêm người truy nhập hay cần đo lường mức độ hiệu quả của một chiến dịch quảng cáo: do đặt các banner quảng cáo, in địa chỉ Website trên các ấn phẩm hoặc đưa địa chỉ website lên các webite có liên quan.. Cũng có thể bạn muốn biết chính xác nội dung được nhiều người truy nhập nhất, số lượng lỗi phát sinh (theo phản hồi của người truy nhập). Biết được mình quan tâm tới những vấn đề nào bạn sẽ biết cần phải “đo lường” để lấy được những thông tin gì liên quan tới việc truy nhập của người sử dụng.
Quá trình phân tích website bắt đầu từ công việc giản đơn nhất là đong đếm “số hit”. Trên mạng hiện tồn tại không ít các “bộ đếm hit” (hit counter) miễn phí dành cho nhà quản trị. Có hai hình thức cài đặt “bộ đếm hit”: bộ đếm sử dụng qua các đoạn mã (script) được chèn vào các trang Web đặt trên máy chủ của bạn hoặc bộ đếm được “điều khiển từ xa” - đặt trên máy chủ khác. Nếu chỉ muốn đong đếm một trang (trang chủ), bạn nên lựa chọn phương pháp thứ hai. Trong khi đó, giải pháp đặt trực tiếp các đoạn mã đếm trên máy chủ của mình tiện lợi cho việc triển khai đồng loạt nhiều bộ đếm (để so sánh mức độ phổ biến giữa các trang). Ngoài ra, theo hình thức này bạn cũng có thể chủ động lựa chọn cho hiển thị hay không hiển thị kết quả đếm trên trang web.
Có rất bộ đếm tốt, miễn phí. Đầu tiên là WebCounter (digits.com), công cụ được coi là một trong những bộ đếm đầu tiên xuất hiện trên mạng, được phân phối dưới cả hai hình thức: tính năng cơ bản (miễn phí) và tính năng nâng cao (tính phí). Tiếp đến phải kể tới FastCounter (bcentral.com), đặc tính đong đếm mạnh và tin cậy. Nổi bật trong số các bộ đếm cho phép bạn cài đặt trên máy chủ của mình là Matt’s Counter (scriptarchive.com).
Điều khiển từ xa
Có rất nhiều bộ đếm phức tạp đến, từ thống kê số hit đơn giản và phân tích web theo chiều sâu. Các công cụ thống kê được host ở nơi khác cũng có thể cung cấp cho bạn hầu như mọi thông tin yêu cầu liên quan tới người truy nhập. Công việc mà bạn phải làm chỉ là đăng ký dịch vụ và copy và dán vài dòng mã lệnh lên trang. TheCounter.com là một ví dụ điển hình. Mức phí sử dụng bộ đếm của website này rất “bèo” (trước đây là miễn phí). Dịch vụ của TheCounter.com cung cấp không chỉ thống kê từng trang con mà còn cả con số trung bình trong từng ngày, thông tin tham khảo, chỉ số về độ phân giải màn hình, loại trình duyệt v.v…, tóm lại là những thông tin cần thiết để bạn điều chỉnh website theo nhu cầu người truy nhập. Dịch vụ khác (hoàn toàn miễn phí) là Extreme Tracker. Nó sẽ “nhúng” một đường dẫn tới trang cần thống kê của bạn và có thể hỗ trợ đo đếm nhiều trang (xem chi tiết tại http://www.extreme-dm.com).
Trước khi quyết định cài đặt hoặc đăng ký Extreme Tracker hoặc TheCounter, hãy kiểm tra gói thuê bao hosting của bạn. Nhiều nhà cung cấp dịch vụ hosting tích hợp sẵn các bộ đếm trong tài khoản của khách hàng.
Lựa chọn thống kê trong số hit là một chuyện, việc chắt lọc thông tin từ kho dữ liệu thu thập được trên toàn bộ website lại là chuyện khác. Chính vì vậy, trọng tâm ở đây dịch chuyển từ cách thức thu thập thông tin sang cách thức khai thác những thông tin đã thu thập được. Nếu bạn đã từng xem một tệp nhật ký (log file) nằm trong một máy chủ, bạn sẽ thấy tệp này là các chuỗi ký tự dài, lưu trữ thông tin về những lần truy nhập. Trong tệp tin là thông tin chi tiết về mỗi “hit”: chúng xuất phát từ đâu, kiểu truy vấn thông tin, trang truy nhập, trình duyệt gửi truy vấn, thời gian gửi truy vấn v.v… Có thể bạn sẽ phải trả thêm tiền nếu muốn tiếp cận các log file trong các máy chủ. Một số nhà cung cấp dịch vụ thậm chí không cho phép khách hàng tiếp cận trực tiếp (thời gian thực) các log file.
Chắt lọc thông tin có nghĩa từ các nguồn dữ liệu thô sẽ là điều không tưởng nếu chỉ dùng phương pháp thủ công. Bạn cần các ứng dụng phần mềm phân tích có khả năng tổ chức và sắp xếp thông tin dưới dạng các con số thống kê dễ hiểu. Một khi có được sự hỗ trợ này, bạn sẽ tìm thấy những thông tin hữu dụng mà trước đó thậm chí bạn chưa từng biết tới sự tồn tại của chúng chứ chưa nói là muốn có. AWStats là một ví dụ tuyệt vời về ứng dụng phân tích web. ứng dụng này sử dụng mã CGI để sản sinh ra những biểu đồ, bảng biểu minh hoạ… trực quan cho số liệu thống kê lấy ra từ những log file. Ngoài ra, Analog cũng là một lựa chọn miễn phí cho bạn. Công cụ này tích hợp ít tính năng hơn AWStats nhưng lại cho phép người sử dụng tự điều chỉnh cấu hình từ máy địa phương (local machine). Trong khi AWStats yêu cầu bạn phải xác định đường dẫn tới log file trước khi chạy, Analog cho phép bạn xác định log file khi chương trình đang thực thi. Điều này có nghĩa là bạn có thể sử dụng Analog để đọc các log file trực tiếp trên các máy chủ (live log).
Thêm một ứng dụng khác, Sawmill, cũng dựa vào CGI, có khả năng chạy trực tiếp từ website hoặc máy tính của bạn nhờ một máy chủ web (web server) được tích hợp sẵn trong công cụ. Khác AWStats và Analog, Sawmill là sản phẩm mang tính thương mại. Sawmill hỗ trợ rất nhiều tính năng phân tích và nhiều lựa chọn so với các ứng dụng miễn phí. Một trong những tính năng đặc sắc nhất của Sawmill là khả năng theo dõi và phân tích web trực tiếp (live web tracking).
Các chuyên gia phân tích web phân biệt khá rạch ròi quá trình theo dõi (tracking) và phân tích log file. Quá trình theo dõi web có thể mang lại những dữ liệu tương tự nhưng theo phương thức khác. Trong khi các log máy chủ lưu trữ mọi truy vấn gửi tới trang máy chủ web, máy chủ FTP hay máy chủ email…, các dịch vụ theo dõi chỉ lưu trữ những động thái xuất phát trực tiếp từ người sử dụng (lưu trữ vào cookie rồi chuyển tới cơ sở dữ liệu). Số liệu thống kê qua công cụ phân tích log file mang tính so sánh (nhiều thời điểm), trong khi các công cụ theo dõi chỉ cung cấp thống kê ở một thời điểm cụ thể. Ngoài ra, các tệp tin log còn lưu trữ những thông tin mà các ứng dụng theo dõi website không để ý tới như sự hiện diện của “khách quen”, người truy nhập từ cùng một địa chỉ IP hoặc hoạt động tìm kiếm của các công cụ tìm kiếm (search engine).
Theo dõi theo dòng truy nhập
Những ứng dụng này còn có thể lưu lại các bước người truy nhập truy nhập website của bạn. Clickstream hay Clickpath – dòng truy nhâp, cho thấy mức độ hiệu quả của sơ đồ điều hướng, khả năng thu hút người truy nhập vào các lớp bên trong trang web. Đương nhiên, bạn cũng có thể nắm bắt được phần nào một dòng truy nhập thông qua các log file nhưng kết quả thường không đầy đủ và chính xác.
Để có được các thông tin về dòng truy nhập, nhà quản trị cần cài đặt các cookie, nhúng dữ liệu vào cookie để rồi sau đó tiến hành phân tích từ những dữ liệu thu thập được. Chính vì vậy, đa phần các ứng dụng theo dõi web đều được host từ máy chủ của các nhà cung cấp dịch vụ. Trong số các ứng dụng đã từng được đề cập, Extreme Tracker là một công cụ rất cơ bản nếu đem so sánh với các ứng dụng chuyên nghiệp. OpenTracker (opentracker.net) được cung cấp ở mức phí, 16,95 USD/tháng, nhưng lại tích hợp rất nhiều tính năng. Dữ liệu thu thập được cho phép bạn tối ưu các trang web để tăng vị trí trong các kết quả tìm kiếm, cải thiện sơ đồ điều hướng và cấu trúc thông tin của website.
Ví dụ, bạn có thể phát hiện ra rằng người truy nhập chỉ vào một khu vực cụ thể trên website rồi truy xuất. Với các công cụ theo dõi web, bạn sẽ nắm bắt được nguyên nhân chung nhất của tình trạng này để đưa ra các biện pháp khắc phục.
Nếu thực sự muốn thành công hơn nữa trên mạng Internet, bạn nên nghiêm túc với những giải pháp đã được đề cập tới ở trên. Trong mọi trường hợp, viện tới tư vấn của các nhà cung cấp dịch vụ ứng dụng (Application Service Provider- ASP) như webtrends.com. Các công ty thứ ba này sẽ làm công việc theo dõi, phân tích website cho bạn; đưa ra những đề xuất cụ thể với những thông tin thu thập được. Đương nhiên, ngay cả khi bạn chỉ dụng một bộ đếm hit đơn giản hoặc cả một hệ thống theo dõi và phân tích website (tính phí), hiệu quả hay không vẫn tuỳ thuộc vào mức độ chủ động của bạn.
Đức Cường