Thứ Bảy, 5 tháng 10, 2013

Những hạn chế của Google Analytics đối với dữ liệu lớn!

Bạn đã bao giờ thấy một biểu tượng nhỏ giống bàn cờ (Checkerboard ) trên góc phải phía trên của Google Analytics?
Biểu tượng “bí ẩn” này đã xuất hiện từ nhiều tháng trước, là chỉ dẫn cho biết Google Analytics đang lấy dữ liệu thống kê. Mới đầu, nó chỉ xuất hiện trên màn hình khi Advanced segments (chức năng mở rộng) được bật, nhưng gần đây nó bắt đầu xuất hiện trong cả báo cáo trên phạm vi dữ liệu nhỏ. Đáng quan tâm hơn là những site với lượng traffic lớn hơn bị yêu cầu lấy dữ liệu trên bất kỳ report nào, và sự mặc định này là bằng nhau giữa hai mức độ tuỳ chỉnh: “thực hiện nhanh hơn” & “đô chính xác cao hơn” (“Faster Processing” and “Higher Precision”). Một website với lượng traffic lớn, sử dụng dữ liệu tổng hợp của nhiều tháng, với chức năng tuỳ chọn “custom segment” mà người dùng chọn ở chế độ “higher precision” thì báo cáo đưa ra cũng chênh lệch tới 25% dữ liệu thực tế.



Dữ liệu quá lớn sẽ bị rút gọn

Hãy hình dung vấn đề khi dữ liệu của bạn quá lớn. Lúc này, khi thu nhận dữ liệu trên Google Analytics, Googe sẽ tự thấy phân tích toàn bộ dữ liệu là quá nhiều. Vì thế, để cải thiện quá trình xử lý dữ liệu, hệ thống sẽ chỉ phân tích và báo cáo dựa trên một đoạn dữ liệu mẫu. Trên lý thuyết việc lấy mẫu sẽ không làm giảm độ chính xác, vì dữ liệu đã được thống kê và chỉ có sai số nhất định. Nếu bạn gặp vấn đề với đoạn dữ liệu mẫu, bạn có thể trả thêm tiền cho Google để được lấy số liệu chính xác. Nhưng hầu hết các doanh nghiệp và các dịch vụ SEO không có khả năng trả số tiền này cho Premium Analytics.

Hãy cẩn thận với Checkerboard

Mặc dù trên lý thuyết, dữ liệu mẫu theo báo cáo trong Google Analytics phải chính xác như dữ liệu thật, chúng ta nên thận trọng trước khi tin tưởng nó. Trong một thế giới thống kê, có một sự thay đổi lớn giữa một trang đang xem và một trang được refresh. Mức độ thay đổi này không được chấp nhận từ quan điểm tính toán, vì các nhà quản lý quảng cáo, pay per click, thương mại điện tử yêu cầu một dữ liệu chính xác để đưa ra những quyết định quan trọng cho chiến lược của họ.

Dữ liệu mẫu mặc định (The Default Sampling)

Ở các report, việc lấy mẫu là mặc định, chỉ dựa vào 21.59% số visits tổng hợp từ dữ liệu tại cả hai khoảng thời điểm.

Bản report này cho thấy Conversion rate giảm 4.01%, listing emails tăng khoảng 3.1 %/tháng.

Dữ liệu mẫu được điều chỉnh (The Adjusted Sampling)

Hãy nhìn lại report này khi chúng ta cài đặt “Highest Precision” cho việc lấy mẫu, vẫn cùng một dữ liệu nhưng thống kê trên 41.54% tổng số visits, ( gấp đôi dữ liệu của report trước). Giờ thì Conversion rate đã tăng lên 9.05% thay vì 4.01%, listing emails đã tăng lên 22.43% so với 3% của report thứ nhất.


Đây chỉ là một trong nhiều so sánh cho thấy sự khác biệt hoàn toàn của việc lấy dữ liệu mẫu trong Google Analytics. Càng nhiều người cập nhập vào site của bạn, thì việc lấy dữ liệu mẫu càng được áp dụng. Ở ví dụ trên mặc dù đã lựa chọn sự chế độ tuỳ chỉnh để lấy số liệu chính xác tối đa,  báo cáo cũng không thể thống kê kết quả cho toàn bộ số visits. Ở những website có lượng traffic nhỏ hơn,  việc lấy mẫu này thường không gây ảnh hưởng gì nhiều.

Kết luận

Người dùng cần để ý về vấn đề sử dụng dữ liệu mẫu của báo cáo trong Google Analytics. Việc lấy dữ liệu mẫu xảy ra nhiều hơn ở những website có traffic lớn, hoặc khi bạn yêu cầu Google xử lý nhiều dữ liệu hơn trong các báo cáo. Bạn cũng có thể chú ý thống kê trong một tháng có thể lấy hết được 100% dữ liệu, nhưng thống kê trong 6 tháng, dữ liệu lấy được chỉ còn 60%. Những công ty có thể giải thích cho khách hàng về những điều này, cũng như các quản trị nên hướng dẫn nhân viên của họ. Đối với các SEO, việc lấy mẫu này sẽ chính xác hơn khi sử dụng Premium Analytics ( dịch vụ trả tiền), nhưng chỉ cần bạn hiểu rõ về dữ liệu và nhìn ra được những rủi ro tiềm tàng, thì sử dụng Google Analytics miễn phí vẫn được coi là tiêu chuẩn cho mọi websites.

1 nhận xét:

  1. Nhiều bà bầu thiếu axit folic có sao không, vì loại axit này rất cần cho cơ thể người phụ nữ trong thời gian thai kỳ, những thực phẩm giúp bé thông minh trong thời gian thai kỳ là những loại nào, có giúp bé thông minh và phát triển tốt không, bà bầu có nên đọc sách trong thời gian thai kỳ không, vì bà bầu cần nghỉ ngơi nhiều, bà bầu bị nhiễm độc thai nghén có sao không là triệu chứng của bị ngộ độc thực phẩm, dễ ảnh hưởng tới thai nhi, ngộ độc thực phẩm khi mang thai có sao không là điều thắc mắc mà nhiều chị em lo ngại, chúng tôi sẽ giải đáp điều này.

    Trả lờiXóa