Thứ Hai, 3 tháng 3, 2014

Những yếu tố Google Penguin 2.1 quan tâm

Thuật toán Penguin của Google, ngay từ khi ra mắt, đã khiến các nhà làm SEO say mê nghiên cứu và phân tích. Năm ngoái, tại trụ sở MathSight ở Anh, các nhà phân tích đã sử dụng kỹ thuật đảo ngược để xác định các yếu tố trên website mà Penguin 2.0 nhắm tới. Gần đây hơn, MathSight tập trung vào các con số để phân tích Penguin 2.1 và có những tiết lộ mới về thuật toán đặc biệt này.
Trước khi có bản cập nhật Penguin 2.1, Andreas Voniatis -  Giám đốc điều hành của MathSight, cho biết điều quan trọng là phải hiểu các nguyên nhân gốc rễ của vấn đề.
Ông nói: "Liên kết inbound/outbound đều có nguồn gốc từ các website, vì vậy, bằng cách phân tích SEO on-page, chúng tôi đang tìm kiếm các thuộc tính của các trang liên kết bên ngoài. Penguin 2.0 đã hoạt động trên những thuộc tính này."
Với Penguin 2.0, Math Sight nói rằng tất cả đều tập trung vào mức độ "đọc thấp" của nội dung trên website, đặc biệt đối với body text, anchor text, hyperlinks, và thông tin trong thẻ meta. Vậy còn thuật toán Penguin 2.1 thì sao?
Dữ liệu của MathSight đã cho thấy các website tăng hay sụt giảm lưu lượng truy cập do Penguin 2.1 có liên kết đến các trang web chứa:
Tỷ lệ các từ hiếm cao hơn (tốt) hoặc thấp hơn (xấu) trong toàn văn bản.
Số lượng từ trong mỗi câu cao hơn (tốt) hoặc thấp hơn (xấu) trong toàn văn bản.
Số lượng âm tiết trên mỗi từ cao hơn (tốt) hoặc thấp hơn (xấu) trong toàn văn bản.
Dữ liệu của MathSight có thể hỗ trợ cho nghiên cứu SEO về các liên kết đến trang web chất lượng thấp.
Voniatis nói "Penguin đọc  một trang web bằng cách làm sạch các liên kết trên nội dung. Các websites nên loại bỏ liên kết từ những trang không đáp ứng khả năng đọc của thuật toán Penguin. Văn bản càng đơn giản thì nội dung càng đáng tin"
"Khi so sánh Penguin 2.0 với 2.1, chúng tôi nhận thấy thuật toán mới đã được tinh chỉnh để các số liệu để khả năng đọc tốt hơn, khả năng đọc giờ đây được tính theo chỉ số Flesch-Kincaid. Có vẻ như Google đang cố gắng tìm ra những giới hạn của web spam bằng cách tinh chỉnh công thức tính toán mức độ dễ đọc của nội dung." – Voniatis bổ sung
Công thức được sử dụng để xác định khả năng đọc sử dụng chỉ số Flesh Kincaid, theo Voniatis , được tính như sau:
RE = 206.835 – (1.015 x ASL) – (84.6 x ASW)
RE = Khả năng đọc
ASL = Độ dài trung bình của câu (số từ chia cho số câu)
ASW = Số lượng âm tiết trung bình trên mỗi từ (số lượng âm tiết chia cho số lượng từ)

Kết quả càng thấp, văn bản càng khó đọc, nội dung càng có lợi cho các bản cập nhật Penguin. Các số liệu thống kê ANOVA (phân tích phương sai) cho thấy Flesch-Kinkaid chắc chắn đang gây ra sự thay đổi trong lưu lượng truy cập do Penguin.

Cột màu đỏ trong đồ thị trên cho thấy những yếu tố được cho là nguyên nhân gây ra bởi Penguin. Các cột màu xanh lá cây là những yếu tố giúp các trang web được hưởng lợi từ Penguin 2.1.

Vậy, các chuyên gia SEO có thể làm gì với những dữ liệu này?

Voniatis cho biết số liệu thống kê cho họ biết một phát hiện thú vị rằng Google đã tìm thấy khả năng đọc một cách dễ dàng bằng cách giảm các liên kết từ các bài viết không chuyên.

Ông cũng nói thêm rằng các chuyên gia SEO có thể kiểm tra khả năng đọc của tất cả các liên kết trên nội dung trang web bằng cách thủ công hoặc sử dụng các công cụ trực tuyến miễn phí. SEO có thể phủ nhận các liên kết hoặc tu sửa lại nội dung trên các trang đích để điều chỉnh khả năng đọc tới ngưỡng tối ưu.

Không có nhận xét nào:

Đăng nhận xét