Thuật toán Google – Đi một ngày đàng, càng đọc càng ngu!

Thuật toán Google – Đi một ngày đàng, càng đọc càng ngu!

October 14, 2020 1 By Nam Vu

Bài viết trước mình có nói tổng quát về thuật toán là gì? 
Bạn đọc có thể đọc lại tại:
# http://blog.ntechdevelopers.com/thuat-toan-lieu-co-ma-thuat-phuc-tap-va-bi-an-nhu-moi-nguoi-van-nghi/

Mình cũng đã đề cập tới cách mà google thu thập thông tin như thế nào?
Bạn đọc có thể đọc lại tại:
# http://blog.ntechdevelopers.com/google-dang-thu-thap-thong-tin-website-nhu-the-nao/

Dưới đây là bài viết sâu chuỗi lại thuật toán cơ bản mà google sử dụng, mình không phải là dân SEO (search engine optimization) nên mình xin phép viết một cách tổng quan nhất để một người ngoài ngành nắm được sơ lược cách hoạt động nhé!

Bắt đầu thôi!

Google Rankbrain

RankBrain là một AI (Trí tuệ nhân tạo) mà Google sử dụng để sắp xếp và lựa chọn kết quả tìm kiếm. AI này giúp Google xử lý và hiểu rõ người dùng đang tìm kiếm cái gì.
Trước khi có RankBrain, 100% thuật toán của Google được lập trình bằng tay. Tất nhiên các kỹ sư vẫn phải làm việc với các thuật toán liên tục. Nhưng ngày nay, RankBrain sẽ thực hiện công việc này một cách tự động. Nói ngắn gọn, RankBrain sẽ tự điều chỉnh thuật toán. Tùy thuộc vào từ khóa, RankBrain sẽ tự động tăng hoặc giảm tầm quan trọng của các backlink, độ mới của nội dung, độ dài nội dung, domain authority, v.v.
Sau đó, công cụ sẽ xem xét cách người dùng tìm kiếm trong Google tương tác với kết quả tìm kiếm mới. Nếu người dùng thích thuật toán mới, chúng sẽ được sử dụng. Nếu không, RankBrain sẽ khôi phục thuật toán cũ.

Google Panda

Google Panda là một trong những thuật toán của Google phát triển với mong muốn nhằm hỗ trợ cho công cụ tìm kiếm và trả về các kết quả chính xác, phù hợp nhất với nhu cầu người dùng. Đồng thời, Google Panda cũng giúp thay đổi cách xếp hạng các kết quả tìm kiếm trên mạng tốt hơn và công bằng hơn.
Mục đích của Google Panda chính là việc xem xét chất lượng nội dung của website. Đồng thời nhằm loại bỏ những phần nội dung sai phạm, nội dung rác hoặc những phần nội dung được copy từ những trang khác.
Bên cạnh đó, Google Panda cũng giúp làm giảm sự hiện diện của các trang web chất lượng thấp trong kết quả Organic Search của Google. Đồng thời sẽ có thưởng cho các trang web có chất lượng cao.
Nếu như trang website của bạn bị rớt hạng trong quá trình thuật toán Google Panda đang cập nhật. Quá trình này mà được lặp đi lặp lại trong thời gian dài thì rất có thể là nội dung website đó không đủ sức thuyết phục với Google. Vì thế, bạn phải không ngừng nâng cao chất lượng của trang web để tránh bị đào thải nhé!

Hummingbird

Hummingbird là một thuật toán tìm kiếm mới được Google sử dụng. Bởi vì Google cho rằng Hummingbird sẽ đem lại kết quả tìm kiếm tốt hơn. Ngoài ra, cùng với tốc độ truy xuất dữ liệu cực nhanh và chính xác hơn khi sử dụng Hummingbird.
Hummingbird được ra đời nhằm xử lý và am hiểu chủ yếu các tác động với ngữ nghĩa từ khóa. Hummingbird được hiểu là nó sẽ tập trung và ý nghĩa của từ khóa đó đồng thời cũng ưu tiên những cụm từ khóa liên quan.
Hummingbird được sử dụng với mục đích sử dụng nhất là đánh hẳn vào những từ khóa riêng lẻ và những câu liên quan. Hummingbird được sử dụng hơn là việc hướng vào một vài từ khóa mục tiêu. Đồng thời, Hummingbird giúp báo hiệu và cam kết của Google về sự hiểu biết về ý định truy vấn của người tìm kiếm. Chính vì vậy, đây chính là những mục tiêu phù hợp với họ để cho kết quả phù hợp hơn.

Google PageRank

Pagerank là thuật toán phân tích các liên kết được dùng trong Google Search để xếp hạng các trang web.Thuật toán này chỉ định giá trị nhất định cho mỗi thành phần của một tập hợp các văn bản liên kết với nhau, ví dụ như World Wide Web.
Mục đích “đo” tầm quan trọng tương đối của các liên kết trong tập hợp đó. Nó áp dụng cho bất kỳ tập hợp văn bản nào có trích dẫn đối ứng và liên kết cụ thể. Giá trị (weight) mà nó gán cho bất kỳ thành phần E được gọi là PageRank của E và ký hiệu là PR(E)
Giá trị Pagerank hình thành từ thuật toán toán học dựa trên webgraph: các trang world wide web được coi như các đỉnh và các đường link là các cạnh. Khi hình thành webgraph người ta có tính đến những trang của các cơ quan có thẩm quyền như cnn.com hay usa.gov. Giá trị xếp hạng cho thấy tầm quan trọng của từng trang cụ thể. Mỗi đường link tới trang web sẽ được tính như 1 sự hỗ trợ làm tăng thêm giá trị Pagerank.

Google Penguin

Mục đích của Google Penguin là hạ xếp hạng các trang web chứa hồ sơ có liên kết spam và các trang web thao túng trọng lượng liên kết.
Google Penguin xử lý chất lượng liên kết và xử phạt những trang web mua backlink từ các trang của bên thứ ba. Ngoài ra, các trang web không theo hướng dẫn của Google Webmaster phải đối mặt với các hình phạt.

Google Pirate

Mục đích của Google Pirate là để giảm xếp hạng những trang web thường xuyên nhận được khiếu nại về việc tải lên nội dung lậu (có bản quyền).
Google Pirate được ra mắt để bảo vệ Sở hữu trí tuệ. Nó đã phạt những trang web nhận được báo cáo Vi phạm bản quyền. Phần lớn các trang web bị ảnh hưởng là nội dung vi phạm bản quyền (âm nhạc, phim, v.v.).

Google Possum

Google Pussum nhắm đến Tìm kiếm địa phương (Local Search) hoặc kết quả tìm kiếm Google Maps hoạt động tách biệt với tìm kiếm Organic Search.
Google Possum đã giới thiệu nhiều thay đổi khác nhau liên quan đến SEO địa phương. Vị trí thực tế của Người tìm kiếm: Doanh nghiệp gần khoảng cách của người tìm kiếm có nhiều khả năng xuất hiện trong SERPs (Trang kết quả của công cụ tìm kiếm). Các doanh nghiệp được đặt tại vùng ngoại ô của một thành phố cụ thể, bây giờ xuất hiện trong kết quả thành phố mục tiêu và những doanh nghiệp có nhiều Danh sách Google My Business có cùng NAP đã được xếp hạng.

Google Pigeon

Google Pigeon Update của Google tập trung vào khoảng cách và khoảng cách gần của người dùng Google Pigeon Update cung cấp kết quả chính xác, phù hợp hơn dựa trên vị trí của người dùng và các yếu tố địa lý khác. Do SEO địa phương này trở nên nổi bật và Google Doanh nghiệp trở thành một thành phần thiết yếu cho thấy các thực thể trên bản đồ dựa trên ba yếu tố.
Sự liên quan, Khoảng cách tìm kiếm, Nổi tiếng (Prominence)
Vì vậy, NAP (Tên, địa chỉ và số điện thoại) Tính nhất quán là yếu tố chính để có lợi thế hơn đối thủ của bạn.

Mobile Friendly

Mục đích nhằm tăng hạng các trang được tối ưu hóa cho thiết bị di động trong kết quả tìm kiếm được gửi đến thiết bị di động.Nó đảm bảo rằng các trang web được tối ưu hóa cho thiết bị di động được coi trọng trong SERPs (Trang kết quả của công cụ tìm kiếm). Vì vậy, Tính thân thiện với thiết bị di động đã trở thành một đặc điểm thiết yếu và Dự án tăng tốc độ mobile (AMP) được Google cung cấp để tăng cường tốc độ tải trang trên đi động.

Google Fred

Mục đích nhằm lọc các trang chất lượng thấp khỏi kết quả tìm kiếm có mục tiêu chính để kiếm lợi từ quảng cáo và liên kết đến các trang web khác.
Fred trừng phạt các trang web vi phạm các nguyên tắc dành cho quản trị trang web. Một tuyên bố như vậy không cung cấp cho cộng đồng tối ưu hóa SEO bất kỳ thông tin hữu ích nào, nhưng các nghiên cứu thực tế đã chỉ ra rằng các trang web có nội dung chất lượng thấp với các từ khóa được tối ưu hóa, một số lượng lớn quảng cáo hoặc liên kết ngoài thường là sẽ bị Fred sờ gáy.

Đó chỉ là một số nho nhỏ trong số cái to to ngoài kia mà google sử dụng, các đọc, càng tìm hiểu thì càng nhũn não nhỉ! Biết sao được Google mà @@