Sitemap là gì? Hướng dẫn tạo sitemap cho website và mẹo tối ưu hiệu quả

Nguyễn Hữu Dũng 29/04/2021

Sitemap là một phần không thể thiếu trong thiết kế website. Nó giống như một tấm bản đồ giúp công cụ tìm kiếm có thể tìm và đọc dữ liệu của trang web. Vậy sitemap là gì? Làm thế nào để tạo ra sitemap tối ưu nhất? Cùng Bizfly tìm hiểu ngay trong bài viết này.

Sitemap là gì?

Với các nhà thiết kế web thì khái niệm sitemap là gì không còn quá xa lạ. Theo Wikipedia, sitemap hay sơ đồ trang web là một danh sách các trang trong một website cụ thể. Có 3 loại sitemap chính:

- Sitemap được các nhà thiết kế web sử dụng trong quá trình xây dựng kế hoạch cho một website.

- Sitemap để người dùng có thể nhìn rõ thứ bậc, các trang trong một website.

- Sitemap có cấu trúc dành cho các trình thu thập dữ liệu web như công cụ tìm kiếm: Google, Bing…

Ở phạm vi bài viết này, Bizfly sẽ đề cập nhiều tới loại sitemap được tạo ra cho công cụ tìm kiếm. Đây là tệp tin mà ở đó có chứa các thông tin về trang và tệp khác có trên một website. Thông qua tệp tin này, các công cụ tìm kiếm như Google dễ dàng đọc và thu thập dữ liệu website hiệu quả. 

Ngoài ra, nó cũng cho biết những trang và tệp nào là quan trọng nhất trên website. Bạn có thể dùng sitemap để khai báo các thông tin về những loại nội dung trên trang web như: Video, hình ảnh, tin tức… 

Sitemap hay sơ đồ trang web là một danh sách các trang trong một website cụ thể

Có những loại sitemap nào?

Dựa theo đặc điểm, chức năng mà người ta chia sitemap thành 2 loại chính là:

Phân loại theo cấu trúc

Dựa trên cấu trúc người ta chia sitemap thành 2 dạng là XML và HTML. Vậy đặc điểm của 2 loại sitemap là gì?

  • Sitemap XML

Đây là tệp liệt kê tất cả các trang có trên website để công cụ tìm kiếm dễ dàng thu thập dữ liệu và lập chỉ mục nội dung dễ dàng. Sitemap XML được viết cho các bot công cụ tìm kiếm thay vì người dùng. Cùng với danh sách các trang, sitemap XML cũng bao gồm nhiều chi tiết khác.

  • Sitemap HTML

Loại sitemap này liệt kê tất cả các trang quan trọng trên website. Nó đảm nhận vai trò như một mục lục, vừa giúp bot của công cụ tìm kiếm vừa giúp người dùng dễ dàng điều hướng khi sử dụng website.

Phân loại theo định dạng

Ngoài phân chia theo cấu trúc, sitemap còn có thể được phân theo định dạng. Có thể kể đến một số loại như:

- Image sitemap là cách để Google biết các hình ảnh trên website đặc biệt là những hình ảnh mà Google không được mã hoá theo cách mà Google nhận ra.

- Video sitemap giúp Google tìm và hiểu nội dung video trên trang web của bạn, đặc biệt là nội dung được thêm gần đây hoặc nội dung mà bot tìm kiếm có thể không phát hiện được bằng cơ chế thu thập thông tin thông thường của mình.

- News sitemap giúp Google hiểu về các bài viết tin tức của bạn và thông tin bổ sung về chúng. 

Bạn có thể mở rộng sơ đồ trang web hiện tại của mình bằng các thẻ tin tức cụ thể hoặc tạo sitemap tin tức riêng chỉ dành riêng cho các bài viết tin tức trên website. 

- Mobile sitemap là sitemap của trang web được tối ưu hóa cho thiết bị di động. Nó giúp các công cụ tìm kiếm hiểu cấu trúc của một trang web và cách nó được tổ chức cho người dùng di động. 

Bên những loại sitemap trên còn có thêm các loại sitemap khác như: Sitemap index, Sitemap-articles.xml, Sitemap-tags.xml,...

Vai trò của sitemap là gì?

Không phải ngẫu nhiên mà sitemap lại được xem là yếu tố quan trọng trong thiết kế website. Ngoài nâng cao trải nghiệm cho khách truy cập, nó còn giúp trang web trở nên thân thiện hơn với các bộ máy tìm kiếm.

  • Nâng cao trải nghiệm người dùng

Sitemap giúp người dùng dễ dàng tìm kiếm và đọc hiểu thông tin trên website. Nó giúp họ chuyển từ trang này sang trang khác nhanh chóng hơn. Đồng thời, sử dụng sitemap cũng giúp việc xác định các trang chứa thông tin quan trọng nhanh chóng.

  • Tăng tốc độ thu thập thông tin của các bot tìm kiếm

Nhắc tới vai trò của sitemap là gì thì không thể bỏ qua nhiệm vụ của nó đối với các công cụ tìm kiếm như Google hoặc Bing. Một website có sitemap sẽ giúp các bot tìm kiếm có thể thu thập thông tin nhanh chóng hơn.

Điều này phần nào làm tăng khả năng hiển thị cho trang web trên kết quả tìm kiếm mà không phải trả tiền. Để đạt được kết quả này bạn cần đảm bảo rằng tất cả các trang quan trọng trên website đều được lập chỉ mục chính xác.

  • Hỗ trợ việc cải tiến trang web

Đối với các nhà thiết kế, phát triển website, sitemap cho phép họ có cái nhìn tổng quan về cấu trúc của trang web và tiến hành thay đổi nếu cần. Ví dụ như thêm trang mới hoặc thay đổi trang hiện có. 

Ngoài ra, nhờ vào sơ đồ trang web, nhà phát triển cũng dễ dàng quy hoạch URL quan trọng và ít quan trọng hơn từ đó dọn dẹp chúng một cách tối ưu nhất.

Phân chia theo cấu trúc, sitemap còn có thể được phân theo định dạng

Hướng dẫn cách tạo sitemap cho website

Để tạo sitemap bạn có thể lựa chọn một trong ba cách sau:

Tạo sitemap bằng CMS

Nếu bạn đang sử dụng CMS như WordPress, Wix hoặc Blogger thì có thể CMS của bạn đã cung cấp sơ đồ trang web cho các công cụ tìm kiếm. Hãy tìm cách tạo sitemap nếu CMS của bạn không tự động tạo sơ đồ trang web. 

Với một số CMS như WordPress.org, bạn có thể cài đặt plugin hoặc tiện ích mở rộng như Yoast SEO để được hỗ trợ.

Hoặc nếu bạn sử dụng Wix sẽ chỉ cần kết nối trang web với Google thông qua tính năng Wix SEO Wiz và trình tạo sẽ tự động gửi sơ đồ trang web đến công cụ tìm kiếm.

Tạo sitemap theo cách thủ công

Đối với sitemap có ít hơn vài chục URL, bạn có thể tạo sơ đồ trang web theo cách thủ công. 

Để thực hiện việc này, hãy mở trình soạn thảo văn bản như Windows Notepad hoặc Nano (Linux, MacOS) và làm theo cú pháp được mô tả trong phần định dạng sitemap. 

Cách làm sitemap này tốn nhiều thời gian nhưng đổi lại bạn sẽ có toàn bộ khả năng tùy chỉnh đối với sơ đồ trang web của mình, biến nó trở thành sơ đồ trang web có khả năng mở rộng cao nhất.

Tự động tạo sitemap bằng các công cụ hỗ trợ

Có nhiều công cụ khác nhau hỗ trợ tạo sitemap như:

  • Google XML Sitemap: Cung cấp tuỳ chọn đơn giản để tạo sitemap nhanh chóng. Là phần mềm có mã nguồn mở.
  • XML Sitemap & Google News Feed: Công cụ này dễ dùng, dung lượng thấp, đặc biệt tốt cho các trang tin tức.
  • Yoast SEO: Tính năng tạo sitemap đã được tích hợp sẵn trong công cụ này vì thế bạn không cần thực hiện thêm quá nhiều thao tác vẫn có được sitemap hoàn chỉnh.
  • Google Sitemap: Công cụ tạo sitemap này hỗ trợ đa ngôn ngữ, được đặt tần suất nội dung cho website. Ngoài ra, nó cho phép thêm tệp sitemap bên ngoài.

Lưu ý, bạn không cần đặt nặng vấn đề thứ tự của các URL trong sitemap vì điều đó không quan trọng với bot tìm kiếm. Hãy ghi nhớ các yêu cầu về kích thước cho sitemap, nếu sitemap quá lớn bạn phải chia chúng thành những sitemap nhỏ hơn.

Khai báo sitemap của bạn đến Google

Ngoài hiểu rõ sitemap là gì? Cách tạo sitemap thế nào thì việc khai báo sitemap đến Google là cực kỳ quan trọng. 

Đây là cách để công cụ tìm kiếm dễ dàng thu thập dữ liệu và lập chỉ mục cho các trang của website, điều này đặc biệt có lợi đối với SEO. Vậy cách khai báo sitemap với Google như thế nào?

Hiện nay, Google cho phép bạn gửi sitemap website bằng cách sử dụng Google Search Console (GSC). Lưu ý, nếu chưa có tài khoản GSC bạn cần phải tạo một tài khoản để thực hiện các thao tác khai báo.

  • Bước 1: Đăng nhập vào GSC

Đăng nhập vào GSC → Ở góc trên cùng bên trái bạn chọn website muốn gửi sitemap.

  • Bước 2: Đi tới khai báo sitemap

Trong menu bên trái bạn lựa chọn “sơ đồ trang web” → Chọn “Lập chỉ mục” → Chọn “Thêm sitemap website mới”

  • Bước 3: Tìm URL sitemap của bạn

Có hai loại sitemap cơ bản: XML và HTML. Vì sitemap HTML không được sử dụng cho mục đích SEO, vì vậy bạn chỉ cần tập trung vào sitemap XML.

Dưới đây là một số cách hiệu quả để tìm sơ đồ trang XML của bạn: 

- Vị trí phổ biến nhất: Rất nhiều khả năng sitemap XML được đặt tại  https://yourdomain.com/ sitemap.xml .

- Tìm kiếm: Hãy tìm kiếm “site:yourdomain.com filetype:xml” trên Google, bạn sẽ tìm thấy vị trí sơ đồ trang web của mình.

- Kiểm tra tệp robots.txt: Thường tệp robots.txt của website (nằm ở https://yourdomain.com/ robots.txt ) có thể chứa liên kết tới sơ đồ trang web của bạn. Nếu bạn không có sitemap XML, bạn sẽ cần tạo một sơ đồ trang web. 

  • Bước 4: Thêm sitemap mới

Bây giờ, bạn có thể thêm sitemap của mình vào phần “Thêm sitemap website mới” của mục “Sitemap website”.

Cuối cùng, bạn chỉ cần dán URL và nhấp vào “Gửi”. Bạn sẽ thấy thông báo xác nhận rằng sitemap trang web của bạn đã được gửi thành công.

Sau một thời gian, bạn sẽ thấy sitemap website của mình trong danh sách “Sitemap website đã gửi”. Nó chứa thông tin về thời điểm sitemap website được gửi, thời điểm nó được đọc lần cuối và số trang Google đã phát hiện trong đó.

Ngoài ra, nó cũng sẽ hiển thị cho bạn trạng thái gửi sitemap trang web của bạn. Trạng thái “Thành công” màu xanh lá cây có nghĩa là không có vấn đề gì.

Nếu thấy trạng thái “Không thể tìm nạp” hoặc “Có lỗi”, bạn cần làm theo đề xuất của báo cáo để  khắc phục sự cố.

Cách tạo sitemap thế nào thì việc khai báo sitemap đến Google là cực kỳ quan trọng

Mẹo tối ưu sitemap hiệu quả

Để có một sitemap hiệu quả và thực sự hữu ích bạn cần:

  • Chọn URL

Mục đích của sitemap là giúp công cụ tìm kiếm hiểu và thu thập dữ liệu website một cách hiệu quả. Vì thế, hãy đưa các URL thực sự quan trọng và cần thiết phải có trong kết quả tìm kiếm. URL này có thể là bài viết, video, hình ảnh hay bất kỳ trang nào trên website.

Các URL chuyển hướng tới nơi khác hoặc được đánh dấu noindex sẽ không hữu ích cho sitemap.

  • Lastmod

Nó cho biết ngày thay đổi cuối cùng với tệp mà liên kết đề cập đến để Google hiểu rằng, đang có URL cần được nó quét lại một lần nữa.

Chúng ta chỉ nên chỉnh sửa bản sửa đổi cuối cùng khi có những thay đổi đáng kể, lúc này trình thu thập dữ liệu đi qua các URL sẽ tìm thấy nội dung mới và cập nhật nó. Nếu không, việc lập kế hoạch thu thập thông tin có thể coi lastmod là vô ích và trình thu thập dữ liệu có thể bỏ qua chúng.

  • Quản lý nhiều URL

Các tệp sitemap XML có giới hạn là 50.000 URL/tệp bạn cần hạn chế để số lượng URL vượt quá mức quy định.

Trường hợp lượng URL vượt quá con số trên và xác định tất cả chúng đều hữu ích thì hãy chia sitemap thành nhiều tệp. Đừng quên sắp xếp chúng theo danh mục hoặc loại nội dung để việc quản lý sitemap dễ dàng hơn. Cách làm này cũng sẽ giúp công cụ tìm kiếm xử lý thông tin hiệu quả.

Q&A: Sitemap

Bên cạnh những thông tin như sitemap là gì, làm thế nào để thiết lập sitemap thì còn rất nhiều vấn đề được quan tâm trong quá trình thiết kế website:

Khi nào cần có sitemap?

  •  Website quá lớn

Với những website lớn bạn sẽ khó đảm bảo tạo ra được liên kết nội bộ hoàn hảo cho các trang trên website. Điều đó khiến Googlebot khó có thể đọc hiểu và thu thập được toàn bộ dữ liệu. Vì thế, việc tạo ra sitemap tốt sẽ cực kỳ hữu ích.

  • Website mới 

Googlebot và các trình thu thập dữ liệu web khác thu thập dữ liệu trên web bằng cách đi theo các liên kết từ trang này sang trang khác. Kết quả là Googlebot có thể không khám phá các trang của bạn nếu không có trang web nào khác liên kết đến.

Do vậy, cần có một sơ đồ thông tin hoàn hảo để bot tìm kiếm hiểu và đi theo thu thập dữ liệu.

  • Website có nhiều nội dung đa phương tiện hoặc hiển thị trên Google Tin tức. 

Cách tìm kiếm sitemap

Có nhiều cách để tìm kiếm sitemap của một website. Bạn có thể tham khảo các phương pháp sau:

- Kiểm tra thủ công: Nhập URL website vào trình duyệt rồi thử với một vài biến thể khác nhau. Ví dụ: www.YourWebsiteUrl.com/sitemap.xml _

- Kiểm tra tệp Robots.txt: Đây là tệp cung cấp các chỉ thị hữu ích cho trình thu thập thông tin của công cụ tìm kiếm. Đây cũng là tệp cho phép bạn tìm thấy liên kết đến sitemap của một website.

- Truy cập vào GSC: Bạn có thể tìm thấy sitemap (nếu nó đã được khai báo trước đó). Ngoài địa chỉ URL chính xác của sitemap, GSC còn cung cấp các thông tin bổ sung như loại sitemap, thời điểm được khai báo, lần đọc cuối cùng, trạng thái và số lượng URL bên trong.

- Công cụ quản trị web của Bing: Nó hoạt động khá giống với GSC.

- Sử dụng lệnh tìm kiếm của Google: Bạn cần sử dụng lệnh “filetype” kết hợp với “site” để tìm kiếm tất cả các sitemap được lập chỉ mục. Ví dụ: site:chess.com filetype:xml.

- Sử dụng các công cụ trực tuyến để kiểm tra: Tuy nhiên, những công cụ này không phải lúc nào cũng trả kết quả như ý muốn.

- Kiểm tra CMS của trang web. 

Trên đây là một số thông tin về sitemap là gì và những thông tin liên quan tới sơ đồ trang web. Mong rằng, qua bài viết này bạn có thể hiểu rõ về sitemap và biết cách xây dựng, tối ưu sơ đồ website hiệu quả nhất.

BizWebsite - Ứng dụng công nghệ mới - Xử lý mọi vấn đề về bảo mật
Giải quyết các vấn đề về lỗ hổng bảo mật bằng công nghệ OWASP

Tư vấn miễn phí Tìm hiểu thêm

Chia sẻ bài viết

Nhận ngay tin tức mới nhất từ Bizfly

Nhận ngay tin tức mới nhất từ Bizfly