Chợ Kết Bạn Việt Nam

Trang chủ Đăng ký Hỏi đáp Danh sách thành viên Lịch Tìm Kiếm Bài gửi hôm nay Đánh dấu là đã đọc
User Info Statistics
Tên tài khoản
Mật khẩu
Trở lại   Chợ Kết Bạn Việt Nam > QUẢNG CÁO > Quảng cáo - rao vặt - mua bán
 
Trả lời
  #1  
Cũ 08-12-2014, 09:44 AM
123macc321 123macc321 đang online
Member
 
Tham gia ngày: Jun 2014
Bài gửi: 70
Mặc định Hiểu đúng cùng cách khắc phục duplicate content trong SEO

Hệ thống quảng cáo SangNhuong.com

Nội dung trùng là gì?
Nội dung trùng (tên tiếng anh là Duplicate Content) là nội dung xuất hiện trên Internet tại hơn một địa chỉ (URL) hay nói theo một cách khác Duplicata Content là nội dung xuất hiện trên nhiều website khác nhau.


trùng lặp nội dung không tốt cho người dùng cũng như các SE của Google
Đây là một vấn đề, bởi khi có nhiều hơn 1 đoạn nội dung y sì nhau trên nhiều website sẽ gây khó khăn cho công cụ tìm kiếm để quyết định phiên bản nào phù hợp hơn với một truy tìm lùng nhất thiết.

Để đưa ra kết quả trên dưới tốt nhất, công cụ tìm kiếm sẽ hạn chế hiển thị các nội dung bị sao chép, do vậy thắt phải chọn lọc phiên bản nhiều khả năng là bản gốc nhất (hoặc tốt nhất).
Ba vấn đề lớn nhất mà Duplicate Content gây ra:
  • Search engine (SE) không thể phân biệt phiên bản nào được copy, phiên bản nà gốc.
  • SE không biết nên hướng các link metrics (mozrank, moztrust, bản quyền, anchor text, link juice …) đến một trang web, hay giữ tách rời giữa nhiều phiên bản.
  • SE không biết nên chọn phiên bản nào để xếp hạng cho kết quả khoảng.
Khi xuất hiện nội dung trùng, người quản trị web đối mặt với vấn đề mất đẳng cấp, giảm traffic, và SE sẽ đưa ra kết quả tầm kém chính xác hơn.
Hình: chẳng thể xếp hạng tất tật được. tấm phải tìm ra bản gốc!
căn nguyên gây trùng lặp nội dung:

1. Các thông số của URL
Các thông số URL như theo dõi nhấp chuột và một số mã phân tích có thể gây ra các vấn đề nội dung trùng lặp.

Hình: hệ thống category URL tạo nên các phiên bản giống nhau của cùng 1 trang web
2. Phiên bản in ấn
Các phiên bản để in ấn của một nội dung có thể gây ra duplicate content khi nhiều phiên bản của trang được xếp hạng.

Hình: URL của phiên bản để in gây ra trùng nội dung
3. Senssion IDs
Các senssion IDs là nguyên do cốt yếu gây ra nội dung trùng. Việc này xảy ra khi mỗi người dùng vào website và để lại 1 senssion ID và được lưu lại ở URL.

Hình: Senssion ID tạo nên các phiên bản giống nhau của cùng 1 trang web
4. Copy nội dung:
  • trùng hoàn toàn: Là trường hợp rõ ràng nhất khi nội dung bị sao chép 100% chỉ khác nhau độc nhất là Url.
  • trùng lặp một phần: Là trường hợp gần giống bản gốc nhất chỉ khác nhau về bố cục, hình ảnh và tí chút về từ ngữ.
  • Cross Domain: Là trường hợp giống 1 phần nội dung, thường là được lấy từ bản gốc rồi đăng làm nhiều phần trên những website khác nhau.
5.Phân trang comment.
Một số website khi có lượng comment lớn đã ngắt thành những trang khác nhau (/cmt-page-1/, /cmt-page-2/) khi cùng trỏ về một nội dung.


6. Non www và www
Có nhiều SEOer không được đào tạo SEO bài bản không để ý điều này. Vô hình chung đã đẩy website vào Duplicate Content Website trùng lặp nội dung sẽ bị phạt bởi SE, SE sẽ loại bỏ (tùy theo mức độ) kết quả trên dưới trên trang kết quả đối với các trang có quá nhiều nội dung trùng nội dung. Điều này sẽ khiến website rớt hạng thậm chí bị loại bỏ hoàn toàn khỏi bảng xếp hạng.


Website trùng nội dung sẽ bị phạt như thế nào?
SE sẽ loại bỏ (tùy theo mức độ) kết quả kiêng trên trang kết quả đối với các trang có quá nhiều nội dung trùng nội dung. Điều này sẽ khiến website rớt hạng thậm chí bị loại bỏ hoàn toàn khỏi bảng xếp hạng.Mới đây (16/12/2013) Matt Cutts người đứng đầu bộ phận hỗ trợ SEO và chống SPAM của Google đã đăng 1 video trên Youtube có nhắc đến việc trùng lặp nội dung hiện nay. Matt có nói rằng Google không có quyền xử phạt các trang web nó nhiều nội dung trùng, nhưng chắc chắn một điều rằng những nội dung này sẽ không có thứ hạng cao trên bảng hiện thị kết quả của Google.
Cách khắc phục khi bị trùng lặp nội dung
Bất cứ khi nào nội dung của một trang web có thể được tìm thấy tại nhiều URL, nó nên được khai báo với công cụ tầm. Điều này có thể được thực hiện bằng cách sử dụng một chuyển hướng 301 đến URL chuẩn xác, dùng rel = canonical hoặc trong một số trường hợp có thể dùng dụng cụ xử lý tham số trong trọng điểm Quản trị Trang web của Google.

  • Chuyển hướng 301
Trong nhiều trường hợp, cách tốt nhất để chống lại nội dung trùng lặp là thiết lập một trang chuyển hướng 301 từ trang "bản sao" các trang nội dung ban đầu. Khi các trang với nhiều khả năng được xếp hạng tốt được kết hợp thành một trang độc nhất vô nhị, chúng không còn cạnh tranh với nhau, mà tạo ra một sự liên tưởng mạnh mẽ hơn và tín hiệu phổ thông tổng thể. Điều này sẽ tác động tích cực đến khả năng được xếp hạng tốt trong dụng cụ kiêng kị.

Hình: giờ thì xếp hạng trang này được rồi!

  • Rel="canonical"
Một tùy chọn khác để ứng phó với nội dung trùng lặp là sử dụng rel = canonical tag. Các rel = canonical đi cùng một link juice (ranking power) cũng giống như là một chuyển hướng 301, và để thực hành thì thường mất it thời gian hơn.

Mẫu code Rel=Canonical

Thẻ này là một phần của HTML head của một trang web. Thẻ meta này không phải là mới, nhưng như nofollow, chỉ cần sử dụng một tham số rel mới. thí dụ:


Thẻ này báo cho Bing và Google rằng trang đã đưa nhất mực phải được xem là bản sao của www.example.com/canonical-version-of-page/ URL và tất các liên kết, các số liệu nội dung mà SE ứng dụng phải được xác nhận cho URL kia.

Hình: Đúng rồi! Đây chỉ là bản sao của SEOMoz blog URL.
Đây cũng giống như 301, nhưng không phải tu bổ gì nhiều

Các Ví dụ sau đây cho thấy lỗi viết hoa gây ra trùng nội dung:

http://www.simplyhired.com/a/jobs/list/q-software+developer
http://www.simplyhired.com/a/jobs/list/q-Software+developer
http://www.simplyhired.com/a/jobs/list/q-software+Developer

Sự khác biệt duy nhất giữa các URL này chữ hoa của các từ "software" và "developer". công cụ lóng sẽ coi cả thảy các URL trên là các trang khác nhau và xét chúng là dublicate content. Bằng cách thực hành rel = "canolical" đối với trường hợp thứ 2 và thứ 3, chúng sẽ chỉ trỏ lại vào URL 1, các dụng cụ chừng sẽ biết để coi tất các URL này là URL # 1.

  • Meta Robots
Thẻ meta robot với các giá trị "no index, no follow" có thể được thực hành trên các trang web mà không cần phải được bao gồm trong chỉ mục của công cụ từng. Điều này cho phép các bot kiêng craw links trên 1 trang web nhất quyết, nhưng vẫn không bao gồm chúng trong mục xếp hạng. Điều này đặc biệt hữu dụng với vấn đề ngắt trang.

Mẫu code Meta Robots

  • Parameter Handling trong Google Webmaster Tools
Google Webmaster Tools cho phép bạn thiết lập tên miền chuộng của trang web của bạn và xử lý các thông số URL khác nhau khác nhau. Hạn chế chính của những phương pháp này là họ chỉ làm việc cho Google. Bất kỳ sự thay đổi của bạn ở đây sẽ không ảnh hưởng đến Bing hoặc bất kỳ công cụ tìm các khác.

  • Đặt tên miền chuộng
Điều này nên được thiết lập cho bít tất các trang web. Đó là một cách đơn giản để báo cho Google xem một trang web nhất thiết nên được hiển thị có hoặc không có www trong các trang kết quả cỡ.


Các phương pháp khác nhằm tránh cũng như loại bỏ Duplicate Content
  • Hãy tự viết nội dung cho website, không sao chép nội dung của website khác dù chỉ là 1 phần. Điều đó loại bỏ gần như tối đa việc trùng lặp nội dung, cũng là điều tuyệt vời khi website có lượng bài viết độc đáo.
  • Luôn rà xem có bị trùng lặp nội dung ngay trên site của mình không.
  • Luôn rà nội dung của website có bị sao chép tới website khác không.
  • Khi dùng nội dung của trang khác, cần bảo đảm rằng phải có link back đến trang đó. Xem phần “đối phó với nội dung trùng lặp” để biết thêm thông báo.
  • Giảm thiểu nội dung hao hao. Thay vì 1 trang web về áo mưa cho bé trai và 1 trang web về áo mưa cho bé gái, nội dung giống nhau đến 95%, hãy thêm nội dung để chúng trở nên khác biệt. Hoặc có thể ghép thành 1 trang chung về áo tơi cho trẻ thơ.
__________________
Tranh dong đẹp, tranh đồng mỹ nghệ
Trả lời với trích dẫn


CHUYÊN MỤC ĐƯỢC TÀI TRỢ BỞI
Trả lời


Công cụ bài viết
Kiểu hiển thị

Quyền viết bài
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

vB code is Mở
Mặt cười đang Mở
[IMG] đang Mở
HTML đang Mở
Chuyển đến

SangNhuong.com


Múi giờ GMT +7. Hiện tại là 08:48 PM


© 2008 - 2025 Nhóm phát triển website và thành viên SANGNHUONG.COM.
BQT không chịu bất cứ trách nhiệm nào từ nội dung bài viết của thành viên.