Cách fix lỗi nội dung trùng lặp khi chuyển HTTP sang HTTPS

Chuyển trang web từ HTTP sang HTTPs là rất dễ dàng tuy nhiên nếu không cẩn thận khi chuyển đổi bạn sẽ khiến việc SEO website bị ảnh hưởng rất nhiều.

Hướng dẫn sửa lỗi không hiển thị khoá bảo mật màu xanh khi cài SSL

Danh sách những nhà cung cấp chứng chỉ SSL tốt nhất cho website

Cài đặt chứng chỉ SSL miễn phí đơn giản với Let’s Encrypt

Hiện nay việc cài đặt SSL cho website là vô cùng dễ dàng chỉ với vài click. Nhưng vẫn có những trường hợp cài đặt gây lỗi như sai key pinning. Tuy nhiên thì đối với một website cần lượt traffic đến từ web tìm kiếm thì một trong những vấn đề đau đầu nhất khi cài đặt SSL là chuyển đổi HTTP sang HTTPS.

Hãy nhớ rằng, khi chuyển sang HTTPS thì website bạn vẫn sẽ giữ nguyên như cũ (trong mắt bạn), nhưng với các công cụ tìm kiếm thì thông, Google sẽ nghĩ rằng có một trang web mới đã được tạo ra, và ít nhất trong tạm thời nó sẽ cho rằng website của bạn trùng lặp nội dung. Đó là bởi vì bạn đã chuyển toàn bộ trang web của bạn qua một giao thức khác. HTTPS và HTTP là 2 thứ khác nhau, một là an toàn với các kết nối được mã hóa giữa các máy khách và máy chủ – một là không.

Tuy nhiên khi google thấy hai URL này:

  • https://example.com
  • http://example.com

Hệ thống sẽ ghi nhận đây là 2 trang web khác nhau nhưng có cùng một loại nội dung, một loại code như nhau. Vì vậy, làm thế nào để chúng ta tránh được vấn đề này?

Cách khắc phục vấn đề trùng lặp nội dung khi chuyển sang HTTPS

Để khắc phục vấn đề trùng lặp nội dung khi chuyển sang HTTPS nạn cần phải sử dụng 301 chuyển hướng trên tất cả các trang HTTP đến các trang HTTPS tương ứng.

Nếu sử dụng WordPress bạn có thể cài plugin Really Simple SSL

Sau đó chỉ cần Active để webiste tự động chuyển từ HTTP sang HTTPS.

Đối với website không sử dụng mã nguồn WordPress yêu cầu bạn phải cấu hình trên file .htaccess bằng dòng mã sau:

RewriteEngine on

RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]

RewriteCond %{HTTPS} !on
RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

Đây cũng là thời điểm nhắc bạn phải bật SSL trên tất cả các trang thuộc website. Tất cả các trang phải được phân phối qua HTTPS . Việc để người dùng truy cập website nhảy từ một kết nối an toàn đến một không an toàn và sau đó trở lại không phải là lý tưởng. Nó gây thêm áp lực cho máy chủ của bạn bởi vì việc truy cập thông qua các kết nối khác nhau là một quá trình tốn kém và nó cũng mở các phương thức tấn công để khai thác dữ liệu.

Đối thủ cạnh tranh của bạn có thể sử dụng cấu hình sai của bạn chống lại bạn

Đúng vậy, một số máy chủ sẽ vẫn phân phát trang qua HTTPS, thậm chí không có chứng chỉ bảo mật. Như đã trình bày ở trên, Google xem đây là nội dung trùng lặp. Vì vậy, theo giả thuyết, nếu một đối thủ cạnh tranh liên kết đến trang web HTTP của bạn bằng cách sử dụng giao thức HTTPS, nó có thể khiến Google bắt đầu lập chỉ mục webiste của bạn là trùng lặp nội dung.

Sau đó, có những máy chủ thậm chí sẽ không phục vụ các trang nếu họ không sử dụng HTTPS và không có chuyển hướng. Vì vậy chiến thuật tương tự, liên kết tới trang web HTTP của bạn với liên kết HTTPS, có thể tạo ra thông báo lỗi “Không thể truy cập trang web” và điều này cũng sẽ làm ảnh hưởng tới website của bạn.

WWW hay không WWW?

Bạn cần phải lựa chọn khi cài đặt SSL rằng website của bạn có hay không có WWW. Đó là bởi vì với Google:

  • https://example.com
  • https://www.example.com

Là 2 trang khác nhau. WWW được coi là một tên miền phụ của example.com và mặc dù hầu hết các chứng chỉ SSL sẽ bao gồm cả các biến thể WWW và non WWW, tuy nhiên thì các trang web cũng sẽ ghi nhận đây là 2 trang web khác nhau. Vì vậy, hãy chọn một và trỏ cái còn lại đến, để Google có thể hiểu đây là cùng 1 trang web..

Một số mẹo để bảo vệ chống lại nội dung trùng lặp

Dưới đây là một số đề xuất để giúp bạn tránh trùng lặp lỗi nội dung khi di chuyển sang HTTPS

  • Thẻ Canonical – Ngay cả khi chuyển hướng, đánh dấu trang bạn định chuyển theo chuẩn sẽ giúp cho Google biết trang nào sẽ hiển thị trong kết quả tìm kiếm của nó.
  • Kiểm tra máy chủ của bạn – Làm thế nào để máy chủ của bạn đáp ứng yêu cầu cho các liên kết an toàn và không an toàn? Bạn có thể cần phải thêm nhiều lệnh 301 để bù đắp.
  • Kiểm tra URL của bạn – Sử dụng một công cụ (có cả miễn phí và trả phí) để xem lại URL của bạn cho bất kỳ lỗi nội dung trùng lặp nào.
  • Kiểm tra 404 – Sử dụng Google Search Console để tìm và khắc phục bất kỳ lỗi nào 404 mà trang web của bạn đang còn tồn tại và chuyển hướng đến 1 trang đích.

Chúng tôi hy vọng điều này sẽ giúp ích, và nếu bạn có bất kỳ ý kiến ​​hoặc câu hỏi, hãy để chúng trong phần ý kiến.

(Tham khảo: hướng dẫn cài ssl trên iNET)

bình luận

Leave a Comment