Khôi phục PBN: Cài đặt website và lấy lại nội dung cũ

17904 lượt xem 29 Tháng Mười Một, 2018
[no_toc]

Mỗi người một kỹ thuật và phương pháp khôi phục nội dung khác nhau, có bạn dùng tự lấy nội dung bằng tay thông qua Cache Google, có bạn sử dụng Wayback Machine

Nhưng bạn đã sử dụng website mã nguồn wordpress cài plugin lấy nội dung hoàn toàn tự động chưa?

Cách lấy nội dung cũ từ Cache Google?

Cách lấy nội dung cũ từ Wayback Machine?

Nên lấy những nội dung nào?

Plugin nào lấy nội dung cũ tốt nhất?

Chỉ cần làm những bước rất đơn giản dưới đây, bạn đã có một website PBN với nội dung cũ đầy đủ nhất.

Lưu ý: Bài viết này dựa trên kinh nghiệm cá nhân, không áp dụng được cho các website sử dụng mã nguồn không phải WordPress.

Vì sao cần lấy lại nội dung bài viết cũ cho Website PBN?

Những lý do dưới đây sẽ giúp bạn vì sao cần lấy lại nội dung cũ cho website PBN:

  • Lịch sử của website được liền mạch (không đứt quảng) trên các công cụ tìm kiếm;
  • Không mất đi số lượng người tương tác trước đó;
  • Không làm rớt hoặc mất thứ hạng trên các công cụ tìm kiếm;
  • Tránh tối đa tác vụ thủ công từ Google do website thay đổi nội dung đột ngột;
  • Không mất nhiều thời gian trong quá trình phát triển nội dung website;

Nội dung là một trái tim cho website, khi website chậm khôi phục nội dung khiến người dùng không còn hứng thú khi quay lại website 1 lần nào nữa. Website có sự thay đổi bất ngờ nội dung cũng kéo theo nhiều rủi ro về tác vụ thủ công, sức mạnh có sẳn của PBN trước đó.

Khôi phục nội dung website
Khôi phục nội dung website

Nên xử lý thế nào nếu PBN là tiếng anh, nhưng định hướng website PBN là tiếng việt?

Có nhiều cách để xử lý tình huống này. Có bạn đổi thẳng nội dung sang tiếng việt sau khi mua PBN về. Có bạn vẫn viết tiếng anh, tiếng việt song song, bạn chọn cách nào?

Cách mình vẫn thường làm là:

  • Xây dựng lại website mã nguồn wordpress (Để mặc định các cài đặt ban đầu, bài viết Hello world). Title website mình để luôn tên domain để Google nhận dạng nhanh hơn.Ví dụ: PBN mình là dexuat.xyz, mình không quan tâm title trước kia là gì. Bây giờ khôi phục thì chỉ cần để title là “dexuat.xyz – – My WordPress Blog”.Để như vậy 1 tuần xem tín hiệu Google đã index rùi tiếp tục khôi phục.
  • Sau khi Google đã index lại website PBN mới của bạn, bắt đầu công việc khôi phục lại ít nhất 10 bài viết cũ;
  • Làm menu cho website PBN, cuối menu làm thêm 1 link ghi “Vietnamese”;
  • Vào công cụ Webmaster của Google định hướng lại ngôn ngữ website, thẻ hlang
  • Sau đó bạn sử dụng tìm nạp như máy tính để Google Index lại nhanh hơn website của mình.
  • Kế tiếp là bạn viết 1 tuần 1 bài tiếng việt cho website PBN này.

Tiếp tục công việc viết bài tiếng việt theo chủ đề muốn hướng đến giúp Google định hướng nội dung của bạn tự nhiên, cũng như tạo thói quen cho BOT Google.

Giải thích thêm: Mục đích của việc tạo Menu có từ ngữ Vietnamese là:

  • Google có thể biết website PBN có thêm ngôn ngữ mới; Hoặc cơ bản là bạn đang hướng đến một quốc gia Việt Nam như những Website quốc tế lớn khác đang làm;
  • Người dùng cũ trước đó không bực mình khi họ thấy website thay đổi ngôn ngữ đột ngột. Tránh những phiền toái khiến họ report, hoặc chia sẻ rằng website spam không còn giá trị, và biết đâu rằng họ cũng là những người yêu đất nước Việt Nam chúng ta. Thật tuyệt vời.

Nên lấy những nội dung nào cho website PBN?

Có 3 điều mà khi khôi phục website PBN mình vẫn muốn hướng đến:

WHO – TRUST – POWER

WHO: Cho các công cụ nhận biết website của bạn là gì? Cung cấp giá trị như thế nào? Cung cấp cho đối tượng là ai? 

Như vậy mình sẽ lấy những nội dung cũ:

  • About us page: Các trang giới thiệu cũ mà website PBN trước đó có. Nếu không có, mình tự chế một nội dung phù hợp;
  • Contact page: Các trang liên hệ cũ. Tuy nhiên mình thường chỉ dùng plugin contact form 7. Không dùng lại những info (Address, phone, name contact,…);
  • Privacy Policy: Các trang chính sách bảo mật, mình thường sử dụng lại nội dung này.
  • Legal Notices, Terms of Service: Các trang hỗ trợ nội dung khác;

TRUST: Độ tin cậy của website PBN

Phần này là những nội dung cũ của PBN trước đó, mình thường không quan trọng lắm về nội dụng sau này của PBN nên sẽ lấy toàn bộ những nội dung gì có thể lấy được.

Nội dung cũ sẽ giúp website có trust ngay trở lại, traffic sẽ trở về, người dùng cũ cũng không biết là họ đang đọc bài viết trên một vệ tinh PBN trong tương lai.

POWER: Sức mạnh của PBN

Có thể bạn đã làm tốt 2 yếu tố WHO,TRUST phía trên. Nhưng mình tin rằng vẫn còn rất nhiều bạn bỏ qua bước này. Là gì vậy? Hãy xem qua ví dụ nhé.

Ví dụ: tên miền dexuat.vn trước đó từng mua rất nhiều backlink từ báo vnexpress.net

Sau đó: Bạn mua được dexuat.vn làm website PBN cho riêng mình, bạn bắt đầu khôi phục nội dung. Bạn làm rất đúng kỷ thuật khôi phục.

Tuy nhiên: Có bao giờ bạn vào xem từng backlink của domain dexuat.vn trên vnexpress.net có đường link như thế nào không?

Nếu bạn chưa xem: Hãy nhìn các link gãy sau đây.

Backlink cũ của dexuat.vn trên vnexpress.net -> https://dexuat.vn/tai-chinh/cach-dau-tu-vao-bitcoin-khong-rui-ro

Nhưng bạn khôi phục nội dung và để wordpress tự tạo đường dẫn mới dạng như: https://dexuat.vn/cach-dau-tu-vao-bitcoin

Bạn có thấy điều gì không?

Từ backlink url cũ, và đường dẫn mới đã khác biệt. Điều này đã làm giảm hoặc không còn sức mạnh của một PBN.

Có phải bạn có những PBN chỉ số rất mạnh, backlink từ các báo lớn, uy tín, nhưng xây dựng, khôi phục nội dung thì nó không mạnh như ý muốn.

Hãy kiểm tra lại ngay xem có phải lỗi từ tiêu chí POWER này không nhé.

Các bước cần chú ý đã xong, giờ vào nội dung chính nhé.

Plugin lấy nội dung cũ tốt nhất?

Chờ một chút, hãy chuẩn bị một vài thứ trước khi chúng ta bắt đầu.

Cài đặt website để khôi phục website PBN

Tôi tin rằng bạn không quá xa lạ với WordPress, mã nguồn tạo website cực kỳ nhanh, đơn giản và dễ sử dụng.

Công việc của bạn là: Chỉ cần mua môt hosting hoặc VPS để cài đặt website wordpress mặc định mà thui.

Khi mọi thứ đã sẳn sàng, hãy xem bước kế tiếp thôi.

Cài đặt plugin để khôi phục website PBN

Phần quan trọng đây rồi, có lẽ bạn chỉ kéo nhanh xuống phần này thôi đúng không?

Hãy xem lại các nội dung khác trong bài viết này nếu bạn có thêm nhiều thời gian.

—-

Có khá nhiều plugin có chức năng lấy nội dung bài viết. Nhưng mình đề xuất duy nhất cho bạn một plugin thôi. Đơn giản vì mình ít sử dụng các plugin khác khi đã tìm được một cái quá ổn định.

Lưu ý rằng: Bài viết này chỉ áp dụng cho website sử dụng mã nguồn WordPress.

Plugin mình đang sử dụng “Công Nghiệp” là:

WP Content Crawler

Cá nhân mình đánh giá thì plugin này quá tuyệt vời, nó cung cấp hầu như mọi thứ bạn cần thiết. Những gì trước giờ bạn sao chép, cắt dán nội dung bằng tay thì plugin này làm được hết.

Thật tuyệt vời đúng không nào?

Hãy nhanh tay tìm mua chung ngay Plugin này.

Nếu bạn có dư môt chút kinh phí hãy mua ngay tại đây, coi như là ủng hộ tác giả có thêm chút kinh phí để phát triển plugin tốt hơn.

Mình giới thiệu sơ qua 1 số chức năng của plugin trên như sau:

Lấy được hầu hết nội dung những website trên thế giới

Lấy được tiêu đề, nội dung, từ khóa, hình ảnh, video, các tài nguyên khác.

Lấy bài viết và kiểm tra được sự trùng lập.

Lưu hình ảnh, tài nguyên vào trực tiếp website của bạn.

Tự xóa các liên kết có trong nội dung cũ.

Dịch bài viết, tùy chỉnh hầu hết các ngôn ngữ trên thế giới.

Và nhiều tính năng đáng dùng khác….

Như vậy là đã xong phần plugin. Hãy xem tiếp bước cài đặt và lấy nội dung.

Cách lấy nội dung cũ từ Cache Google?

Thật không may, khi mình viết bài này, Cache Google đã không còn cho phép bạn sử dụng plugin để cấu hình tự động lấy bài viết cũ. Chỉ còn một cách là auto cơm (Bằng tay copy/paste).

Như vậy, ý tưởng này tạm thời bỏ qua bạn nhé. Mình sẽ cập nhật khi tìm ra được kỹ thuật mới.

Cách lấy Nội dung cũ từ Wayback Machine?

Thật tuyệt vời, trong khi các tài nguyên cho phép tìm lại nội dung cũ rất hạn hẹp, bạn vẫn còn một nơi khai thác nội dung miễn phí. Đó là Wayback Machine – http://web.archive.org;

Công việc của bạn chỉ là copy đường link pbn của bạn, dán vào ô tìm kiếm trên công cụ http://web.archive.org, sau đó nhấn search để xem các nội dung bạn có thể lấy được.

Lưu ý: Không phải lúc nào Wayback Machine cũng thu thập đầy đủ nội dung bài viết cũ, đặc biệt là hình ảnh.

Có nhiều nguyên nhân khiến bạn không thấy đầy đủ nội dung là: PBN trước đó từng chặn BOT Wayback Machine, hosting không ổn định, noindex hoặc bị sandbox thời gian dài.

Do đó, đùng quá kỳ vọng 100% vào công việc này, mọi thứ chỉ có thể ở mức tạm chấp nhận được.

Bây giờ mình sẽ thao tác cho bạn xem lại kỷ thuật lấy nội dung từ một PBN bất kỳ.

Đầu tiên bạn cài đặt website wordpres, cài đặt plugin.

Kế tiếp hãy truy cập vào http://web.archive.org để tìm nội dung cần khôi phục.

Tìm website trên Wayback Machine
Tìm website trên Wayback Machine

 

Chọn thời điểm cần khôi phục trên Wayback Machine
Chọn thời điểm cần khôi phục trên Wayback Machine

 

Thêm mới chiến dịch khôi phục website từ Wayback Machine

Thêm mới chiến dịch khôi phục website từ Wayback Machine

Do trường hợp này mình chỉ khôi phục nội dung từ  Wayback Machine, nên chỉ điền trang chủ Wayback Machine thôi.

 

Điền url chính cho chiến dịch từ Wayback Machine
Điền url chính cho chiến dịch từ Wayback Machine

 

Chọn danh mục website trên Wayback Machine
Chọn danh mục website trên Wayback Machine

Sau khi nhấn vào button mỏ lết trên, phải mất 1 thời gian ngắn để plugin tải xuống nội dung cũ cho bạn thao tác chức năng

Chọn vị trí danh mục website trên Wayback Machine
Chọn vị trí danh mục website trên Wayback Machine

Chú ý: Ở bước 2 trong hình này. Class trả về có thể rất dài, bạn nên xóa bớt cho đến khi vị trí màu cam bao phủ những danh mục mà bạn cần lấy.

 

Kiểm tra lại vị trí danh mục website trên Wayback Machine
Kiểm tra lại vị trí danh mục website trên Wayback Machine

 

Danh sách danh mục website trên Wayback Machine
Danh sách danh mục website trên Wayback Machine

 

Lựa chọn danh mục tương ứng trong Wayback Machine
Lựa chọn danh mục tương ứng trong Wayback Machine

Bạn chỉ nên lấy từ danh mục, các trang con như liên hệ, giới thiệu, chính sách không cần lấy tự động. Hãy làm việc đó bằng tay.

 

Chọn danh sách bài viết từ danh mục trên Wayback Machine
Chọn danh sách bài viết từ danh mục trên Wayback Machine

 

Chọn vi trí bài viết từ danh mục trên Wayback Machine
Chọn vi trí bài viết từ danh mục trên Wayback Machine

Thông thường: Khi bạn chọn 1 vị trí từ website, phần màu cam sẽ bôi tại vị trí đó. Hãy xóa bớt class ở số 2. cho đến khi màu cam bao phủ tại số 1. trong hình;

 

Sau khi hoàn tất vị trí, bạn chọn trang trên Wayback Machine
Sau khi hoàn tất vị trí, bạn chọn trang trên Wayback Machine

Nếu nội dung cũ có nhiều hơn 01 trang, bạn mới cần thiết dùng chức năng này.

 

Vị trí chọn trang trên Wayback Machine
Vị trí chọn trang trên Wayback Machine

 

Chọn tiếp tab Post để lấy bài viết trên Wayback Machine
Chọn tiếp tab Post để lấy bài viết trên Wayback Machine

Công việc bước này tương tự như các hướng dẫn phía trên. Tuy nhiên bạn không cần phải xóa class vị trí;

 

Chọn vị trí title bài viết trong Wayback Machine
Chọn vị trí title bài viết trong Wayback Machine

Bạn chỉ việc chọn vị trí, plugin sẽ cố gắn tự xử lý cho bạn.

 

Kiểm tra lại chức năng xem bài viết trên Wayback Machine
Kiểm tra lại chức năng xem bài viết trên Wayback Machine

Đây là các bước quan trọng trong bước lấy nội dung website cũ. Hãy kiểm tra lại các chức năng xem thử nội dung đúng chưa nhé.

 

Chọn tiếp vị trí nội dung trên Wayback Machine
Chọn tiếp vị trí nội dung trên Wayback Machine

Bước này đôi khi sẽ lấy dư vị trí content, hãy cố gắn chọn đúng khối màu cam bao phủ nội dung mà bạn muốn lấy.

 

Kiểm tra lại nội dung và chọn vị trí thẻ tag
Kiểm tra lại nội dung và chọn vị trí thẻ tag

Sau khi đã thực hiện chọn vị trí, hãy kích vào button search để kiểm tra lại những gì bạn lấy có đúng không.

 

Chọn vị trí thẻ tag trên Wayback Machine
Chọn vị trí thẻ tag trên Wayback Machine

Do đặc thù từng website, có thể bạn sẽ thấy thẻ tag nằm cuối bài viết. Hãy cố gắn thì thử xem nhé.

 

Chọn chức năng lưu trữ hình ảnh từ nội dung cũ
Chọn chức năng lưu trữ hình ảnh từ nội dung cũ

Chú ý rằng: Plugin này không tự nhận dạng hình ảnh nào đã lấy. Do đó, nó sẽ tự động lưu tất cả hình ảnh mà nó thấy được. Và hosting/vps của bạn sẻ phình to dữ liệu media.

 

Chức năng loại bỏ những vị trí không cần thiết, js, css dư thừa.
Chức năng loại bỏ những vị trí không cần thiết, js, css dư thừa.

Bạn nên sử dụng chức năng này để loại bỏ hoàn toàn các script, style dư thừa nhé.

 

Chọn vị trí templates để đến chức năng xóa link
Chọn vị trí templates để đến chức năng xóa link

Thông thường: Nội dung lấy về toàn chứa các link out linh tinh, bạn nên sử dụng chức năng này để loại bỏ tất cả chúng.

 

Chọn chức năng này để xóa bỏ toàn bộ URL trong bài viết
Chọn chức năng này để xóa bỏ toàn bộ URL trong bài viết

 

Sau đó nhấn lưu lại để áp dụng chiến dịch
Sau đó nhấn lưu lại để áp dụng chiến dịch

 

Vào chức năng như hình để active chức năng chạy tự động lấy bài viết
Vào chức năng như hình để active chức năng chạy tự động lấy bài viết

Chú ý: Trong lần cài đặt đầu tiên. Nếu bạn không vào chọn mục này, plugin của bạn không thể hoạt động. Đây là chức năng kích hoạt Cronjob mặc định của wordpress.

 

Nhấn chọn chức năng như hình để kích hoạt chạy ngay chiến dịch.
Nhấn chọn chức năng như hình để kích hoạt chạy ngay chiến dịch.

Hoàn thành chiến dịch tự động rùi: Việc bạn cần là kiên nhẫn chờ đợi thành quả thôi.

 

Như vậy với hơn 27 bước cơ bản như mình đã hướng dẫn, bạn đã có thể có trọn bộ nội dung cũ cho website PBN của bạn.

Lưu ý: Tỉ lệ bài viết lấy về chỉ tương đối, một số bài viết sẽ bị lỗi, hình ảnh có thể bị thiếu hoặc lỗi. Bạn nên kiểm tra lại từng bài để bổ sung cho phù hợp.

Kết luận

khôi phục PBN là một quá trình khá phức tạp và yêu cầu bạn phải có những kiến thức về HTML ở mức cơ bản. Với những hình ảnh và các bước chú thích đầy đủ. Mình hy vọng bạn sẽ không gặp nhiều khó khăn khi thực hiện khôi phục PBN.

Việc khôi phục PBN thông thường chỉ đạt kết quả tương đối, bạn muốn bài viết thật sự chất lượng thì nên kiểm tra và bổ sung thêm hình ảnh, bài viết bị thiếu.

Sau khi khôi phục PBN, bạn nên kiểm tra lại URL để tăng hiệu quả, giử được sức mạnh cho PBN.

Bạn đã khôi phục PBN thành công bằng cách nào? Hãy chia sẻ với mình bằng cách bình luận phía dưới nhé.

Trong bài viết đã sử dụng

Mã nguồn hỗ trợ website: https://wordpress.org

Plugin hỗ trợ lấy nội dung tự động: https://codecanyon.net/item/wp-content-crawler-get-content-from-almost-any-site-automatically/15983018

Tài nguyên chứa nội dung trong quá khứ: http://web.archive.org

 

Nguồn bài viết: Lê Thanh Sang – Dexuat.com

Vui lòng ghi nguồn website của mình nếu bạn copy nội dung này. Cám ơn bạn vì những tốt đẹp đó.

Góc bình luận

    • Lê Thanh Sang
      Quản lý

      Xây được bạn nhé. Nhưng tránh dùng chung gmail, điểm chung nhận dạng để tránh google phát hiện đó là hệ thống của bạn.

  1. T
    Trung

    Anh cho em hỏi. Nếu như PBN mình mua về cùng nói về 1 lĩnh vực, nhưng nội dung hoàn toàn khác nhau. Chẳng hạn PBN đó bán hàng…nhưng mục đích của mình thì chỉ viết blog. Vậy PBN này có khả năng khôi phục không?

    • Lê Thanh Sang
      Quản lý

      Chào Em,
      Nếu như EM nói thì hoàn toàn có thể khôi phục bình thường nhé. Bán hàng hoặc blog chỉ là cách nhìn của con người, còn với Google hoặc các công cụ khác thì nó dựa trên khai báo của mình. Nên cứ an tâm mà làm nhé.

  2. Hòa Nguyễn

    Bài viết rất cụ thể, cảm ơn Sang đã chia sẻ nhiệt tình. Hy vọng bạn làm thêm một bài viết về cách tìm PBN hết hạn bên tiếng Việt, hiện tại mình tìm mà không có ai share lun!

  3. Thanh

    Cho em hỏi. Trang web cũ được xây dựng bằng mã nguồn khác và giờ em xây dựng web bằng wordpress thì có lấy được nội dung không ạ, hay web cũ bằng wordpress & cái mới cũng bằng wordpress thì mới được.

    • Lê Thanh Sang
      Quản lý

      Chỉ cần website cũ của Em còn đọc, xem được nội dung cũ thì mã nguồn nào cũng có thể chuyển đổi cho nhau (Mã nguồn khác -> mã nguồn wordpress) Em nhé.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *