Dữ liệu hay data chính là những bài viết, những trang trong blog. Chúng ta có thể lấy được dữ liệu đó là do 1 tính năng mà blogspot cung cấp - RSS - ATOM - Nguồn cấp dữ liệu bài đăng.Một số người lấy dữ liệu của chính blog của họ để đăng lên site vệ tinh, cũng có một số lười viết bài nên đi ăn cắp dữ liệu của blog khác. Làm sao mà họ làm được điều đó? Dưới đây là câu trả lời:
Bước 1: Xác định tổng số bài viết của blog muốn lấy dữ liệu!
Truy cập https://www.kimidev.site/p/test-code-html-and-javascript.html
Copy đoạn code bên dưới, paste vào "Khung nhập mã" rồi ấn "Xem trước nhanh"
Bạn sẽ thấy hiện ra "Tổng số bài" của blog đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Blogspot chỉ cho import tối đa 500 bài.
Bước 2: Lấy dữ liệu về máy
Copy đường link dưới:
Trong đó:
https://www.kimidev.site : đường link blog mà bạn muốn lấy dữ liệu
X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
Ví dụ: Blog muốn lấy dữ liệu có 200 bài viết thì đường link trên sẽ là:
Cách 1: Sử dụng trình duyệt
Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành". Ta sẽ lưu được 1 file .xml
Ví dụ: Blog muốn lấy dữ liệu có 200 bài thì sẽ thay X=1 và Y=200
Nếu có 1000 bài, thì bạn phải lấy 2 lần. Lần đầu X=1, Y=500 ~> Lưu file .xml; lần sau X=501, Y=1000 ~> Lưu file .xml (Mỗi lần chỉ lấy được 500 bài thôi vì blogspot cho import tối đa 500 bài)
Cách 2: Sử dụng Internet Download Manager (IDM)
Mở IDM lên ~> Ấn "Add URL" ~> Paste link trên vào rồi chọn "OK"
Bước 3:Cách Nhập dữ liệu (import data) vào blog của bạn
Đăng nhập Blog ~> Cài đặt ~> Quản lí blogs ~> Nhập Nội dung
Chọn file .xml vừa tải về để import lên blog của bạn ~> nhập nội dung
Vậy là coi như đã xong!
Lấy toàn bộ dữ liệu (DATA) của Blogspot |
Cách lấy Dữ liệu data của blogspot
Bước 1: Xác định tổng số bài viết của blog muốn lấy dữ liệu!
Truy cập https://www.kimidev.site/p/test-code-html-and-javascript.html
Copy đoạn code bên dưới, paste vào "Khung nhập mã" rồi ấn "Xem trước nhanh"
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="https://www.kimidev.site/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
lưu ý: hãy thay https://www.kimidev.site thành địa chỉ blogs bạn cần lấy data nhé
Bạn sẽ thấy hiện ra "Tổng số bài" của blog đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Blogspot chỉ cho import tối đa 500 bài.
Bước 2: Lấy dữ liệu về máy
Copy đường link dưới:
https://www.kimidev.site/atom.xml?redirect=false&start-index=X&max-results=Y
Trong đó:
https://www.kimidev.site : đường link blog mà bạn muốn lấy dữ liệu
X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
Ví dụ: Blog muốn lấy dữ liệu có 200 bài viết thì đường link trên sẽ là:
https://www.kimidev.site/atom.xml?redirect=false&start-index=1&max-results=200
Cách 1: Sử dụng trình duyệt
Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành". Ta sẽ lưu được 1 file .xml
lưu file xml |
Ví dụ: Blog muốn lấy dữ liệu có 200 bài thì sẽ thay X=1 và Y=200
Nếu có 1000 bài, thì bạn phải lấy 2 lần. Lần đầu X=1, Y=500 ~> Lưu file .xml; lần sau X=501, Y=1000 ~> Lưu file .xml (Mỗi lần chỉ lấy được 500 bài thôi vì blogspot cho import tối đa 500 bài)
Cách 2: Sử dụng Internet Download Manager (IDM)
Mở IDM lên ~> Ấn "Add URL" ~> Paste link trên vào rồi chọn "OK"
add link download idm |
Bước 3:Cách Nhập dữ liệu (import data) vào blog của bạn
Đăng nhập Blog ~> Cài đặt ~> Quản lí blogs ~> Nhập Nội dung
nhập dữ liệu |
Chọn file .xml vừa tải về để import lên blog của bạn ~> nhập nội dung
Vậy là coi như đã xong!
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.
Các bạn cũng không nên import quá nhiều bài của cùng 1 blog cùng 1 lúc (khoảng 4000 bài ~.~), vì làm vậy thì blog của bạn sẽ rất dễ bị xóa. Nên lấy data của nhiều blog, mỗi blog khoảng vài chục bài sẽ tốt hơn.
hành động lấy dữ liệu này không khác gì ăn cắp vậy nên các bạn không nên suốt ngày đi ăn cắp dữ liệu của người khác mà hãy tự tay viết lên những bài viết của mình. Thêm nữa vấn đề về bản quyền tác giả hiện nay cũng rất khắt khe vậy nên các bạn cần cân nhắc kĩ trước khi muốn lấy dữ liệu của blog nào đó.