建立自己的管道

使用 scrapy startproject myproject 建立 scrapy 專案時,你會發現已有一個 pipelines.py 檔案可用於建立自己的管道。在此檔案中建立管道不是強制性的,但這是一種很好的做法。我們將解釋如何使用 pipelines.py 檔案建立管道:

pipelines.py

class MyPipeline(object):
    def process_item(self, item, spider):
        # process your `item` here
        return item

現在要啟用它,你需要指定它將在你的設定中使用。轉到你的 settings.py 檔案並搜尋(或新增)ITEM_PIPELINES 變數。使用管道類的路徑及其優先於其他管道的路徑更新它:

settings.py

ITEM_PIPELINES = {
    'myproject.pipelines.MyPipeline': 300,
}

現在,你的蜘蛛返回的每個專案都將通過此管道。