亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 學院 > 開發設計 > 正文

Scrapy爬蟲入門教程十

2019-11-06 06:03:09
字體:
來源:轉載
供稿:網友

簡單的Python版本管理:pyenv Scrapy爬蟲入門教程一 Scrapy爬蟲入門教程二 Scrapy爬蟲入門教程三 Scrapy爬蟲入門教程四 Scrapy爬蟲入門教程五 Scrapy爬蟲入門教程六 Scrapy爬蟲入門教程七 Scrapy爬蟲入門教程八 Scrapy爬蟲入門教程九

導出文件序列化格式JSONJSON linesCSVxmlPickleMarshal存儲存儲URI參數存儲后端本地文件系統FTPS3標準輸出設置FEED_URIFEED_FORMATFEED_EXPORT_ENCODINGFEED_EXPORT_FIELDSFEED_STORE_EMPTYFEED_STORAGES_BASEFEED_EXPORTERSFEED_EXPORTERS_BASE

開發環境: Python 3.6.0 版本 (當前最新) Scrapy 1.3.2 版本 (當前最新)

導出文件

新版本0.10。

實現爬蟲時最常需要的特征之一是能夠正確地存儲所過濾的數據,并且經常意味著使用被過濾的數據(通常稱為“export feed”)生成要由其他系統消耗的“導出文件” 。

Scrapy使用Feed導出功能即時提供此功能,這允許您使用多個序列化格式和存儲后端來生成包含已抓取項目的Feed。

序列化格式

為了序列化抓取的數據,Feed導出使用項導出器。這些格式是開箱即用的:

JSONJSON linesCSVXML

但您也可以通過FEED_EXPORTERS設置擴展支持的格式 。

JSON

FEED_FORMAT: json使用出口: JsonItemExporter如果您對大型Feed使用JSON,請參閱此警告。

JSON lines

FEED_FORMAT: jsonlines使用出口: JsonLinesItemExporter

CSV

FEED_FORMAT: csv使用出口: CsvItemExporter指定要導出的列及其順序使用 FEED_EXPORT_FIELDS。其他Feed導出程序也可以使用此選項,但它對CSV很重要,因為與許多其他導出格式不同,CSV使用固定標頭。

XML

FEED_FORMAT: xml使用出口: XmlItemExporter

Pickle

FEED_FORMAT: pickle使用出口: PickleItemExporter

Marshal

FEED_FORMAT: marshal使用出口: MarshalItemExporter

存儲

使用Feed導出時,您可以使用URI(通過FEED_URI設置)定義在哪里存儲Feed 。Feed導出支持由URI方案定義的多個存儲后端類型。

支持開箱即用的存儲后端包括:

本地文件系統FTPS3(需要 botocore或 boto)標準輸出

如果所需的外部庫不可用,則某些存儲后端可能無法使用。例如,S3后端僅在安裝了botocore 或boto庫時可用(Scrapy僅支持boto到Python 2)。


存儲URI參數

存儲URI還可以包含在創建訂閱源時被替換的參數。這些參數是:

%(time)s - 在創建訂閱源時由時間戳替換%(name)s - 被蜘蛛名替換

任何其他命名參數將替換為同名的spider屬性。例如, 在創建訂閱源的那一刻,%(site_id)s將被spider.site_id屬性替換。

這里有一些例子來說明:

存儲在FTP中使用每個蜘蛛一個目錄: ftp://user:passWord@ftp.example.com/scraping/feeds/%(name)s/%(time)s.json存儲在S3使用每個蜘蛛一個目錄: s3://mybucket/scraping/feeds/%(name)s/%(time)s.json

存儲后端

本地文件系統

訂閱源存儲在本地文件系統中。

URI方案: file 示例URI: file:///tmp/export.csv 所需的外部庫:none 請注意,(僅)對于本地文件系統存儲,如果指定絕對路徑,則可以省略該方案/tmp/export.csv。這只適用于Unix系統。

FTP

訂閱源存儲在FTP服務器中。

URI方案: ftp示例URI: ftp://user:pass@ftp.example.com/path/to/export.csv所需的外部庫:none

S3

訂閱源存儲在Amazon S3上。

URI方案: s3示例URI: s3://mybucket/path/to/export.csvs3://aws_key:aws_secret@mybucket/path/to/export.csv所需的外部庫:botocore或boto

AWS憑證可以作為URI中的用戶/密碼傳遞,也可以通過以下設置傳遞:

AWS_access_KEY_IDAWS_SECRET_ACCESS_KEY

標準輸出

Feed被寫入Scrapy進程的標準輸出。

URI方案: stdout示例URI: stdout:所需的外部庫:none

設置

這些是用于配置Feed導出的設置:

FEED_URI (強制性)FEED_FORMATFEED_STORAGESFEED_EXPORTERSFEED_STORE_EMPTYFEED_EXPORT_ENCODINGFEED_EXPORT_FIELDS

FEED_URI

默認: None

導出Feed的URI。請參閱支持的URI方案的存儲后端。

啟用Feed導出時需要此設置。

FEED_FORMAT

要用于Feed的序列化格式。有關可能的值,請參閱 序列化格式。

FEED_EXPORT_ENCODING

默認: None

要用于Feed的編碼。

如果取消設置或設置為None(默認),它使用UTF-8除了JSON輸出,/uXXXX由于歷史原因使用安全的數字編碼(序列)。

使用utf-8,如果你想UTF-8 JSON了。

FEED_EXPORT_FIELDS

默認: None

要導出的字段的列表,可選。示例:。FEED_EXPORT_FIELDS = [“foo”, “bar”, “baz”]

使用FEED_EXPORT_FIELDS選項定義要導出的字段及其順序。

當FEED_EXPORT_FIELDS為空或無(默認)時,Scrapy使用在Item蜘蛛正在產生的dicts 或子類中定義的字段。

如果導出器需要一組固定的字段(CSV導出格式為這種情況 ),并且FEED_EXPORT_FIELDS為空或無,則Scrapy會嘗試從導出的??數據中推斷字段名稱 - 當前它使用第一個項目中的字段名稱。

FEED_STORE_EMPTY

默認: False

是否導出空Feed(即,沒有項目的Feed)。

FEED_STORAGES 默認: {}

包含您的項目支持的其他Feed存儲后端的字典。鍵是URI方案,值是存儲類的路徑。

FEED_STORAGES_BASE

默認:

{ '': 'scrapy.extensions.feedexport.FileFeedStorage', 'file': 'scrapy.extensions.feedexport.FileFeedStorage', 'stdout': 'scrapy.extensions.feedexport.StdoutFeedStorage', 's3': 'scrapy.extensions.feedexport.S3FeedStorage', 'ftp': 'scrapy.extensions.feedexport.FTPFeedStorage',}

包含Scrapy支持的內置Feed存儲后端的字典。您可以通過分配其中None的URI方案 來禁用這些后端FEED_STORAGES。例如,要禁用內置FTP存儲后端(無替換),請將其放置在settings.py:

FEED_STORAGES = { 'ftp': None,}

FEED_EXPORTERS

默認: {}

包含您的項目支持的其他導出器的字典。鍵是序列化格式,值是Item exporter類的路徑。

FEED_EXPORTERS_BASE

默認:

{ 'json': 'scrapy.exporters.JsonItemExporter', 'jsonlines': 'scrapy.exporters.JsonLinesItemExporter', 'jl': 'scrapy.exporters.JsonLinesItemExporter', 'csv': 'scrapy.exporters.CsvItemExporter', 'xml': 'scrapy.exporters.XmlItemExporter', 'marshal': 'scrapy.exporters.MarshalItemExporter', 'pickle': 'scrapy.exporters.PickleItemExporter',}

一個包含Scrapy支持的內置feed導出器的dict。您可以通過分配其中None的序列化格式來禁用任何這些導出器FEED_EXPORTERS。例如,要禁用內置的CSV導出器(無替換),請將其放置在settings.py:

FEED_EXPORTERS = { 'csv': None,}
上一篇:strncmp函數

下一篇:Cmake

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
97超碰蝌蚪网人人做人人爽| 亚洲国内精品视频| 欧美午夜激情小视频| 亚洲第一av网站| 91精品国产91久久久久| 亚洲毛片一区二区| 国产精品91在线观看| 欧美午夜激情小视频| 国产精品嫩草影院一区二区| 欧美成人免费一级人片100| 久色乳综合思思在线视频| 欧美精品久久久久久久久久| 韩国国内大量揄拍精品视频| 欧美午夜www高清视频| 日韩黄色av网站| www.亚洲一区| 成人网页在线免费观看| 中文字幕欧美专区| 日韩av免费在线| 亚洲区在线播放| 亚洲电影第1页| 8090理伦午夜在线电影| 欧美视频在线观看免费网址| 久久精品91久久香蕉加勒比| 视频在线一区二区| 日韩在线免费av| 国产精品视频不卡| 欧美xxxx18国产| 中文字幕日韩欧美| 精品久久久国产| 欧美精品在线网站| 亚洲国产精品99久久| 国产成人小视频在线观看| 一区二区三区在线播放欧美| 日韩欧美黄色动漫| 久久中文字幕在线视频| 午夜精品美女自拍福到在线| 亚洲影院色在线观看免费| 国产精品va在线播放我和闺蜜| 国产精品久久久久久久久免费| 久久夜精品va视频免费观看| 欧美三级欧美成人高清www| 色老头一区二区三区| 日韩美女写真福利在线观看| 日韩电影免费观看在线观看| 国产欧亚日韩视频| 视频在线观看99| 久久九九精品99国产精品| 国内免费久久久久久久久久久| 亚洲精品一区二区久| 色综合视频一区中文字幕| 国产精品69精品一区二区三区| 国内精品视频一区| 精品香蕉一区二区三区| 亚洲最大的av网站| 精品国产91久久久久久| 69av成年福利视频| 亚洲精品一区二区三区婷婷月| 亚洲国产精品视频在线观看| 最近2019年手机中文字幕| 国产精品pans私拍| 欧美精品激情blacked18| 粉嫩老牛aⅴ一区二区三区| 亚洲片国产一区一级在线观看| 亚洲激情第一页| 亚洲国产精品推荐| zzjj国产精品一区二区| 日韩视频在线观看免费| 亚洲精品国产精品国自产观看浪潮| 久久久国产精品x99av| 国产精品成人一区二区三区吃奶| 国产精品视频不卡| 91久久久久久久一区二区| 亚洲女人被黑人巨大进入| 欧美最近摘花xxxx摘花| 一区二区在线视频播放| 欧美在线视频观看免费网站| 中文字幕无线精品亚洲乱码一区| 8x拔播拔播x8国产精品| 亚洲综合在线小说| 国产精品在线看| 亚洲第一网中文字幕| 午夜精品久久久久久久99黑人| 最好看的2019的中文字幕视频| 亚洲第一区在线观看| 欧美尺度大的性做爰视频| 日韩av在线精品| 欧美超级免费视 在线| 亚洲欧美中文另类| 久久久这里只有精品视频| 国产精品小说在线| 国产亚洲精品91在线| 亚洲国产成人精品电影| 欧美情侣性视频| 亚洲欧洲在线播放| 国语自产精品视频在线看抢先版图片| 久久久国产精品视频| 欧美日韩高清在线观看| 久久久久久久久久久亚洲| 国产精品一区二区久久精品| 97在线免费观看| 欧洲成人午夜免费大片| 亚洲欧美日韩一区在线| 亚洲色图美腿丝袜| 亚洲999一在线观看www| 亚洲自拍偷拍福利| 久久av中文字幕| 人人澡人人澡人人看欧美| 亚洲在线第一页| 九九热在线精品视频| 最近2019中文字幕一页二页| 国产精品吹潮在线观看| 色综合伊人色综合网| 国产亚洲成av人片在线观看桃| 国内精品小视频| 国产美女被下药99| 欧美高清视频在线| 成人av在线网址| 亚洲国产欧美一区二区丝袜黑人| 国产狼人综合免费视频| 亚洲的天堂在线中文字幕| 韩剧1988在线观看免费完整版| 中文字幕一精品亚洲无线一区| 久久手机免费视频| 日韩美女主播视频| 久久久999精品视频| 中文字幕亚洲欧美在线| 日韩欧美中文字幕在线播放| 日韩影视在线观看| 热久久免费国产视频| 国产亚洲精品一区二区| 日韩成人网免费视频| 成人疯狂猛交xxx| 姬川优奈aav一区二区| 日韩在线视频二区| 国产精品91久久| xxx成人少妇69| 黄网站色欧美视频| 亚洲精品午夜精品| 神马国产精品影院av| 欧美视频在线观看免费网址| 91久久在线播放| 久久精品99无色码中文字幕| 日韩欧美在线播放| 亚洲老头老太hd| 日本aⅴ大伊香蕉精品视频| 国内外成人免费激情在线视频| 国产一区二区三区三区在线观看| 成人性生交大片免费观看嘿嘿视频| 亚洲国产精品人久久电影| www.国产精品一二区| 国产精品ⅴa在线观看h| 亚洲国产欧美一区二区丝袜黑人| 中文字幕欧美精品日韩中文字幕| 久久久久久久色| 亚洲精品不卡在线| 国产精品日韩欧美综合| 亚洲第一精品夜夜躁人人爽| 欧美成人午夜剧场免费观看| 日韩精品免费观看| 国产精品视频xxxx| 久久综合国产精品台湾中文娱乐网| 国产69精品久久久久9999| 亚洲精品成a人在线观看|