亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python爬蟲爬取新浪微博內容示例【基于代理IP】

2020-02-15 22:40:22
字體:
來源:轉載
供稿:網友

本文實例講述了Python爬蟲爬取新浪微博內容。分享給大家供大家參考,具體如下:

用Python編寫爬蟲,爬取微博大V的微博內容,本文以女神的微博為例(爬新浪m站:https://m.weibo.cn/u/1259110474)

一般做爬蟲爬取網站,首選的都是m站,其次是wap站,最后考慮PC站。當然,這不是絕對的,有的時候PC站的信息最全,而你又恰好需要全部的信息,那么PC站是你的首選。一般m站都以m開頭后接域名, 所以本文開搞的網址就是 m.weibo.cn。

前期準備

1.代理IP

網上有很多免費代理ip,如西刺免費代理IPhttp://www.xicidaili.com/,自己可找一個可以使用的進行測試;

2.抓包分析

通過抓包獲取微博內容地址,這里不再細說,不明白的小伙伴可以自行百度查找相關資料,下面直接上完整的代碼

完整代碼:

# -*- coding: utf-8 -*-import urllib.requestimport json#定義要爬取的微博大V的微博IDid='1259110474'#設置代理IPproxy_addr="122.241.72.191:808"#定義頁面打開函數def use_proxy(url,proxy_addr):  req=urllib.request.Request(url)  req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0")  proxy=urllib.request.ProxyHandler({'http':proxy_addr})  opener=urllib.request.build_opener(proxy,urllib.request.HTTPHandler)  urllib.request.install_opener(opener)  data=urllib.request.urlopen(req).read().decode('utf-8','ignore')  return data#獲取微博主頁的containerid,爬取微博內容時需要此iddef get_containerid(url):  data=use_proxy(url,proxy_addr)  content=json.loads(data).get('data')  for data in content.get('tabsInfo').get('tabs'):    if(data.get('tab_type')=='weibo'):      containerid=data.get('containerid')  return containerid#獲取微博大V賬號的用戶基本信息,如:微博昵稱、微博地址、微博頭像、關注人數、粉絲數、性別、等級等def get_userInfo(id):  url='https://m.weibo.cn/api/container/getIndex?type=uid&value='+id  data=use_proxy(url,proxy_addr)  content=json.loads(data).get('data')  profile_image_url=content.get('userInfo').get('profile_image_url')  description=content.get('userInfo').get('description')  profile_url=content.get('userInfo').get('profile_url')  verified=content.get('userInfo').get('verified')  guanzhu=content.get('userInfo').get('follow_count')  name=content.get('userInfo').get('screen_name')  fensi=content.get('userInfo').get('followers_count')  gender=content.get('userInfo').get('gender')  urank=content.get('userInfo').get('urank')  print("微博昵稱:"+name+"/n"+"微博主頁地址:"+profile_url+"/n"+"微博頭像地址:"+profile_image_url+"/n"+"是否認證:"+str(verified)+"/n"+"微博說明:"+description+"/n"+"關注人數:"+str(guanzhu)+"/n"+"粉絲數:"+str(fensi)+"/n"+"性別:"+gender+"/n"+"微博等級:"+str(urank)+"/n")#獲取微博內容信息,并保存到文本中,內容包括:每條微博的內容、微博詳情頁面地址、點贊數、評論數、轉發數等def get_weibo(id,file):  i=1  while True:    url='https://m.weibo.cn/api/container/getIndex?type=uid&value='+id    weibo_url='https://m.weibo.cn/api/container/getIndex?type=uid&value='+id+'&containerid='+get_containerid(url)+'&page='+str(i)    try:      data=use_proxy(weibo_url,proxy_addr)      content=json.loads(data).get('data')      cards=content.get('cards')      if(len(cards)>0):        for j in range(len(cards)):          print("-----正在爬取第"+str(i)+"頁,第"+str(j)+"條微博------")          card_type=cards[j].get('card_type')          if(card_type==9):            mblog=cards[j].get('mblog')            attitudes_count=mblog.get('attitudes_count')            comments_count=mblog.get('comments_count')            created_at=mblog.get('created_at')            reposts_count=mblog.get('reposts_count')            scheme=cards[j].get('scheme')            text=mblog.get('text')            with open(file,'a',encoding='utf-8') as fh:              fh.write("----第"+str(i)+"頁,第"+str(j)+"條微博----"+"/n")              fh.write("微博地址:"+str(scheme)+"/n"+"發布時間:"+str(created_at)+"/n"+"微博內容:"+text+"/n"+"點贊數:"+str(attitudes_count)+"/n"+"評論數:"+str(comments_count)+"/n"+"轉發數:"+str(reposts_count)+"/n")        i+=1      else:        break    except Exception as e:      print(e)      passif __name__=="__main__":  file=id+".txt"  get_userInfo(id)  get_weibo(id,file)            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
日韩女在线观看| 成人在线激情视频| 高清一区二区三区日本久| 5566日本婷婷色中文字幕97| 欧美www视频在线观看| 成人性生交大片免费观看嘿嘿视频| 亚洲另类激情图| 亚洲aaa激情| 久久99精品久久久久久琪琪| 日韩电影大全免费观看2023年上| 欧美成人性生活| 成人免费淫片aa视频免费| 精品av在线播放| 国产99久久精品一区二区 夜夜躁日日躁| 色偷偷91综合久久噜噜| 福利一区福利二区微拍刺激| 亚洲男人天堂2024| 中文字幕一区二区三区电影| 国产精品白丝jk喷水视频一区| 亚洲国产精品网站| 亚洲有声小说3d| 日韩在线中文字| 国产偷国产偷亚洲清高网站| 日韩在线观看免费全集电视剧网站| 日韩精品在线第一页| 国产欧美日韩中文字幕在线| 国内精品久久久久久久| 日韩av在线网址| 91久久夜色精品国产网站| 亚洲激情视频在线观看| 亚洲精品一区二区三区婷婷月| 欧美日韩免费网站| 97婷婷涩涩精品一区| 欧美性20hd另类| 国产99久久精品一区二区永久免费| 欧美丝袜美女中出在线| 亚洲精品电影网| 久久久99久久精品女同性| 欧美激情一区二区三区成人| 国产性猛交xxxx免费看久久| 久久久日本电影| 久久精品99无色码中文字幕| 亚洲国产中文字幕久久网| 精品国内产的精品视频在线观看| 国产欧美亚洲精品| 这里只有精品视频在线| 欧美在线视频观看免费网站| 亚洲精品久久久久中文字幕二区| 日韩国产高清污视频在线观看| 日韩亚洲欧美中文在线| 91高清免费视频| 91香蕉嫩草影院入口| 色老头一区二区三区| 在线丨暗呦小u女国产精品| 免费97视频在线精品国自产拍| 国产精品第一第二| 91精品国产综合久久久久久蜜臀| 欧美福利视频在线观看| 一夜七次郎国产精品亚洲| www.欧美三级电影.com| 在线视频日韩精品| 日韩av在线免费观看一区| 亚洲视频自拍偷拍| 91精品视频观看| 精品亚洲国产视频| 精品国模在线视频| 日韩欧美在线国产| 欧美性videos高清精品| 91精品综合久久久久久五月天| 亚洲一级免费视频| 久久福利网址导航| 国产偷亚洲偷欧美偷精品| 亚洲精品影视在线观看| 日本精品久久中文字幕佐佐木| 欧美裸体男粗大视频在线观看| 欧美日韩国产一区中文午夜| 欧美日韩aaaa| 91av在线免费观看| 国产成人avxxxxx在线看| 欧美日韩一二三四五区| 亚洲自拍偷拍第一页| 欧美极品美女视频网站在线观看免费| 亚洲天堂av综合网| 国产精品精品视频一区二区三区| 疯狂蹂躏欧美一区二区精品| 国产精品久久久久久中文字| 日韩精品视频在线免费观看| 色偷偷噜噜噜亚洲男人的天堂| 国产精品麻豆va在线播放| 青青草原成人在线视频| 日韩高清欧美高清| 亚洲色图15p| 国产亚洲欧美日韩美女| 久久久在线观看| 欧美乱妇40p| 精品久久久久久久久久久久| 久久国产精品99国产精| 精品欧美一区二区三区| 亚洲人成77777在线观看网| 亚洲а∨天堂久久精品9966| 国产精品久久久久久久av大片| 伊人男人综合视频网| 亚洲欧洲在线播放| 成人黄色大片在线免费观看| 青草热久免费精品视频| 国产日韩欧美日韩| 美女扒开尿口让男人操亚洲视频网站| 国内精品在线一区| 欧美日韩国产精品专区| 久久深夜福利免费观看| 国产精品1区2区在线观看| 久久久久久91| 亚洲色图15p| 福利视频第一区| 国产中文字幕亚洲| 久久精品影视伊人网| 亚洲精品v欧美精品v日韩精品| 国产丝袜一区二区| 日韩性xxxx爱| 日韩亚洲精品电影| 精品国产一区二区三区四区在线观看| 亚洲精品视频网上网址在线观看| 日韩美女毛茸茸| 国产性猛交xxxx免费看久久| 亚洲国模精品一区| 日韩av片免费在线观看| 国内精品伊人久久| 欧美午夜久久久| 日韩av手机在线| 日韩av电影中文字幕| 亚洲第一免费网站| 国产亚洲欧洲高清| 欧美激情亚洲精品| 91久久久久久久久久| 高跟丝袜欧美一区| 亚洲影院色在线观看免费| 国产欧美欧洲在线观看| 亚洲跨种族黑人xxx| 亚洲国产天堂网精品网站| 国产亚洲a∨片在线观看| 国产精品青草久久久久福利99| 中文字幕欧美精品在线| 亚洲第一在线视频| 日韩亚洲国产中文字幕| 国产成人jvid在线播放| 欧美刺激性大交免费视频| 久久国产精品首页| 欧美国产极速在线| 国产精欧美一区二区三区| 亚洲色图日韩av| 亚洲新声在线观看| 欧美高清无遮挡| 欧美亚洲视频在线观看| 这里只有精品在线播放| 在线视频欧美日韩精品| 亚洲人成网在线播放| 中文.日本.精品| 久久久爽爽爽美女图片| 国产精品电影网| 在线视频中文亚洲| 中文字幕av一区二区三区谷原希美| 国产精品爽爽爽| 日本免费一区二区三区视频观看| 欧美日韩久久久久|