web crawling(plus6) more than one line-白红宇

web crawling(plus6) more than one line

阅读量：6689 次

发布时间：2019-06-25

本文共 1751 字，大约阅读时间需要 5 分钟。

#Author：Mini #！/usr/bin/env python import urllib.request import re import urllib.error import threading headers=("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.90 Safari/537.36") opener=urllib.request.build_opener() opener.addheaders=[headers] urllib.request.install_opener(opener) try:  class A(threading.Thread):     def __init__(self):       threading.Thread.__init__(self)     def run(self):         for i in range (1,10,2):             print("line A!")             url= "https://www.qiushibaike.com/hot/page/" + str(i) + "/"             pagedata = urllib.request.urlopen(url).read().decode("utf-8","ignore")             pat = '
    
     (.*?)'             datalist = re.compile(pat, re.S).findall(pagedata)             for j in range(0, len(datalist)):                 print(str(i) + "." + str(j) + "content:")                 print(datalist[j]) class B (threading.Thread):     def __init__(self):         threading.Thread.__init__(self)     def run(self):         for i in range(0,10,2):             print("line B!")             url="https://www.qiushibaike.com/hot/page/" + str(i) + "/"             pagedata = urllib.request.urlopen(url)             pagedata=pagedata.read().decode("utf-8","ignore")             pat = '
     
      (.*?)'             datalist = re.compile(pat, re.S).findall(pagedata)             for j in range(0, len(datalist)):                 print(str(i) + "." + str(j) + "content:")                 print(datalist[j])  t1=A()  t1.start()  t2=B()  t2.start() except urllib.error.URLError as e:     if hasattr(e, "code"):         print(e.code)     if hasattr(e, "reason"):         print(e.reason)

转载于:https://www.cnblogs.com/rabbittail/p/7631942.html

你可能感兴趣的文章

476-数字的补数

查看>>

七牛云赵之健：多维度融合赋能视频 AI 的实践

查看>>

Android 9 Pie震撼来袭同步登陆WeTest

查看>>

vue+element Form键盘回车事件页面刷新解决

查看>>

CSS3中的box-sizing

查看>>