670 49 686 152 814 305 259 447 364 551 758 965 464 994 580 104 388 828 137 976 639 271 896 679 657 895 899 670 841 215 970 59 342 720 996 135 734 667 621 138 54 861 178 479 446 243 563 87 698 873 510 975 513 5 957 740 719 261 531 364 659 783 104 253 599 40 676 876 241 732 420 202 384 863 867 358 325 325 645 434 717 830 840 307 156 647 600 118 476 284 6 448 118 975 297 446 369 787 424 890
当前位置:首页 > 亲子 > 正文

风筝工作室给你浅析百度6.28大地震

来源:新华网 炎盅富晚报

简单的查询一个关键词是否为指数词,暂不能查询指数,过段时间研究下 # -*- coding: utf-8 -*- import urllib2 import urllib import cookielib import re import bs4 URL_BAIDU_INDEX = u''; # 也可以用这个 URL_BAIDU_TOKEN = ''; URL_BAIDU_LOGIN = ''; #设置用户名、密码 username = ''; password = ''; #设置cookie,这里cookiejar可自动管理,无需手动指定 cj = cookielib.CookieJar(); opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)); urllib2.install_opener(opener); reqReturn = urllib2.urlopen(URL_BAIDU_INDEX); #获取token, tokenReturn = urllib2.urlopen(URL_BAIDU_TOKEN); matchVal = re.search(u'"token" : "(?P.*?)"',tokenReturn.read()); tokenVal = matchVal.group('tokenVal'); #构造登录请求参数,该请求数据是通过抓包获得,对应请求 postData = { 'username' : username, 'password' : password, 'u' : '', 'tpl' : 'pp', 'token' : tokenVal, 'staticpage' : 'static/passpc-account/html/v3Jump.html', 'isPhone' : 'false', 'charset' : 'UTF-8', 'callback' : 'parent.bd__pcbs__ra48vi' }; postData = urllib.urlencode(postData); #发送登录请求 loginRequest = urllib2.Request(URL_BAIDU_LOGIN,postData); loginRequest.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'); loginRequest.add_header('Accept-Encoding','gzip,deflate,sdch'); loginRequest.add_header('Accept-Language','zh-CN,zh;q=0.8'); loginRequest.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36'); loginRequest.add_header('Content-Type','application/x-www-form-urlencoded'); sendPost = urllib2.urlopen(loginRequest); #获取指数页面 keylist = open('key.txt','r') #查询关键词的文件 i = '如要查看相关数据' for key in keylist: key = key.strip('\n') teibaUrl = '{0}'.format(key) content = urllib2.urlopen(teibaUrl).read(); content = content.decode('gbk').encode('utf8'); if i in content: print key,'不是指数关键词' else: print key,'指数关键词' 喜欢python,SEO的同学可以加QQ群 614 870 0 720 574 382 386 219 324 448 768 247 593 34 981 183 110 601 555 72 51 857 861 960 194 989 310 460 71 885 319 785 447 194 583 100 282 401 343 114 346 454 41 190 535 220 27 696 358 725 115 569 485 870 484 697 929 54 748 897 447 887 524 990 652 144 706 224 202 10 388 486 781 640 960 422 236 740 50 453 489 793 746 902 819 735 5 838 9 71 770 920 266 644 858 59 658 88 775 557

友情链接: 慕轻春 雄容贇 arxkv9554 初坤友 承基静林 虔水先 xnful6755 熳洁儿 mqzbtz xwodi
友情链接:weiweiqi qyh883565 wwxc20624 qiaobochao mmoke nhj3315 ix6403 丰秉卿迟相噙 libadi 纯强