首页 编程教程正文

【原创】一键检测百度收录死链脚本,摆脱百度收录死链。

piaodoo 编程教程 2020-02-22 22:03:42 869 0 python教程

本文来源吾爱破解论坛

功能如标题,就是要检测百度有没有收录你网站的死链,30行代码解决死链问题,不知道有多少个人用得到这个东西,所以现在就不写UI界面了,如果多人需要再考虑写吧!


脚本只支持百度检测,其他搜索引擎也一样原理,需要就自己写正则就好了。



360截图20181025130851115.jpg (77.05 KB, 下载次数: 1)

下载附件  保存到相册

2018-10-25 13:29 上传

360截图20181025131051026.jpg (48.45 KB, 下载次数: 1)

下载附件  保存到相册

2018-10-25 13:29 上传

[Python] 纯文本查看 复制代码
'''2018.10.24编写,在查询域名哪里修改域名就可以开始使用了,
在使用之前先自己手动清空或删除url。txt文件,本脚本仅支持百度检测'''


import requests,re,threading
def url_jc(url):
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
    urls = requests.get(url, headers=headers).text
    res = re.findall('<div class="result c-container ".*?>(.*?)</div>', urls, re.S)   #比配收录内容
    for i in res:
        url2 = re.findall('href = "(.*?)"', i, re.S)    #提取每一条链接
        sta = requests.get(url2[0], timeout=5)
        if (sta.status_code == 404):
            fl = open("url.txt", "a")
            fl.write(sta.url + "\n")   #   404链接写入文件
            fl.close()

if __name__ == '__main__':
    url_0="查询的域名"           #查询的域名   例 www.baidu.com
    pn = 0
    r=requests.get("http://www.baidu.com/s?wd=site:"+url_0)   #
    try:
        re_pn=re.findall('<b style="color:#333">(.*?)</b>',r.text,re.S)[0]    #比配pn
    except:
        re_pn=re.findall('<p><b>找到相关结果数约(.*?)个</b></p>',r.text,re.S)[0]    #比配pn
    pns=(re_pn.replace(",",""))   #把收录数的,去掉
    pns=(round((int(pns)/10)+1,0))   #计算要循环多少次
    for i in range(1,int(pns)):
        url="https://www.baidu.com/s?wd=site:%s&pn=%d&tn=91003609_hao_pg"%(url_0,pn)
        th = threading.Thread(target=url_jc,args=(url,))    #启用线程,不过感觉没什么用
        th.setDaemon(True)
        th.start()
        th.join()
        pn=pn+10
        print("检测中。。。。。。。。。。")
    print("检测完成!")

本帖被以下淘专辑推荐: · 个人收藏|主题: 528, 订阅: 130

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/7456.html

搜索