python对影视资源采集

piaodoo 编程教程 2020-02-22 22:14:50 1475 0 python教程

本文来源吾爱破解论坛

本帖最后由寒心烟雨情于 2018-11-26 21:13 编辑

给大家分享一些源码，有需要的可以学习一下。

花了点时间对几个影视资源网采集，然后对接公众号，用户可以在微信回复影视名，然后程序去网上搜索，再把搜索结果返回给用户。

这里我分享一个采集模块，主程序就不发出来了，其他几个模块也大同小异，学会一个其他也不难了。

采集简单思路：

1、网站以post请求提交数据。

2、提取搜索到的影视资源，并判断是否搜索到资源。

其他看注释吧！我已经把不容易看懂的注释了。

[Python] 纯文本查看 复制代码

import requests,re

headers = {"Referer": "http://yongjiuzy.net/",
            "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}
def zzyz_cj(wd):
    url = "（某网站）"  # 影视资源站采集      线路3
    key = wd         # 这个参数是搜索的资源名
    data = {"wd": key, "submit":"search"}
    text = (requests.post(url, data=data, headers=headers).text) .encode("ISO-8859-1").decode("utf-8")  #里面以post提交请求
    url_list = re.findall('<li><span class="tt">(.*?)</li>', text, re.S)    #提取搜索到的影视资源
    if (len(url_list) == False):            #  判断是否搜索到影视资源
        return ("没有搜索到相关影片！")
    else:
        a_url = re.findall('<a href="(.*?)".*?', url_list[0], re.S)      #  这里只提取第一条搜索到的链接
        url_1 = ("（某网站）" + a_url[0])  # 这里提取到主目标页面
        text = (requests.get(url_1).text).encode("ISO-8859-1").decode("utf-8")     #这里还有一次get请求
        h2 = re.findall('<h2>(.*?)</h2> ', text, re.S)             #提取影视标题
        re_text = re.findall('<li><input type="checkbox".*?/>(.*?)</li>', text, re.S)  # 提取播放链接
        url_list = []
        url_list.append(h2[0] + "\n")
        for for_url in re_text:
            url_sp = (for_url.split("$"))
            fh_url = requests.get("http://api.kks.me/api.php?url=" + url_sp[1], headers=headers).text  # 短网址转换，简洁链接和防红
            url_list.append(url_sp[0] + fh_url + "\n")
        url_str = "".join(url_list)   #  将列表转换为字符串
        return (url_str)

这里我截了效果图：

6557998CC9E49A8E3173087AF390B021.jpg (88 KB, 下载次数: 0)

下载附件保存到相册

2018-11-26 21:09 上传

版权声明：

本站所有资源均为站长或网友整理自互联网或站长购买自互联网，站长无法分辨资源版权出自何处，所以不承担任何版权以及其他问题带来的法律责任，如有侵权或者其他问题请联系站长删除！站长QQ754403226 谢谢。

有关影视版权：本站只供百度云网盘资源，版权均属于影片公司所有，请在下载后24小时删除，切勿用于商业用途。本站所有资源信息均从互联网搜索而来，本站不对显示的内容承担责任，如您认为本站页面信息侵犯了您的权益，请附上版权证明邮件告知【754403226@qq.com】，在收到邮件后72小时内删除。本文链接：https://www.piaodoo.com/7930.html