本文来源吾爱破解论坛
本帖最后由 寒心烟雨情 于 2018-11-26 21:13 编辑
给大家分享一些源码,有需要的可以学习一下。
花了点时间对几个影视资源网采集,然后对接公众号,用户可以在微信回复影视名,然后程序去网上搜索,再把搜索结果返回给用户。
这里我分享一个采集模块,主程序就不发出来了,其他几个模块也大同小异,学会一个其他也不难了。
采集简单思路:
1、网站以post请求提交数据。
2、提取搜索到的影视资源,并判断是否搜索到资源。
其他看注释吧!我已经把不容易看懂的注释了。
[Python] 纯文本查看 复制代码
import requests,re headers = {"Referer": "http://yongjiuzy.net/", "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"} def zzyz_cj(wd): url = "(某网站)" # 影视资源站采集 线路3 key = wd # 这个参数是搜索的资源名 data = {"wd": key, "submit":"search"} text = (requests.post(url, data=data, headers=headers).text) .encode("ISO-8859-1").decode("utf-8") #里面以post提交请求 url_list = re.findall('<li><span class="tt">(.*?)</li>', text, re.S) #提取搜索到的影视资源 if (len(url_list) == False): # 判断是否搜索到影视资源 return ("没有搜索到相关影片!") else: a_url = re.findall('<a href="(.*?)".*?', url_list[0], re.S) # 这里只提取第一条搜索到的链接 url_1 = ("(某网站)" + a_url[0]) # 这里提取到主目标页面 text = (requests.get(url_1).text).encode("ISO-8859-1").decode("utf-8") #这里还有一次get请求 h2 = re.findall('<h2>(.*?)</h2> ', text, re.S) #提取影视标题 re_text = re.findall('<li><input type="checkbox".*?/>(.*?)</li>', text, re.S) # 提取播放链接 url_list = [] url_list.append(h2[0] + "\n") for for_url in re_text: url_sp = (for_url.split("$")) fh_url = requests.get("http://api.kks.me/api.php?url=" + url_sp[1], headers=headers).text # 短网址转换,简洁链接和防红 url_list.append(url_sp[0] + fh_url + "\n") url_str = "".join(url_list) # 将列表转换为字符串 return (url_str)
这里我截了效果图:
6557998CC9E49A8E3173087AF390B021.jpg (88 KB, 下载次数: 0)
下载附件 保存到相册
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。