【2020年春季人教版教科书】爬RM教育出版社提供的电子教材

piaodoo 编程教程 2020-02-22 22:15:23 1454 0 python教程

本文来源吾爱破解论坛

本帖最后由 twostudy 于 2020-2-13 18:48 编辑
1.问题说明

人民教育出版社为落实疫情防控期间中小学校“停课不停教、不停学”要求，在网上公布了下学期的电子版教材。网址（http://bp.pep.com.cn/jc/）
前段时间我也一直在找相关教材的PDF，奈何质量好的比较少。这是权威发布的版本，质量应该是最好的了，而且涵盖范围广，涵盖小学、初中、高中到中职。
下一本当然不过瘾所以当然要多爬几本了，何况还有教师用书。

QQ浏览器截图20200213182415.png (106.6 KB, 下载次数: 0)

下载附件保存到相册

2020-2-13 18:24 上传

1.png (57.16 KB, 下载次数: 1)

下载附件保存到相册

2020-2-13 18:47 上传

2.png (63.1 KB, 下载次数: 1)

下载附件保存到相册

2020-2-13 18:47 上传

3.png (53.25 KB, 下载次数: 1)

下载附件保存到相册

2020-2-13 18:47 上传

4.png (56.09 KB, 下载次数: 1)

下载附件保存到相册

2020-2-13 18:47 上传

请大家轻点爬，就算都爬下来了，等用的时候应该都改版了。 2.Python程序这里就放一个函数接口，如《小学道德与法治教科书》地址为（http://bp.pep.com.cn/jc/ywjygjkcjc/xdjc/）只需要（/ywjygjkcjc/xdjc/）就行了

import requests
from tqdm import tqdm
from bs4 import BeautifulSoup
import os

def bookDown(url):
        #  获取当前工作目录
    saveDirectory = os.getcwd()

        #  页面获取与解析
    rootURL ='http://bp.pep.com.cn/jc'+url
    bookHtml = requests.get(rootURL)
    bookHtml.encoding = 'UTF-8'
    htmlsoup = BeautifulSoup(bookHtml.text,'lxml')

        #  创建存放文件夹
    directoryName = htmlsoup.find('h4')
    saveDirectory = saveDirectory+'\\'+str(directoryName.string)
    if not os.path.exists(saveDirectory):
        os.makedirs(saveDirectory)

        #  PDF的文件名和绝对地址
    bookName = htmlsoup.find_all('h6')
    bookSubUrl = htmlsoup.find_all('a', attrs={'class':'btn_type_dl'}, href = True)

        #  下载页面所有PDF教材
    bookNum = len(bookName)
    for index in range(bookNum):
        pdfName = saveDirectory+'\\'+bookName[index].string+'.pdf'
        pdfDownloadUrl = rootURL+bookSubUrl[index]['href'][2:]
        getPdf = requests.get(pdfDownloadUrl)
        content_size = int(int(getPdf.headers['Content-Length'])/1024)
        print(pdfName)
        pdfFile = open(pdfName,'wb')
        for data in tqdm(iterable=getPdf.iter_content(1024),total=content_size,unit='k',desc=pdfName):
            pdfFile.write(data)
        pdfFile.close()

3.感谢 1.第一次发帖，请大家多批评 2. 感谢 home.php?mod=space&uid=965057 ai酸的博文等大佬和同好，从他们的代码学习了很多。

QQ浏览器截图20200213180543.png (433.8 KB, 下载次数: 0)

下载附件保存到相册

一年级春季

2020-2-13 18:06 上传

版权声明：

本站所有资源均为站长或网友整理自互联网或站长购买自互联网，站长无法分辨资源版权出自何处，所以不承担任何版权以及其他问题带来的法律责任，如有侵权或者其他问题请联系站长删除！站长QQ754403226 谢谢。

有关影视版权：本站只供百度云网盘资源，版权均属于影片公司所有，请在下载后24小时删除，切勿用于商业用途。本站所有资源信息均从互联网搜索而来，本站不对显示的内容承担责任，如您认为本站页面信息侵犯了您的权益，请附上版权证明邮件告知【754403226@qq.com】，在收到邮件后72小时内删除。本文链接：https://www.piaodoo.com/7997.html