首页 编程教程正文

使用python 对 xlsx操作 以及使用selenium对网站后台截图

piaodoo 编程教程 2020-02-22 22:07:00 946 0 python教程

本文来源吾爱破解论坛

本帖最后由 YXK 于 2019-8-1 19:08 编辑

写码不易........给波分吧!
需要用到的python库
pip install xlrd
pip install selenium


安装webdriver
各大浏览器webdriver地址可参见:https://docs.seleniumhq.org/download/
Firefox:https://github.com/mozilla/geckodriver/releases/
Chrome:https://sites.google.com/a/chromium.org/chromedriver/ 或者
http://chromedriver.storage.googleapis.com/index.html
IE:http://selenium-release.storage.googleapis.com/index.html
注:webdriver需要和对应的浏览器版本以及selenium版本对应下面是源码
功能是读取一个表格里面的值 并以数组的方式返回
[Python] 纯文本查看 复制代码

import xlrd
def getUrl(dizhi):
    data = xlrd.open_workbook(dizhi) #文件全路径
    table=data.sheet_by_index(0)
    nrows = table.nrows
    all_url=[]
    for i in range(0,nrows):
        call_url = table.cell(i, 3).value #取字段3的值
        all_url.append(call_url) #加入数组
    return all_url

嗨学网
通过以上代码获取到每个微博URL 然后用selenium进行后台截图

[Python] 纯文本查看 复制代码
from xlrdtest import getUrl #引用自写的方法
from selenium import webdriver
from time import sleep
wenjianDizhi = "C:\\Users\\Administrator\\Desktop\\网安工作\\1.xlsx"
allUrl = getUrl(wenjianDizhi)
options = webdriver.ChromeOptions()
options.add_argument('--kiosk')
options.add_argument('--headless')
driver = webdriver.Chrome(chrome_options=options)
driver.set_window_size(1400,900) #设置浏览器宽高
i = 1
for i in range(1,len(allUrl)):
    driver.get(str(allUrl[i]))
    sleep(5)
    picture_url = driver.get_screenshot_as_file('imgs\\%s.png'%i)
    if picture_url == True:
        print("%s:截图成功!" %allUrl[i])
print("截图全部完成....")
driver.quit()

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/7575.html

搜索