使用 Python 读写 Excel 文件（一）

piaodoo 编程教程 2020-02-22 22:02:34 935 0 python教程

本文来源吾爱破解论坛

项目要求
如果说是 Office 办公软件使得 Windows 成为主流的操作系统，那么 Excel 就是使得微软硬起来的法宝！
Word 和 PowerPoint 都有不相上下的对手，但 Excel 几乎是无法被取代的，因为这玩意儿确实太逆天了，它甚至让一向自命不凡的苹果用户都纷纷拜倒。
有人说 “对职场人而言，掌握 Excel，其实是在解放自己；对企业家而言，了解 Excel，其实是在赢得先机。
没错，Excel 就是这么吊。
作为程序猿，我们也离不开 Excel。
从网页爬下来的海量数据可以用 Excel 清洗过滤，成堆的实验数据也可以用 Excel 进行分析……
当然，大家不要想歪了，咱今天的课程不是教大家 Excel 怎么玩？
而是讲如何使用 Python 来操作 Excel！
要求：使用 python 读写 Excel 文件。

开发思路
得益于前人的辛勤劳作，Python 处理 Excel 已有很多现成的 “轮子”
openpyxl 模块的使用。关于这个模块的详细用法，大家可以参考 ->openpyxl 模块中文文档
openpyxl 模块简单易用、功能广泛，单元格格式/图片/表格/公式/筛选/批注/文件保护等功能应有尽有，图表功能是其一大亮点。

思路一：安装 openpyxl 模块
打开 cmd 命令行窗口，输入pip install openpyxl命令即可 “一键安装”：

12.png (158.21 KB, 下载次数: 2)

下载附件保存到相册

2018-1-30 00:28 上传

注：如果当前环境下安装有多个版本的 Python，请确保 pip 命令对应的 Python 版本（参见 ->如何让多个版本的 Python 和谐共处）

打开 IDLE，执行import openpyxl语句，如果没有报错，那就说明成功安装啦：

13.png (25.51 KB, 下载次数: 3)

下载附件保存到相册

2018-1-30 00:28 上传

思路二：创建并保存 Excel 文件
调用 openpyxl.Workbook() 生成一个 Workbook 的实例化对象，这个就代表一个工作簿（就是一个 Excel 文件）：
[Python] 纯文本查看 复制代码

import openpyxl
 
wb = openpyxl.Workbook()
 
# 获取活跃的工作表
ws = wb.active
 
# 数据可以直接赋值给单元格
ws['A1'] = 520
 
# 可以整行添加
ws.append([1, 2, 3])
 
# Python 类型将自动转换
import datetime
ws['A3'] = datetime.datetime.now()
 
# 保存文件
wb.save("demo.xlsx")

上面代码依次敲完之后，我们可以在 IDLE 所在的文件夹中找到一个叫做 “demo.xlsx” 的 Excel 文件。

打开之后内容如下：

14.png (16.64 KB, 下载次数: 2)

下载附件保存到相册

2018-1-30 00:29 上传

思路三：将豆瓣 TOP250 电影排行榜保存为 Excel 文件
《豆瓣TOP250电影排行榜》文本文件：

这也没什么问题，但如果现在要你从这 250 部电影中按评分进行排序，那估计又是一场头脑风暴了……

虽然用 Python 可以实现，但在 Excel 上就是点几下鼠标的操作

[Python] 纯文本查看 复制代码

import requests[/font]
[font=宋体]import bs4[/font]
[font=宋体]import re[/font]
[font=宋体]import openpyxl[/font]
 
[font=宋体]def open_url(url):[/font]
[font=宋体]    # 使用代{过}{滤}理[/font]
[font=宋体]    # proxies = {"http": "127.0.0.1:1080", "https": "127.0.0.1:1080"}[/font]
[font=宋体]    headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}[/font]
 
[font=宋体]    # res = requests.get(url, headers=headers, proxies=proxies)[/font]
[font=宋体]    res = requests.get(url, headers=headers)[/font]
 
[font=宋体]    return res[/font]
 
[font=宋体]def find_movies(res):[/font]
[font=宋体]    soup = bs4.BeautifulSoup(res.text, 'html.parser')[/font]
 
[font=宋体]    # 电影名[/font]
[font=宋体]    movies = [][/font]
[font=宋体]    targets = soup.find_all("div", class_="hd")[/font]
[font=宋体]    for each in targets:[/font]
[font=宋体]        movies.append(each.a.span.text)[/font]
 
[font=宋体]    # 评分[/font]
[font=宋体]    ranks = [][/font]
[font=宋体]    targets = soup.find_all("span", class_="rating_num")[/font]
[font=宋体]    for each in targets:[/font]
[font=宋体]        ranks.append(each.text)[/font]
 
[font=宋体]    # 资料[/font]
[font=宋体]    messages = [][/font]
[font=宋体]    targets = soup.find_all("div", class_="bd")[/font]
[font=宋体]    for each in targets:[/font]
[font=宋体]        try:[/font]
[font=宋体]            messages.append(each.p.text.split('\n')[1].strip() + each.p.text.split('\n')[2].strip())[/font]
[font=宋体]        except:[/font]
[font=宋体]            continue[/font]
 
[font=宋体]    result = [][/font]
[font=宋体]    length = len(movies)[/font]
[font=宋体]    for i in range(length):[/font]
[font=宋体]        result.append([movies[i], ranks[i], messages[i]])[/font]
 
[font=宋体]    return result[/font]
 
[font=宋体]# 找出一共有多少个页面[/font]
[font=宋体]def find_depth(res):[/font]
[font=宋体]    soup = bs4.BeautifulSoup(res.text, 'html.parser')[/font]
[font=宋体]    depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text[/font]
 
[font=宋体]    return int(depth)[/font]
 
[font=宋体]def save_to_excel(result):[/font]
[font=宋体]    wb = openpyxl.Workbook()[/font]
[font=宋体]    ws = wb.active[/font]
 
[font=宋体]    ws['A1'] = "电影名称"[/font]
[font=宋体]    ws['B1'] = "评分"[/font]
[font=宋体]    ws['C1'] = "资料"[/font]
 
[font=宋体]    for each in result:[/font]
[font=宋体]        ws.append(each)[/font]
 
[font=宋体]    wb.save("豆瓣TOP250电影.xlsx")[/font]
 
[font=宋体]def main():[/font]
[font=宋体]    host = "https://movie.douban.com/top250"[/font]
[font=宋体]    res = open_url(host)[/font]
[font=宋体]    depth = find_depth(res)[/font]
 
[font=宋体]    result = [][/font]
[font=宋体]    for i in range(depth):[/font]
[font=宋体]        url = host + '/?start=' + str(25 * i)[/font]
[font=宋体]        res = open_url(url)[/font]
[font=宋体]        result.extend(find_movies(res))[/font]
 
[font=宋体]    '''[/font]
[font=宋体]    with open("test.txt", "w", encoding="utf-8") as f:[/font]
[font=宋体]        for each in result:[/font]
[font=宋体]            f.write(each)[/font]
[font=宋体]    '''[/font]
 
[font=宋体]    save_to_excel(result)[/font]
[font=宋体]     [/font]
[font=宋体]if __name__ == "__main__":[/font]
[font=宋体]    main()

程序实现如下：

1111.png (255.36 KB, 下载次数: 2)

下载附件保存到相册

2018-1-30 00:30 上传

如果现在要你从这 250 部电影中按评分进行排序，应该如何做呢？

附件：嗨学网

中央纪委python1.rar (40.35 KB, 下载次数: 45) 2018-1-30 00:31 上传点击文件名下载附件
下载积分: 吾爱币 -1 CB 多多评分，刷起你们手中鲜花

版权声明：

本站所有资源均为站长或网友整理自互联网或站长购买自互联网，站长无法分辨资源版权出自何处，所以不承担任何版权以及其他问题带来的法律责任，如有侵权或者其他问题请联系站长删除！站长QQ754403226 谢谢。

有关影视版权：本站只供百度云网盘资源，版权均属于影片公司所有，请在下载后24小时删除，切勿用于商业用途。本站所有资源信息均从互联网搜索而来，本站不对显示的内容承担责任，如您认为本站页面信息侵犯了您的权益，请附上版权证明邮件告知【754403226@qq.com】，在收到邮件后72小时内删除。本文链接：https://www.piaodoo.com/7395.html