08.文件操作

在开发系统的过程中,经常会用到XML存储和传输数据,XML是一种用于标记电子文件使其具有结构性的标记语言,在博客中经常会见到。
JSON是一种轻量级的数据交换格式,常被用在后端和前端的数据交互上,如你用Python提供后端WebService数据接口,App在调用这个接口时,收到的数据就是JSON文件。
txt是最常见的一种文件格式 ,主要存文本信息,即为文字信息,现在的操作系统大多使用记事本等程序保存,大多数软件可以查看,如记事本,浏览器等。

8.1 XML文件

XML指可扩展标记语言(eXtensible Markup Language)。由成对标签如或闭环标签组成,最外部标签称为根节点。在根节点里面,可以包含很多子节点,子节点有自己的属性和文本。如下样例:book为根节点,name有自己的属性name,author的文本值为老陈,price为闭环标签。

<book>
<name name="书名">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元" />
</book>

在自带的标准库中,Python提供了大量可以用于处理XML语言的包和工具,经我和同事测试、比较,发现ElementTree模块是最好用的,所有我推荐你也用它来处理XML文件。
1.创建XML
XML文件,从创建节点(book)开始,之后创建里面的子节点,并对子节点进行属性和内容添加。

import xml.etree.ElementTree as ET

# 创建根节点
book = ET.Element("book")
# 创建子节点,并添加属性和数据
title = ET.SubElement(book, "name")
title.attrib = {"name": "书名"}
title.text = "12天搞定Python"
# 创建子节点,并添加数据
author = ET.SubElement(book, "author")
author.text = "老陈"
price = ET.SubElement(book, "price")
# 创建子节点,并添加数据
price.attrib = {"price": "0.00元"}
# 创建tree对象,写文件
tree = ET.ElementTree(book)
tree.write("book.xml", encoding="UTF-8")

输出结果(book.xml文件)

<book>
<name name="书名">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元" />
</book>

2.修改XML
修改book.xml文件,新增创建日期,修改name的属性名为arr,价格调整为0.01元。

import xml.etree.ElementTree as ET


tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
# 创建新节点并添加为root的子节点
createDate = ET.Element("createDate")
createDate.attrib = {"name": "创建日期"}
createDate.text = "2020-10-01"
book.append(createDate)
# 修改书名的属性
name = book.find("name")
name.attrib = {"name": "arr"}
# 修改价格
price = book.find("price")
price.text = "0.01元"
# 写回原文件
tree.write("book.xml", encoding="UTF-8")

输出结果(book.xml文件)

<book>
<name name="arr">12天搞定Python</name>
<author>老陈</author>
<price price="0.00元">0.01元</price>
<createDate name="创建日期">2020-10-01</createDate>
</book>

3.删除XML节点
删节点,先找到,再用remove()方法进行删除。

import xml.etree.ElementTree as ET

tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
for price in book.findall('price'):
book.remove(price)

tree.write('book.xml', encoding="UTF-8")

输出结果(book.xml文件)

<book>
<name name="arr">12天搞定Python</name>
<author>老陈</author>
<createDate name="创建日期">2020-10-01</createDate>
</book>

4.读取XML
循环读取节点内容,输出不为None的节点。

import xml.etree.ElementTree as ET

tree = ET.parse("book.xml") # 读取待修改文件
book = tree.getroot()
for node in book.iter():
if node.text is not None:
print(node.tag, ":", node.text)

8.2 JSON文件

JSON文件数据由一系列键值对组成并用逗号隔开和我们学过的字典可进行化互相转换。Python 中可以使用json模块对JSON 数据进行编解码。
1.创建JSON文件
json.dumps()对字符串数据进行编码, json.dump()对文件数据进行编码。

import json

# 字典转换为JSON对象
book = {
'name': "12天搞定Python",
'author': '老陈',
'price': 0.00
}

# 生成json格式
json_str = json.dumps(book, ensure_ascii=False)
# 写入 JSON 数据
with open('book.json', 'w') as f:
json.dump(json_str, f)

输出结果(book.json文件内容)

"{"name": "12天搞定Python", "author": "老陈", "price": 0.0}"

2.读取JSON文件
json.loads()对字符串数据进行解码, json.load() 对JSON文件进行解码。

import json

# 将JSON对象转换为字典
json_str = '{"name": "12天搞定Python", "author": "老陈", "price": 0.0}'
dic = json.loads(json_str)
print("dic['name']: ", dic['name'])

# 读取数据
f = open('book.json', encoding="UTF-8")
data = ""
for line in f:
data += line
print(data)

输出结果(book.json文件内容)

dic['name']:  12天搞定Python
"{"name": "12天搞定Python", "author": "老陈", "price": 0.0}"

8.3 txt文件

对文本文件的操作,跟对XML和JSON操作,其实并没有多大的区别,只是内容格式不同而已。操作文件,最简单的方式,就是用open(file, mode=’r’)类,其中mode参数也可以省略,默认值就是r,即read的意思,详细内容如下
| 模式 |描述|
| —- | —- |
|r|以读方式打开文件,可读取文件信息|
|w|以写方式打开文件,可向文件中写入信息,如果文件存在,则清空该文件,再写入新内容|
|a|以追加方式打开文件,如果文件不存在则创建|
|r+|以读写方式打开文件,可对文件进行读写操作|
|w+|清除文件内容,然后以读写方式打开|
|a+|以读写方式打开文件,并把文件指针移到文件尾|
|b|以二进制模式打开文件,该模式只对windows和dos有效|
1.创建book.txt
创建并写文件时,记得mode参数指定为w(默认是r),如果内容中有中文,指定encoding=”UTF-8”。写入数据方法为write。

# 创建文件并写入数据
f = open("boy.txt", "w", encoding="UTF-8")
f.write("Good boy!\n")
f.write("你真帅!\n")
f.write("那是不可能的?\n")
f.write("可能呀!")
f.close()

输出结果(boy.txt文件内容)

Good boy!
你真帅!
那是不可能的?
可能呀!

在写入数据时,如果总是一行一行的写,那也太费事的。不懂偷懒的程序员,不是好工匠,好的工匠会想更优的办法。将多行内容组成列表,并用writelines方法写入。

ls = ["Good boy!\n", "你真帅?\n", "是的,你看我做事效率就知道了。"]
# 创建文件并写入数据
f = open("boy.txt", "w", encoding="UTF-8")
f.writelines(ls)
f.close()

输出结果(boy.txt文件内容)

Good boy!
你真帅?
是的,你看我做事效率就知道了。

2.文件读取
可写便可读,可逐行写,就可逐行读,可用列表的方式写入,就可读出列表(即读出多行并转成列表)。

# 逐行读取,包括换行
f = open("boy.txt", "r+", encoding="UTF-8")
print(f.readline())
print(f.readline())
print(f.readline())
f.close()
# 多行读取,并转成列表
m = open("boy.txt", "r+", encoding="UTF-8")
print(m.readlines())
m.close()

输出结果

Good boy!

你真帅?

是的,你看我做事效率就知道了。
['Good boy!\n', '你真帅?\n', '是的,你看我做事效率就知道了。']

3.修改文件
如果想对文件中的某部分内容进行修改的话,可先读取,修改之后再写入就好了。

f = open("boy.txt", "r+")
r = f.read()
line = r.replace("你真帅?\n", "一点也不帅?\n")
f.close()
f2 = open("boy.txt", "w")
f2.write(line)
f2.close()

输出结果(boy.txt文件内容)

Good boy!
一点也不帅?
是的,你看我做事效率就知道了。
上一篇

09.数据库操作