史上最全文件类型读写库大盘点,什么,还包括音频/视频

本文系列第四篇，介绍史上最全PYTHON文件类型读写库大盘点！包含常用和不常用的大量文件格式！文本、音频、视频应有尽有！废话不多说！走起来！

文件格式	Python库
文本文件	内置open函数
CSV文件	csv
JSON文件	json
XML文件	xml.etree.ElementTree
二进制文件	内置open函数
图片文件	PIL (Python Imaging Library
Word文件	python-docx
XLSX文件	openpyxl
PDF文件	PyPDF2
SQLite数据库文件	sqlite3
音频文件	pydub
视频文件	moviepy
HTML文件	BeautifulSoup
YAML文件	pyyaml
ZIP文件	zipfile

1. 文本文件

在Python中，处理文本文件是最基础的文件操作，我们使用内置的open函数打开一个文件，然后使用文件对象的read或write方法进行读写操作。

# 写入文本文件 with open('example.txt', 'w' as f: f.write('Hello, Python!' # 读取文本文件 with open('example.txt', 'r' as f: print(f.read(

2. CSV文件

import csv # 写入CSV文件 with open('example.csv', 'w', newline='' as f: writer = csv.writer(f writer.writerow(['name', 'age'] writer.writerow(['Alice', 20] writer.writerow(['Bob', 25] # 读取CSV文件 with open('example.csv', 'r' as f: reader = csv.reader(f for row in reader: print(row

这里，csv.writer和csv.reader函数分别返回一个写入器和读取器对象，我们可以使用这些对象进行CSV文件的读写操作。

3. JSON文件

import json

# 写入JSON文件
data = {
    'name': 'Alice',
    'age': 20,
}
with open('example.json', 'w' as f:
    json.dump(data, f

# 读取JSON文件
with open('example.json', 'r' as f:
    data = json.load(f
    print(data

4. XML文件

from xml.etree import ElementTree as ET

# 写入XML文件
root = ET.Element('root'
child = ET.Element('child'
child.text = 'Hello, Python!'
root.append(child
tree = ET.ElementTree(root
tree.write('example.xml'

# 读取XML文件
tree = ET.parse('example.xml'
root = tree.getroot(
for child in root:
    print(child.text

5.二进制文件

# 写入二进制文件
data = b'Hello, Python!'
with open('example.bin', 'wb' as f:
    f.write(data

# 读取二进制文件
with open('example.bin', 'rb' as f:
    data = f.read(
    print(data

6. 图片文件

from PIL import Image

# 读取图片文件
img = Image.open('example.jpg'

# 修改图片
img = img.rotate(45  # 旋转45度

# 写入图片文件
img.save('example_rotated.jpg'

这里，Image.open和Image.save函数分别用于读取和保存图片文件。PIL库提供了丰富的图像处理功能，例如旋转、裁剪、缩放等。

7. Word文件

from docx import Document

# 创建新的Word文件
doc = Document(
doc.add_paragraph('Hello, Python!'
doc.save('example.docx'

# 读取Word文件
doc = Document('example.docx'
for para in doc.paragraphs:
    print(para.text

在这里，我们首先创建一个Document对象，然后使用add_paragraph方法添加段落，最后使用save方法保存文档。读取Word文件时，我们遍历Document对象的paragraphs属性，打印出每个段落的文本。

8. XLSX文件

from openpyxl import Workbook, load_workbook

# 创建新的Excel文件
wb = Workbook(
ws = wb.active
ws['A1'] = 'Hello,'
ws['B1'] = 'Python!'
wb.save('example.xlsx'

# 读取Excel文件
wb = load_workbook('example.xlsx'
ws = wb.active
print(ws['A1'].value, ws['B1'].value

在这里，我们首先创建一个Workbook对象和Worksheet对象，然后使用字典方式访问单元格并赋值，最后使用save方法保存工作簿。读取Excel文件时，我们使用load_workbook函数加载工作簿，然后访问激活的工作表的单元格。

9. PDF文件

import PyPDF2

# 读取PDF文件
with open('example.pdf', 'rb' as f:
    reader = PyPDF2.PdfFileReader(f
    page = reader.getPage(0
    print(page.extractText(

# 注意：PyPDF2不能直接创建PDF文件，但可以合并、裁剪和旋转PDF文件

在这里，我们使用PdfFileReader对象读取PDF文件，然后使用getPage方法获取某一页，最后使用extractText方法提取文本。注意PyPDF2不能直接创建PDF文件，但可以合并、裁剪和旋转PDF文件。

10. SQLite数据库文件

import sqlite3

# 创建并写入SQLite数据库
conn = sqlite3.connect('example.db'
c = conn.cursor(
c.execute("CREATE TABLE test (name text, age integer"
c.execute("INSERT INTO test VALUES ('Alice', 20"
conn.commit(
conn.close(

# 读取SQLite数据库
conn = sqlite3.connect('example.db'
c = conn.cursor(
for row in c.execute("SELECT * FROM test":
    print(row
conn.close(

在这里，我们首先创建一个数据库连接和游标对象，然后使用execute方法执行SQL语句，最后使用commit方法提交事务。读取SQLite数据库时，我们遍历execute方法的结果，打印出每一行。

11. 音频文件

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file('example.mp3'

# 修改音频
audio = audio.reverse(  # 反转音频

# 保存音频文件
audio.export('example_reversed.mp3', format='mp3'

在这里，AudioSegment.from_file函数用于读取音频文件。pydub库提供了丰富的音频处理功能，例如反转、裁剪、合并等。最后使用export方法保存音频文件。

12. 视频文件

from moviepy.editor import VideoFileClip

# 读取视频文件
clip = VideoFileClip('example.mp4'

# 修改视频
clip = clip.subclip(10, 20  # 截取第10秒到第20秒的片段

# 保存视频文件
clip.write_videofile('example_subclip.mp4'

在这里，VideoFileClip函数用于读取视频文件。moviepy库提供了丰富的视频处理功能，例如裁剪、拼接、添加音频等。最后使用write_videofile方法保存视频文件。

13. HTML文件

from bs4 import BeautifulSoup

# 读取HTML文件
with open('example.html', 'r' as f:
    soup = BeautifulSoup(f, 'html.parser'

# 解析HTML
print(soup.title.text  # 打印标题

# 注意：BeautifulSoup不能直接创建HTML文件，但可以修改HTML文件

在这里，我们使用BeautifulSoup对象解析HTML文件，然后通过标签名访问HTML元素。

14. YAML文件

import yaml

# 写入YAML文件
data = {'name': 'Alice', 'age': 20}
with open('example.yaml', 'w' as f:
    yaml.dump(data, f

# 读取YAML文件
with open('example.yaml', 'r' as f:
    data = yaml.load(f, Loader=yaml.FullLoader
    print(data

在这里，yaml.dump和yaml.load函数分别用于将Python对象转换为YAML格式并写入文件，以及从文件中读取YAML数据并转换为Python对象。

15. ZIP文件

from zipfile import ZipFile

# 创建ZIP文件
with ZipFile('example.zip', 'w' as zf:
    zf.write('example.txt'

# 读取ZIP文件
with ZipFile('example.zip', 'r' as zf:
    print(zf.namelist(

在处理文件时，一个常被忽视但又极其有用的技巧是使用Python的pathlib模块来处理文件路径。pathlib模块提供了一种面向对象的方式来处理文件和目录路径，使得路径的处理变得更加直观和简洁。

from pathlib import Path # 创建Path对象 p = Path('example.txt' # 检查文件是否存在 if p.exists(: print('File exists.' # 获取文件的后缀名 print(p.suffix

在这个例子中，我们使用Path对象表示一个文件路径，然后使用Path对象的方法和属性来进行各种操作，例如检查文件是否存在，获取文件的后缀名等。这是一个非常强大且易用的模块，可以极大地提高我们处理文件路径的效率。

以上就是Python全文件格式输入输出的介绍。希望通过本文，你能够对Python的文件操作有更深入的理解，并能够在实际编程中灵活运用。如果你有任何问题或想法，欢迎在评论区留言分享。

编程笔记 » 史上最全文件类型读写库大盘点,什么,还包括音频/视频

史上最全文件类型读写库大盘点,什么,还包括音频/视频

1. 文本文件

相关文章

Hi，您需要填写昵称和邮箱！