首页 > 文章列表 > Python读取CSV数据的实用技巧分享

Python读取CSV数据的实用技巧分享

Python csv
300 2024-04-23

Python 中读取 CSV 数据的方法分两种:内置 csv 模块,适用于小型 CSV 文件,按行迭代数据;Pandas 库,提供 read_csv() 函数,可轻松将 CSV 数据加载到 DataFrame 中进行处理。

Python读取CSV数据的实用技巧分享

Python 读取 CSV 数据的实用技巧分享

在数据科学和机器学习中,我们经常需要从 CSV(逗号分隔值)文件中读取数据。Python 提供了几个用于此目的的内置函数和库。本教程将探讨 Python 读取 CSV 数据的不同方法,并提供实战案例。

内置函数

对于小型 CSV 文件,我们可以使用内置的 csv 模块。它提供了一个 [reader()](https://docs.python.org/3/library/csv.html#csv.reader) 函数,用于按行迭代 CSV 数据。

import csv

with open('data.csv', 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        # 处理每一行数据

Pandas 库

Pandas 是用于数据分析和操作的流行库。它提供了一个 [read_csv()](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html) 函数,可以轻松地将 CSV 数据加载到 DataFrame 中。DataFrame 是一种类似于表格的数据结构,易于处理和操作。

import pandas as pd

df = pd.read_csv('data.csv')
# 访问 DataFrame 中的数据

实战案例

考虑一个名为 data.csv 的 CSV 文件,其中包含以下数据:

name,age
John,25
Jane,30

使用内置函数读取数据:

import csv

with open('data.csv', 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

输出:

['name', 'age']
['John', '25']
['Jane', '30']

使用 Pandas 库读取数据:

import pandas as pd

df = pd.read_csv('data.csv')
print(df)

输出:

   name  age
0  John   25
1  Jane   30

结语

通过使用内置功能或 Pandas 库,我们可以轻松地从 CSV 文件中读取数据。这些技术在处理小型和大型 CSV 文件时都非常有用。选择方法取决于特定数据集的大小和复杂性。