当前位置：移动技术网 > IT编程>网页制作>CSS > 怎么将数据存储成csv格式的文件？

怎么将数据存储成csv格式的文件？

2018年09月27日 | 移动技术网IT编程 | 我要评论

读写csv数据

问题

你想读写一个csv格式的文件。

解决方案

对于大多数的csv格式的数据读写问题，都可以使用?csv?库。例如：假设你在一个名叫stocks.csv文件中有一些股票市场数据，就像这样：

symbol,price,date,time,change,volume
"aa",39.48,"6/11/2007","9:36am",-0.18,181800
"aig",71.38,"6/11/2007","9:36am",-0.15,195500
"axp",62.58,"6/11/2007","9:36am",-0.46,935000
"ba",98.31,"6/11/2007","9:36am",+0.12,104800
"c",53.08,"6/11/2007","9:36am",-0.25,360900
"cat",78.29,"6/11/2007","9:36am",-0.23,225400

下面向你展示如何将这些数据读取为一个元组的序列：

import csv
with open('stocks.csv') as f:
    f_csv = csv.reader(f)
    headers = next(f_csv)
    for row in f_csv:
        # process row
        ...

在上面的代码中，?row?会是一个列表。因此，为了访问某个字段，你需要使用下标，如?row[0]?访问symbol，?row[4]?访问change。

由于这种下标访问通常会引起混淆，你可以考虑使用命名元组。例如：

from collections import namedtuple
with open('stock.csv') as f:
    f_csv = csv.reader(f)
    headings = next(f_csv)
    row = namedtuple('row', headings)
    for r in f_csv:
        row = row(*r)
        # process row
        ...

它允许你使用列名如?row.symbol?和?row.change?代替下标访问。需要注意的是这个只有在列名是合法的python标识符的时候才生效。如果不是的话，你可能需要修改下原始的列名(如将非标识符字符替换成下划线之类的)。

另外一个选择就是将数据读取到一个字典序列中去。可以这样做：

import csv
with open('stocks.csv') as f:
    f_csv = csv.dictreader(f)
    for row in f_csv:
        # process row
        ...

在这个版本中，你可以使用列名去访问每一行的数据了。比如，row['symbol']?或者?row['change']

为了写入csv数据，你仍然可以使用csv模块，不过这时候先创建一个?writer?对象。例如:

headers = ['symbol','price','date','time','change','volume']
rows = [('aa', 39.48, '6/11/2007', '9:36am', -0.18, 181800),
         ('aig', 71.38, '6/11/2007', '9:36am', -0.15, 195500),
         ('axp', 62.58, '6/11/2007', '9:36am', -0.46, 935000),
       ]

with open('stocks.csv','w') as f:
    f_csv = csv.writer(f)
    f_csv.writerow(headers)
    f_csv.writerows(rows)

如果你有一个字典序列的数据，可以像这样做：

headers = ['symbol', 'price', 'date', 'time', 'change', 'volume']
rows = [{'symbol':'aa', 'price':39.48, 'date':'6/11/2007',
        'time':'9:36am', 'change':-0.18, 'volume':181800},
        {'symbol':'aig', 'price': 71.38, 'date':'6/11/2007',
        'time':'9:36am', 'change':-0.15, 'volume': 195500},
        {'symbol':'axp', 'price': 62.58, 'date':'6/11/2007',
        'time':'9:36am', 'change':-0.46, 'volume': 935000},
        ]

with open('stocks.csv','w') as f:
    f_csv = csv.dictwriter(f, headers)
    f_csv.writeheader()
    f_csv.writerows(rows)

讨论

你应该总是优先选择csv模块分割或解析csv数据。例如，你可能会像编写类似下面这样的代码：

with open('stocks.csv') as f:
for line in f:
    row = line.split(',')
    # process row
    ...

使用这种方式的一个缺点就是你仍然需要去处理一些棘手的细节问题。比如，如果某些字段值被引号包围，你不得不去除这些引号。另外，如果一个被引号包围的字段碰巧含有一个逗号，那么程序就会因为产生一个错误大小的行而出错。

默认情况下，csv?库可识别microsoft excel所使用的csv编码规则。这或许也是最常见的形式，并且也会给你带来最好的兼容性。然而，如果你查看csv的文档，就会发现有很多种方法将它应用到其他编码格式上(如修改分割字符等)。例如，如果你想读取以tab分割的数据，可以这样做：

# example of reading tab-separated values
with open('stock.tsv') as f:
    f_tsv = csv.reader(f, delimiter='\t')
    for row in f_tsv:
        # process row
        ...

如果你正在读取csv数据并将它们转换为命名元组，需要注意对列名进行合法性认证。例如，一个csv格式文件有一个包含非法标识符的列头行，类似下面这样：

street?address,num-premises,latitude,longitude 5412?n?clark,10,41.980262,-87.668452

这样最终会导致在创建一个命名元组时产生一个?valueerror?异常而失败。为了解决这问题，你可能不得不先去修正列标题。例如，可以像下面这样在非法标识符上使用一个正则表达式替换：

import re
with open('stock.csv') as f:
    f_csv = csv.reader(f)
    headers = [ re.sub('[^a-za-z_]', '_', h) for h in next(f_csv) ]
    row = namedtuple('row', headers)
    for r in f_csv:
        row = row(*r)
        # process row
        ...

还有重要的一点需要强调的是，csv产生的数据都是字符串类型的，它不会做任何其他类型的转换。如果你需要做这样的类型转换，你必须自己手动去实现。下面是一个在csv数据上执行其他类型转换的例子：

col_types = [str, float, str, str, float, int]
with open('stocks.csv') as f:
    f_csv = csv.reader(f)
    headers = next(f_csv)
    for row in f_csv:
        # apply conversions to the row items
        row = tuple(convert(value) for convert, value in zip(col_types, row))
        ...

另外，下面是一个转换字典中特定字段的例子：

print('reading as dicts with type conversion')
field_types = [ ('price', float),
                ('change', float),
                ('volume', int) ]

with open('stocks.csv') as f:
    for row in csv.dictreader(f):
        row.update((key, conversion(row[key]))
                for key, conversion in field_types)
        print(row)

通常来讲，你可能并不想过多去考虑这些转换问题。在实际情况中，csv文件都或多或少有些缺失的数据，被破坏的数据以及其它一些让转换失败的问题。因此，除非你的数据确实有保障是准确无误的，否则你必须考虑这些问题(你可能需要增加合适的错误处理机制)。

最后，如果你读取csv数据的目的是做数据分析和统计的话，你可能需要看一看?pandas包。pandas?包含了一个非常方便的函数叫?pandas.read_csv()?，它可以加载csv数据到一个?dataframe?对象中去。然后利用这个对象你就可以生成各种形式的统计、过滤数据以及执行其他高级操作了。在6.13小节中会有这样一个例子。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

【css】利用line-height实现垂直居中

替换元素与非替换元素<body> <div>hello</div> &l... [阅读全文]
通过鼠标使图片交替显示

伪类 after、before、hovercss代码使用的是预编译less，简单分享：就是固定框200*200，... [阅读全文]
荐微信小程序动态评分展示/五角星展示/半颗星展示/自定义长度展示

一、前言项目中遇到的评分相关的需求其实还挺多。之前也写过网页中关于评分功能实现的文档。这次，是基于微信小程序开发... [阅读全文]
【剑指 Offer 31】栈的压入、弹出序列

题目题目链接输入两个整数序列，第一个序列表示栈的压入顺序，请判断第二个序列是否为该栈的弹出顺序。假设压入栈的所有... [阅读全文]
前端学习笔记（3）之css文本属性合集

文本模块缩进text-intent间距 xxx-spacing控制文本大小写 text-transform文本... [阅读全文]
CSS 控制动画播放与暂停的小技巧(非常实用)

今天要介绍一种很简单的使用 css 控制动画播放与暂停的小技巧。使用好了，可以在很多实际场景得以运用。我们先来看个例子，本例子是我在闲逛 codepen 时看... [阅读全文]
css3 flex布局实现平均分配元素的示例代码

本文主要介绍了css3 flex布局实现平均分配元素，给自己留个笔记，也分享给大家，具体如下：例子一：<!doctype html><html... [阅读全文]
CSS字体、文本、列表属性详细介绍

1.字体属性　　color，规定文本的颜色，如 div{color:red;}　　font-style，规定文本显示方式，如 p.normal {font-st... [阅读全文]
深入理解CSS background-blend-mode的作用机制

本文欢迎分享与聚合，全文转载就不必了，尊重版权，圈子就这么大，若急用可以联系授权。一、可能都知道的首先，讲两点大家可能都知道的知识点：1.background-... [阅读全文]
CSS中的四种定位区别详解

我们都知道，前端开发里面的css中常用的定位方式有普通定位，相对定位，绝对定位、固定定位定位这四种。但是很多零基础的前端小白都不知道这4种定位方式都有什么作用和... [阅读全文]