当前位置：移动技术网 > IT编程>脚本编程>Python > Python入门篇之文件

Python入门篇之文件

2019年06月14日 | 移动技术网IT编程 | 我要评论

猝不及防造句,流行歌曲,长春一周天气预报

文件处理的函数和方法

使用open()函数可打开文件，语法格式如下：

复制代码代码如下:

file_handler = open(filename,[,mode[,bufsize]]

filename是你要操作的文件名，如果不在当前路径，需指出具体路径。mode是打开文件的模式，表示你要如何操作文件，bufsize表示是否使用缓存。

mode

模式	描述
r	以读方式打开文件，可读取文件信息。
w	以写方式打开文件，可向文件写入信息。
a	以追加方式打开文件，文件指针自动移到文件尾。
r+	以读写方式打开文件，可对文件进行读和写操作。
w+	消除文件内容，然后以读写方式打开文件。
a+	以读写方式打开文件，并把文件指针移到文件尾。
b	以二进制模式打开文件，而不是以文本模式。该模式只对windows或dos有效，类unix的文件是用二进制模式进行操作的。

bufsize

bufsize取值	描述
0	禁用缓冲
1	行缓冲
>1	指定缓冲区的大小
<1	系统默认的缓冲区大小

open()函数返回一个文件对象，我们可通过read()或write()函数对文件进行读写操作，下面是一些文件对象方法：

文件对象方法

方法	描述
f.close()	关闭文件，记住用open()打开文件后一定要记得关闭它，否则会占用系统的可打开文件句柄数。
f.fileno()	获得文件描述符
f.flush()	刷新输出缓存
f.isatty()	如果文件是一个交互终端，则返回true，否则返回false。
f.read([count])	读出文件，如果有count，则读出count个字节。
f.readline()	读出一行信息。
f.readlines()	读出所有行，也就是读出整个文件的信息。
f.seek(offset[,where])	把文件指针移动到相对于where的offset位置。offset为0表示文件开始处，这是默认值；1表示当前位置；2表示文件结尾。
f.tell()	获得文件指针位置。
f.truncate([size])	截取文件，使文件的大小为size。
f.write(string)	把string字符串写入文件。
f.writelines(list)	把list中的字符串一行一行地写入文件。

示例

1.文件的打开或创建

复制代码代码如下:

#!/usr/bin/env python
#-*- encoding:utf-8 -*-

filehandler = open('test.txt','w') #以写模式打开文件，如果文件不存在则创建
filehandler.write('this is a file open/create test.\nthe second line.')

filehandler.close()
#!/usr/bin/env python
#-*- encoding:utf-8 -*-

filehandler = open('test.txt','a') #以追加模式打开文件，如果文件不存在则创建

filehandler.write('\nappend the text in another line.\n')

filehandler.close()

2.读取文件

复制代码代码如下:

#!/usr/bin/env python
#-*- encoding:utf-8 -*-

filehandler = open('test.txt','r')    #以读方式打开文件，rb为二进制方式(如图片或可执行文件等)

print 'read() function:'              #读取整个文件
print filehandler.read()

print 'readline() function:'          #返回文件头，读取一行
filehandler.seek(0)
print filehandler.readline()

print 'readlines() function:'         #返回文件头，返回所有行的列表
filehandler.seek(0)
print filehandler.readlines()

print 'list all lines'                #返回文件头，显示所有行
filehandler.seek(0)
textlist = filehandler.readlines()
for line in textlist:
      print line

print 'seek() function' #移位到第32个字符，从33个字符开始显示余下内容
filehandler.seek(32)
print filehandler.read()

print 'tell() function'               #移位到文件头，从头开始显示2位字符
filehandler.seek(0)
print filehandler.readline()          #显示第一行内容
print filehandler.tell()              #显示当前位置
print filehandler.readline()          #显示第二行内容
print filehandler.read()              #显示余下所有内容

filehandler.close() #关闭文件句柄

3.文件系统操作

复制代码代码如下:

#!/usr/bin/env python
#-*- encoding:utf-8 -*-

import os,fnmatch,glob

for filename in os.listdir ( '/root' ): #列出/root目录内容，不包括.和..
print filename

os.mkdir('py')                  #在当前目录下创建一个py目录，且只能创建一层
os.rmdir( 'py')                 #在当前目录下删除py目录，且只能删除一层
os.makedirs('py/aa')            #可创建多层目录
os.removedirs('py/aa')          #可删除多层目录

print 'demonstration fnmatch module'
for filename in os.listdir ( '/root/python/file' ):
        if fnmatch.fnmatch(filename,'*.txt'):        #利用unix风格的通配，只显示后缀为txt的文件
                print filename

print 'demonstration glob module'
for filename in glob.glob ( '*.txt' ): #利用unix风格的通配，只显示后缀为txt的文件
print filename

4.获取文件状态

复制代码代码如下:

#!/usr/bin/env python
#-*- encoding:utf-8 -*-

import os,time,stat

filestats = os.stat ( 'test.txt' )                         #获取文件/目录的状态
fileinfo = {
'size':filestats [ stat.st_size ],                         #获取文件大小
'lastmodified':time.ctime( filestats [ stat.st_mtime ] ), #获取文件最后修改时间
'lastaccessed':time.ctime( filestats [ stat.st_atime ] ), #获取文件最后访问时间
'creationtime':time.ctime( filestats [ stat.st_ctime ] ), #获取文件创建时间
'mode':filestats [ stat.st_mode ]                          #获取文件的模式
}
#print fileinfo

for field in fileinfo: #显示对象内容
print '%s:%s' % (field,fileinfo[field])

#for infofield,infovalue in fileinfo:
#       print '%s:%s' % (infofield,infovalue)
if stat.s_isdir ( filestats [ stat.st_mode ] ):             #判断是否路径
        print 'directory. '
else:
        print 'non-directory.'

if stat.s_isreg ( filestats [ stat.st_mode ] ):             #判断是否一般文件
   print 'regular file.'
elif stat.s_islnk ( filestats [ stat.st_mode ] ):           #判断是否链接文件
   print 'shortcut.'
elif stat.s_issock ( filestats [ stat.st_mode ] ):          #判断是否套接字文件
   print 'socket.'
elif stat.s_isfifo ( filestats [ stat.st_mode ] ):          #判断是否命名管道
   print 'named pipe.'
elif stat.s_isblk ( filestats [ stat.st_mode ] ):           #判断是否块设备
   print 'block special device.'
elif stat.s_ischr ( filestats [ stat.st_mode ] ):           #判断是否字符设置
   print 'character special device.'
#!/usr/bin/env python
#-*- encoding:utf-8 -*-

import os.path

filestats = 'test.txt'

if os.path.isdir ( filestats ):         #判断是否路径
        print 'directory.'
elif os.path.isfile ( filestats ):      #判断是否一般文件
        print 'file.'
elif os.path.islink ( filestats ):      #判断是否链接文件
        print 'shortcut.'
elif os.path.ismount ( filestats ):     #判断是否挂接点
        print 'mount point.'

stat模块描述了os.stat(filename)返回的文件属性列表中各值的意义。我们可方便地根据stat模块存取os.stat()中的值。

5.串行化文件

复制代码代码如下:

#!/usr/bin/env python
#-*- encoding:utf-8 -*-

import pickle

filehandler = open('pickle.txt','w')

text = ['this is a pickle demonstrate','aa','bb']

pickle.dump(text,filehandler) #把text的内容序列化后保存到pickle.txt文件中

filehandler.close()

filehandler2 = open('pickle.txt')

textlist = pickle.load(filehandler2) #还原序列化字符串
print textlist

filehandler2.close()

#cpickle是用c写的pickle模块，比标准的pickle速度快很多，使用方法同pickle。

6.内存文件

复制代码代码如下:

#!/usr/bin/env python
#-*- coding: utf-8 -*-

import stringio

filehandle = stringio.stringio ( "let freedom ring." ) #create file in memory

print filehandle.read() # "let freedom ring."

filehandle.close()

#cstringio是用c写的stringio模块，执行速度比stringio快。

shutil模块是一个高级的文件处理模块，可实现文件的拷贝、删除等操作。

打开文件
打开文件程序会调用内置的open函数，首先是外部名，接着就是处理模式。

常见的文件运算：

在任何情况下，python程序中的文本文件采用字符串的形式，读取文本时会返回字符串形式的文本

从文件中读取的数据回到脚本时是一个字符串，所以如果字符串不是你所需的，就得将其转换成其他类型的python对象

实际应用中的文件
首先看一个文件处理的一个简单的例子：

复制代码代码如下:

>>> myfile=open('myfile','w')

>>> myfile.write('hello,myfile!\n')

>>> myfile.close()

>>> myfile=open('myfile')

>>> myfile.readline()

'hello,myfile!\n'

>>> myfile.readline()

''

把一行文本写成字符串，包含行终止符\n，写入方法不会为我们添加行终止符

在文件中存储并解析python对象
必须使用转换工具把对象转换成字符串，注意文件数据在脚本中一定是字符串，而写入方法不会自动地替我们做任何向字符串格式转换的工作

复制代码代码如下:

>>> x,y,z=43,324,34

>>> s='spam'

>>> d={'a':1,'b':2}

>>> l=[1,2,3]

>>> f=open('datafile.txt','w')

>>> f.write(s+'\n')

>>> f.write('%s,%s,%s\n'%(x,y,z))

>>> f.write(str(l)+'$'+str(d)+'\n')

>>> f.close()

一旦我们创建了文件爱你就可以通过打开和读取字符串来查看文件的内容，而print语句则会解释内嵌行终止符来给用户满意的结果：

复制代码代码如下:

>>> bytes=open('datafile.txt').read()

>>> bytes

"spam\n43,324,34\n[1, 2, 3]${'a': 1, 'b': 2}\n"

>>> print bytes

spam

43,324,34

[1, 2, 3]${'a': 1, 'b': 2}

鉴于python不会自动把字符串转换为数字或其他类型的对象，需要使用诸如索引、加法等普通对象工具

复制代码代码如下:

>>> f=open('datafile.txt')

>>> line=f.readline()

>>> line

'spam\n'

>>> line=f.readline()

>>> line

'43,324,34\n'

>>> parts=line.split(',')

>>> parts

['43', '324', '34\n']

>>> int(parts[1])

324

>>> numbers=[int(p) for p in parts]

>>> numbers

[43, 324, 34]

>>> line=f.readline()

>>> line

"[1, 2, 3]${'a': 1, 'b': 2}\n"

>>> parts=line.split('$')

>>> parts

['[1, 2, 3]', "{'a': 1, 'b': 2}\n"]

>>> eval(parts[0])

[1, 2, 3]

>>> objects=[eval(p) for p in parts]

>>> objects

[[1, 2, 3], {'a': 1, 'b': 2}]

用pickle存储python的原生对象
使用eval可以把字符串转换成对象，pickle模块是能够让我们直接在文件中存储几乎任何python对象的高级工具，并不要求把字符串转换来转换去

复制代码代码如下:

>>> f=open('datafile.txt','w')

>>> import pickle

>>> pickle.dump(d,f)

>>> f.close()

>>> f=open('datafile.txt')

>>> e=pickle.load(f)

>>> e

{'a': 1, 'b': 2}

pickle模块执行所谓的对象序列化，也就是对象和字节字符串之间的互相转换

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

python如何查看网页代码

用python查看网页代码的方法：1、使用“import”导入requests包import requests2、使用requests包的get()函数通过网页... [阅读全文]
Python如何用wx模块创建文本编辑器

用python的wx模块创建文本编辑器的方法：1、设置按钮的位置import wxapp = wx.app()win = wx.frame(none,title... [阅读全文]
python如何保存文本文件

python保存文本文件的方法：使用python内置的open()类可以打开文本文件，向文件里面写入数据可以用write()函数，写完之后，使用close()函... [阅读全文]
python如何编写win程序

python可以编写win程序。win程序的格式是exe，下面我们就来看一下使用python编写exe程序的方法。编写好python程序后py2exe模块即可将... [阅读全文]
Python替换NumPy数组中大于某个值的所有元素实例

我有一个2d(二维) numpy数组，并希望用255.0替换大于或等于阈值t的所有值。据我所知，最基础的方法是：shape = arr.shaperesult ... [阅读全文]
使用Numpy对特征中的异常值进行替换及条件替换方式

原始数据为excel文件，由传感器获得，通过pyhton xlrd模块读入，读入后为数组形式，由于其存在部分异常值和缺失值，所以便利用numpy对其中的异常值进... [阅读全文]
Python 实现将numpy中的nan和inf,nan替换成对应的均值

nan：not a numberinf：infinity;正无穷numpy中的nan和inf都是float类型t!=t 返回bool类型的数组(矩阵)np.co... [阅读全文]
给ubuntu18安装python3.7的详细教程

参考文章准备工作安装工具sudo apt updatesudo apt upgradesudo apt install gccsudo apt install ... [阅读全文]
python爬虫把url链接编码成gbk2312格式过程解析

1. 问题　　抓取某个网站，发现请求参数是乱码格式，这是点击 textview，发现请求参数如下图所示3. 那么=%b9%fa%ce%f1%d4%ba%b7%a... [阅读全文]
pyecharts在数据可视化中的应用详解

使用pyecharts进行数据可视化安装 pip install pyecharts也可以在pycharm软件里进行下载pyecharts库包。下载成功后进行查... [阅读全文]

网友评论


验证码：

Python入门篇之文件

2019年06月14日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论