当前位置: 移动技术网 > IT编程>脚本编程>Python > python 识别图片中的文字信息方法

python 识别图片中的文字信息方法

2019年06月17日  | 移动技术网IT编程  | 我要评论

1111购物狂欢节,天津体育学院教务网,恶心的图片

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序;

刚好最近在做一个python项目,所以顺便用python练练手

1.需要的环境:

2.7或者3.4版本的python

2.需要安装pytesseract库

依赖pil和tesseract-ocr库

本地环境是ubuntu,下面说一下 具体步骤:

2.7

1.安装pil:

直接使用pip 安装; pip install pillow

2.安装tesseract-ocr:

apt-get install tesseract-ocr

3.安装pytesseract

pip install pytesseract

使用python 3.4安装时;将pip 命令修改为pip3(都知道)

测试:

import pytesseract
from pil import image
img = image.open('hb1.png')
data = pytesseract.image_to_string(img)
print (data)

注意: 会出现乱码

以上这篇python 识别图片中的文字信息方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持移动技术网。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网