标签归档:PIL

PIL(Pillow)常用功能(一)

#首先导入Image、
from PIL import Image
#1、打开图像
image=Image.open('C:/1.png')
#2、显示图片
image.show()
#3、图像转化为灰度,参数用'L',转化为阈值为127的黑白图像,参数用'1'
image.convert('L')
#4、图像转化为自定义阈值的图像,需要先转化为灰度或者黑白,再执行point
threshold = 150
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
image.convert('L').point(table,'1')
#5、裁剪图像,裁剪区域用左上顶点和右下顶点坐标圈定
#region=(left,uper,right,lower)
region=(1,1,79,17)
image.crop(region)
#6、图像保存
image.save('C:/2.png')

python通过OCR引擎识别字符型验证码

写爬虫的过程中不可避免地要面对打码,一般打码工具都有很强的针对性,一款通用的验证码识别工具非常必要,tesseract-ocr开源工具就是这一需求的最好解决方法,它来自于大名鼎鼎的google,可以支持中文,可以使用再带工具训练自己的字符集。
环境:
python2.7
PIL:使用pip install Pillow即可安装,版本无限制
pytesser3:使用pip install pytesser3即可安装,该模块通过tesseract-ocr开源引擎实现
tessertact-ocr引擎:该引擎可以到github根据自己的系统下载,该链接为4.0版本 继续阅读