爬取数据的过程中难免遇到有验证码的问题时,无疑增加了难度,ddddocr该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,直接进入主题。
环境要求 :
目前已经支持python3.8以下的了,python3.8以上毫无问题。
调用方法:
pip install ddddocr
列子:
import ddddocr
ocr = ddddocr.DdddOcr()
with open('test.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
参数说明:
DdddOcr 接受两个参数
参数名 use_gpu
默认值 False
说明 Bool 是否使用gpu进行推理,如果该值为False则device_id不生效
classification
参数名 img
默认值 0
说明 bytes 图片的bytes格式