使用python-tesseract获取识别单词的边界框。

12 浏览
0 Comments

使用python-tesseract获取识别单词的边界框。

我正在使用python-tesseract从图像中提取单词。这是一个用于tesseract的Python封装,而tesseract是一个OCR代码。

我正在使用以下代码获取单词:

import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)
mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

这只返回单词,而不包含它们在图像中的位置/大小/方向(或者换句话说,包含它们的边界框)。我想知道是否有办法也获取这些信息。

0