使用python-tesseract获取识别单词的边界框。
- 论坛
- 使用python-tesseract获取识别单词的边界框。
12 浏览
使用python-tesseract获取识别单词的边界框。
我正在使用python-tesseract从图像中提取单词。这是一个用于tesseract的Python封装,而tesseract是一个OCR代码。
我正在使用以下代码获取单词:
import tesseract api = tesseract.TessBaseAPI() api.Init(".","eng",tesseract.OEM_DEFAULT) api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz") api.SetPageSegMode(tesseract.PSM_AUTO) mImgFile = "test.jpg" mBuffer=open(mImgFile,"rb").read() result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api) print "result(ProcessPagesBuffer)=",result
这只返回单词,而不包含它们在图像中的位置/大小/方向(或者换句话说,包含它们的边界框)。我想知道是否有办法也获取这些信息。