如何提高ABBYY FineReader PDF 15识别准确性 / 四六文摘

ABBYY FineReader PDF 15是一款智能程度相当高的OCR文字识别软件，不仅能识别PDF文档，而且还能识别难度更高的图像文件。

说到图像文件，虽然使用扫描仪可以让我们获取到精确度更高的图像，但并不是每个家庭都配备有扫描仪，因此，通过拍照的方式获取文件图像是我们更常用的方法。

让人惊喜的是，ABBYY FineReader PDF 15提供了实用的手动编辑图像功能，可供使用者更好地调整图像的状态，以提高软件的识别准确度。

一、使用OCR编辑器功能

首先，如需使用ABBYY FineReader PDF 15 手动编辑图像功能，需单击“在OCR编辑器中打开”选项，并打开指定的图像。

图1：在OCR编辑器中打开

二、编辑页面图像

待软件完成图像的载入后，如图2所示，单击ABBYY FineReader PDF 15的编辑菜单，并选择其中的“编辑页面图像”功能。

图2：编辑页面图像

接着，软件就会自动打开图像编辑器。如图3所示，在编辑器的右侧可找到多项调整图像的功能，如歪斜校正、修剪等。

针对本例需处理的图像，我们将会使用到预处理以及校正梯形失真两项功能。

图3：图像编辑器

1、建议的预处理

首先看到的是“建议的预处理”功能，如图4所示，选择该功能后，ABBYY FineReader PDF 15就会根据图像的特点进行自动的修正。该功能可以修正明显的图像拍摄缺陷，建议在调整图片前先使用该功能进行“预处理”。

图4：建议的预处理

2、校正梯形失真

接着，如图5所示，可以看到示例中的图像存在着明显的梯形失真。这种拍摄缺陷比较常见，当相机与拍摄的文本未能保持垂直状态时，就会出现这种梯形失真。

我们可以通过自动或手动的方式修正梯形失真。如需使用手动方式调整，需在网格类型中选取“用户自定义网格”

图5：用户自定义网格

然后，再拖动框的每个角与目标识别的文本行对齐。如图6所示，由于我们目标识别的是表格中的文本，因此，需要将方框的四个角与表格的四个角对齐。完成方框的调整后，就可以单击“修正”按钮。

图6：拖动框对齐网格

如图7所示，可以看到，图像的梯形失真已调整完毕，效果相当不错。

完成了图像的编辑调整后，就可以单击“退出图像编辑器”，返回软件的OCR编辑器中。

图7：完成修正

三、重新识别图像

返回到OCR编辑器后，在页面面板中右击目标图像，选择快捷菜单中的“识别页面”选项，即可以调整后的图像为基础，开启文本的识别。

图8：识别页面功能

如图9所示，可以看到，图像被识别为表格文件，准确度还是相当高的。

图9：识别结果

四、小结

综上所述，通过使用ABBYY FineReader PDF 15的手动编辑图像功能，即使无法使用扫描仪，我们也能通过使用手动编辑图像功能，修正一些拍摄缺陷，如梯形失真、歪斜校正等，提高软件文本识别的准确度。

如何提高ABBYY FineReader PDF 15识别准确性