pdf2table识别表格的应用场景有哪些?

用户图像 Pdf2Table 公开分享 - 2023年11月02日 17:19

Pdf2Table提供了两种方式进行Pdf中的表格提取,一种是单次操作,一种是模板操作。

1、单次操作: 如果你手头上只有1个pdf文件需要提取里面的表格,或者,你有多个pdf文件需要处理,但是它们是完全不一样的,可能是订单列表表格,可能是人员明细表格,那么,你直接使用单次操作就行了。

2、模板操作: 如果你手头上有多个pdf文件需要操作,并且,你的操作是持续性的,那么,你可以配置1个Pdf模板(Module)来操作。例如,你每月的订单文件,这个月你需要处理20个,下个月需要处理30个,再下个月依然需要批量处理。

那么模板操作就是你需要的了。

进行模板操作,首先你需要进行模板配置,并准备一定量的同类型pdf文件进行模板训练。(一般至少5、6个,视Pdf文件中的表格复杂度增减)

当模板训练完成,你就可以利用模板进行批量的Pdf表格提取了。