python库camelot安装及使用中的一些注意事项

2024-08-02 07:45:48

1）camelot方法有两种解析模式：流解析（stream）、格子解析（lattice），其中格子解析能够保留表格完整的样式，对于复杂表格来说要优于流解析模式。同时，camelot方法默认格子解析（lattice），而采用这种解析方式，需要安装ghostscript。因此，仅通过pip命令安装的camelot，代码运行时通常会报错。需要下载ghostscript.exe并安装。安装后，经测试，并不需要在代码中import ghostscript。

2）camelot输出格式如果选择csv格式，可能存在中文乱码问题，需要用文本编辑器将导出的csv文件编码改为ansi格式。
如果想直接保存为excel格式，需要xlwt模块支持，pip安装xlwt后tables.export('文件名.xls',f = 'excel')即可输出为excel格式。

3）后来在另外一台电脑上安装camelot库时出现了一个奇葩的问题，程序运行报错。反复检查才发现原因。首先是在这台电脑上，我是按照印象输入pip install camelot，也安装成功。但代码运行错误。经查阅，正确命令（或者说版本）是pip install camelot-py[cv]。

所以我先uninstall前面安装的camelot，又重新按照正确的命令安装camelot-py[cv]，但代码运行时又提示import xlwt有问题，在python库中检查了下，xlwt文件是正常的，找了半天没找到原因。后来单独卸载xlwt，然后重新pip安装xlwt，发现xlwt的版本号由0.7变为1.3，然后一切就正常了。估计是之前错误安装了camelot的版本，导致顺带安装的xlwt版本过低，无法兼容python3.6.5。

4）camelot开始时一切正常，但处理一个pdf文件时突然报错：pdfminer.psparser.SyntaxError: Invalid dictionary construct: [/'Type', /'Font', /'Subtype', /'Type0', /'BaseFont', /b"b'", /"ABCDEE+\\xcb\\xce\\xcc\\xe5'", /'Encoding', /'Identity-H', /'DescendantFonts', <PDFObjRef:11>, /'ToUnicode', <PDFObjRef:19>]

经百度，找到解决方案，修改了pandas和PyPDF2模块的三处源码，恢复正常。具体修改内容见python爬虫处理在线预览的pdf文档

赞 (0)

python安装scipy库出错

解决scipy安装(pip install scipy)失败,以及其他问题解决: 1.在scipy官方库中并没有适合Windows的python3.6相关版本,故需要在网址http://www.lf ...
pip安装三方库不成功，提示：WARNING: You are using pip version 20.2.3, however version 20.2.4 is available.

本来是想下载requests模块,结果安装时pip报错,解决报错问题之后,顺便安装requests模块,验证问题是否成功解决 1.解决pip安装三方库不成功 pip安装三方库不成功:WARNING: ...
Python构建快速高效的中文文字识别OCR

感谢李奥诃弗斯基的悉心教导完成编译部分工作,万分感谢! 本文使用开源项目chineseocr_lite,已上传百度网盘(2020/3/16),提取码:oade 以下适合Windows系统,需要使用VS ...
python操作Excel的几个库

包太多,感觉有点乱,啥时候来一个同时支持.xls..xlsx读写的统一一下?pandas可能是一种选择,但也离不开其它几个库的支持.包版本xls读xlsx读xls写xlsx写备注xlrd1.1.0(2 ...
Python自动安装第三方库的小技巧，让你的代码拿来就用

大家好,我是Python之眼. 最近周末也加班了,害...... 有刚接触python的粉丝同学在运行此前<Python爬虫> | 手把手教你扒一扒贝壳网成交房源数据>的完整代码遇到 ...
python库 pip安装错误汇总，持续更新

python避坑指南,持续更新(BestMrRight原创) 转载请注明出处 https://blog.csdn.net/gkbxs/article/details/112471482 因为pytho ...
在win10下安装python库的问题及解决

出现'拒绝访问文件或目录'时,用管理员身份打开cmd即可. 出现building wheel失败时,可以尝试在网站:https://www.lfd.uci.edu/~gohlke/pythonlibs ...
Py之dlib：Python库之dlib库的简介、安装、使用方法详细攻略

Py之dlib:Python库之dlib库的简介.安装.使用方法详细攻略 dlib库的简介一个机器学习的开源库,包含了机器学习的很多算法,使用起来很方便,直接包含头文件即可,并且不依赖于其他库(自带 ...
Py之h5py：Python库之h5py库的简介、安装、使用方法详细攻略

Py之h5py:Python库之h5py库的简介.安装.使用方法详细攻略 h5py的简介使用h5py库读写超过内存的大数据 .在简单数据的读操作中,我们通常一次性把数据全部读入到内存中.读写超过内存 ...
DL框架之Keras：深度学习框架Keras框架的简介、安装(Python库)、相关概念、Keras模型使用、使用方法之详细攻略

DL框架之Keras:深度学习框架Keras框架的简介.安装(Python库).相关概念.Keras模型使用.使用方法之详细攻略相关文章DL框架之Keras:Python库之Keras库的简介.安装. ...
Py之Scipy：Python库之Scipy库的简介、安装、使用方法详细攻略

Py之Scipy:Python库之Scipy库的简介.安装.使用方法详细攻略 Scipy库的简介 Scipy高级科学计算库:和Numpy联系很密切,Scipy一般都是操控Numpy数组来进行科学计算. ...
Py之cx_Freeze：Python库之cx_Freeze库(程序打包)简介、安装、使用方法详细攻略—案例之实现机器人在线24小时智能翻译

Py之cx_Freeze:Python库之cx_Freeze库(程序打包)简介.安装.使用方法详细攻略-案例之实现机器人在线24小时智能翻译导读将Python程序生成exe程序目前流行这 ...
Py之Pyinstaller：Python库之Pyinstaller简介、使用方法、安装详细攻略

Py之Pyinstaller:Python库之Pyinstaller简介.使用方法.安装详细攻略 Pyinstaller简介 PyInstaller是一个十分有用的第三方库,它能够在Windows.L ...
Py之moviepy：python库之moviepy的简介、安装、使用方法详细攻略

Py之moviepy:python库之moviepy的简介.安装.使用方法详细攻略 moviepy的简介 Python有些出色的数据可视化库,但很少能渲染GIF或视频动画.本文介绍如何运用MovieP ...