一、引言
cnocr是一个功能强大的光学字符识别扩展库,但是它的安装比较麻烦,稍不留神就出错,这里分享一下安装cnocr的经验教训。VMware 虚拟机:64位Win 7中文版 + 64位Python 3.7.6
VMware 虚拟机:64位Win 10中文版 + 64位Python 3.7.6
为了详细说明安装需求,特地将以上两个环境置为全新操作系统,除了Python还没有安装过其它软件。
《Python程序设计(基于计算思维和新文科建设)》,ISBN:9787121435577,胡凤国,电子工业出版社,2022年6月。本书是电子工业出版社在国内较早采用纸质版+电子版的创新图书发行模式的第一次尝试。本书是这套创新图书的纸质版部分,与之内容互补的电子版图书将稍后出版。基础篇介绍Python程序设计的入门知识,共12章,包括:⑵ Python软件的安装和Python程序运行;⑶ Python的基本概念(对象、数据类型、表达式、内置函数);排错篇总结初学者常遇到的错误并介绍程序调试方法,包含2章:与本书内容互补的电子版图书包含文本篇和应用篇两部分:文本篇:介绍字符集、编码和文本文件读写的知识,包含了对国家规范《通用规范汉字表》8105个汉字当中难以输入和难以显示的汉字的处理。应用篇:介绍Word、Excel、PPT、PDF、图片等常用办公文件的处理,是大家提高办公和科研效率的好帮手。本书配套有详细的PPT和教学大纲,还有全部例题的程序代码和绝大部分思考题的程序代码。本书配套PPT里面还加入了配套电子版图书中的部分内容,比如字符集和编码,不同编码的文本文件的读写,Word、Excel、PPT、PDF等一些常用办公文件的读写。1、大学文科生, 可选本书当Python教材或自学Python的参考书。2、大学理工科学生, 可选本书当自学Python的参考书。可拿本书当工具书,本书的配套程序会为您节省效率,在当前大数据和新文科的背景下,本书可以为相关领域的量化研究提供技术支持。本书配套的电子版图书中的编码和文本处理知识也可以作为理工科教师和科研人员处理文本数据的参考资料之一,毕竟专门开辟章节介绍国家标准《通用规范汉字表》汉字处理的程序设计图书并不多见。
本书有专门的海龟画图章节,有大量的有趣数学题目,可以培养学生的计算思维,适合对编程感兴趣的中小学生阅读,也适合打算让娃参加编程辅导班的家长朋友参考。本书在各大实体书店和网店均有销售。京东、天猫、当当的购买渠道如下(可扫码直达购买页面)。
先安装Python 3.7.6 64位,然后在命令行窗口中 pip install cnocr它会安装很多库,然后在安装 opencv-python 时失败。
ERROR: Could not build wheels for opencv-python which use PEP 517 and cannot be installed directly在这之前报错:
Building windows wheels for Python 3.7 requires Microsoft Visual Studio 2022 Get it with "Visual Studio 2017":
https://visualstudio.microsoft.com/vs/
Or with "Visual Studio 2019":
https://visualstudio.microsoft.com/vs/
Or with "Visual Studio 2022":
https://visualstudio.microsoft.com/vs/

看出错信息感觉是电脑上没有安装 Visual Studio 导致的,于是在
https://visualstudio.microsoft.com/zh-hans/vs/
下载 Visual Studio ,得到文件 VisualStudioSetup.exe,双击运行,它提示要下载文件,但很久不动,最后报错无法下载。


于是到
https://www.lfd.uci.edu/~gohlke/pythonlibs/
下载
opencv_python-4.5.5-cp37-cp37m-win_amd64.whl
安装这个Wheel文件,这才顺利安装上了opencv-python。
之后继续 pip install cnocr ,又遇到错误,这次是安装 Polygon3 的时候提示失败,提示信息如下:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools":
https://visualstudio.microsoft.com/downloads/https://visualstudio.microsoft.com/downloads/
VisualStudioSetup.exe
没办法,只能去
https://www.lfd.uci.edu/~gohlke/pythonlibs/Polygon3-3.0.9.1-cp37-cp37m-win_amd64.whl安装这个Wheel文件,这才顺利安装上了Polygon3。再次 pip install cnocr,虽然中间会提示一个某个库版本不对,但cnocr还是能安装成功。
【经验教训】以后在 64位Win 7中文版 + 64位Python 3.7.6 环境中安装cnocr的话,可以直接安装下面两个Wheel文件:opencv_python-4.5.5-cp37-cp37m-win_amd64.whlPolygon3-3.0.9.1-cp37-cp37m-win_amd64.whl然后在Windows的命令行窗口中 pip install cnocr 就行了,这次不会出错,可以一步安装成功。注意:千万不要幻想在Win 7中安装 Visual Studio 或 Visual C++ 14.0,否则将会陷入疯狂的查资料与下载资源当中无法自拔,我用了两天的时间证明上述努力是徒劳无功的。
先安装Python 3.7.6 64位,然后在命令行窗口中 pip install cnocr,遇到的问题跟Win 7中一样。照搬Win 7的方法,先安装两个Wheel文件,再pip安装cnocr即可。2、安装方法2
观察方法1,发现两个错误跟微软家的Visual Studio和Visual C++有关,于是想能不能提前安装这两个东西呢?经过在全新的虚拟机中测试发现,可以采用如下步骤:
第一步:安装 Microsoft C++ 生成工具。
第二步:确保升级pip,如果pip不是最新版本,则在在命令行窗口用pip命令安装扩展库之后会提示我们升级pip,升级命令从界面上复制即可。对于本文的环境 64位Win 10中文版 + 64位Python 3.7.6 来说,升级 pip 的命令是:
python -m pip install --upgrade pip
如果不升级pip,即使第一步和第三步都做了,也在第三步出现各种各样的问题,其实都是pip没有升级导致的。
第三步:是安装cnocr,安装命令是:
pip install cnocr
下面详细说一下安装 Microsoft C++ 生成工具的方法。
五、Win10中安装 Microsoft C++ 生成工具
首先打开如下网址
https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

点击“下载生产工具”下载 vs_BuildTools.exe ,下载之后双击运行。



我们勾选第一项“使用C++的桌面开发”,如下图所示。

在上图中,点击“安装”按钮,会给我们一个提示信息。

最后出来如下的界面。

到这一步,安装就完成了。
欢迎关注微信公众号“语和言”,本公众号将不定期发布对图书《Python程序设计(基于计算思维和新文科建设)》中的Python知识点进行解读和补充的内容。语和言公众号还有读者交流群,读者朋友可以入群一起讨论问题。
欢迎跟图书《Python程序设计(基于计算思维和新文科建设)》的作者胡凤国老师进行交流,作者电邮:cuchufengguo@163.com。
七、图书目录
图书《Python程序设计(基于计算思维和新文科建设)》目录如下:8.2.4 关于元素可比较的有序序列类对象的通用操作10.3.3 用上下文管理语句with来管理文本文件读写12.12.1 datetime标准库定义的常用类