使用一行Python代码从图像读取文本
处理图像不是使用一项简单的任务。对你来说,代读作为一个人,图像很容易看着某样东西然后马上知道你在看什么。文本但电脑不是使用这样工作的。

对你来说太难的代读任务,比如复杂的图像算术,或者一般意义上的文本数学,是使用计算机毫不费力就能完成的。但在这里,代读情况正好相反——对你来说很琐碎的图像任务,比如识别图像中的文本猫或狗,对电脑来说真的使用很难。在某种程度上,代读我们是图像天造地设的一对。至少现在是这样。
虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的源码下载理解,但是从格式良好的图像中读取文本在Python中却是简单的,并且可以应用于许多现实生活中的问题。
在今天的帖子中,我想证明这一点。虽然会安装一些库,但不会花很多时间。这些是你需要的库:
OpenCV PyTesseractOpenCV
现在,这个库将只用于加载图像,实际上你不需要事先对它有太多了解(尽管它可能有帮助,你将看到为什么)。
根据官方文件:
OpenCV(开源计算机视觉库)是一个开源的计算机视觉和机器学习软件库。OpenCV的目的是为计算机视觉应用提供一个通用的基础结构,并加速机器感知在商业产品中的使用。OpenCV是bsd许可的产品,OpenCV使企业可以轻松地使用和修改代码
简而言之,免费源码下载你可以使用OpenCV来做任何类型的图像转换,这是一个相当简单的库。
如果你还没有安装它,那么它将只是终端中的一行:
pip install opencv-python差不多就是这样。在此之前,一切都很简单,但这种情况即将改变。
PyTesseract
这个库到底是什么东西?根据维基百科:
Tesseract是用于各种操作系统的光学字符识别引擎。它是免费软件,根据Apache许可2.0版发布,自2006年以来由Google赞助开发。
我敢肯定,现在有更多复杂的库可用,但是我发现这个库运行良好。根据我自己的经验,该库应该能够从任何图像中读取文本,但前提是该字体不会使你连连看都看不懂。
如果无法从你的图像中读取文字,免费信息发布网花更多的时间使用OpenCV,应用各种过滤器使文本高亮。
现在安装在底部有些麻烦。如果你使用的是Linux,则全部归结为几个sudo-apt get命令:
sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev我用的是Windows系统,所以这个过程有点乏味。
首先,打开这个URL:https://github.com/UB-Mannheim/tesseract/wiki下载32位或64位的安装程序:

安装本身很简单,只需单击几次Next。是的,你还需要做一个pip安装:
pip install pytesseract接下来要需要告诉Python Tesseract安装在何处。在Linux机器上,我不需要这样做,但在Windows上是必需的。默认情况下,它安装Program Files。
如果你做的一切正确,执行这些代码应该不会产生任何错误:

获取文本
让我们从一个简单的开始。我找到了一些免版税的图片,里面有一些文字,第一个是这样的:

它应该是简单的一个,有可能Tesseract会读那些蓝色的“对象”作为括号。让我们看看会发生什么:

我的猜测是正确的。不过,这不是一个问题,你可以使用一些Python技巧轻松地解决这些问题。
下一个可能更棘手:

我希望它不会检测到硬币上的“B”:

看起来效果很好。
现在轮到你把它应用到你自己的问题上了。如果文本与背景混合,OpenCV技能在这里可能是至关重要的。
在你离开之前
对计算机来说,从图像中读取文本是一项相当困难的任务。想想看,电脑不知道字母是什么,它只对数字有效。在引擎盖后面发生的事情一开始可能看起来像一个黑盒子,但我鼓励你进一步研究,如果这是你感兴趣的领域。
我并不是说PyTesseract每次都能很好地工作,但是我发现即使在一些比较复杂的图像上它也足够好。但不是所有情况都很好,有时候需要一些图像处理需要使文本高亮让其相对于背景更加突出。
相关文章
- 摘要:在现代科技的发展下,U盘已成为我们日常生活中不可或缺的设备之一。然而,有时候我们可能需要同时使用多个U盘,并希望它们能够同时在电脑上进行安装。本文将介绍以电脑多个U盘安装的详细步骤...2025-11-04
- 摘要:电脑死机是许多用户常常遇到的问题,不仅会让人心烦意乱,还会影响工作和娱乐体验。本文将介绍15个有效的方法来解决电脑常死机的问题,帮助用户快速恢复正常运行。清理电脑内存空间的...2025-11-04
用新机大白菜U盘装系统教程Win10(详细步骤教你在新机上使用大白菜U盘安装Win10系统)
摘要:随着科技的发展,大家购买了新机后常常需要安装操作系统。本文将介绍如何使用新机大白菜U盘来装系统,以Win10为主题,详细步骤将会帮助您顺利完成安装过程。一、准备工作:获取新...2025-11-04华为荣耀X6手机的全面评测(探寻华为荣耀X6的性能、功能与设计特点)
摘要:作为华为旗下的一款中端手机,华为荣耀X6凭借其出色的性能、丰富的功能和精美的设计,吸引了众多消费者的关注。本文将从多个方面对华为荣耀X6进行全面评测,为读者提供更详尽的了解。...2025-11-04电脑开机报Windows错误的解决方法(应对电脑开机报Windows错误,避免系统崩溃)
摘要:在使用电脑的过程中,有时我们会遇到电脑开机报Windows错误的情况。这些错误可能导致系统崩溃、文件损坏,甚至无法正常使用电脑。了解和掌握相应的解决方法对于用户来说非常重要。...2025-11-04Acer宏碁笔记本电脑(高性能笔记本电脑,为您带来无限可能)
摘要:在当今高科技时代,笔记本电脑已经成为人们生活中不可或缺的一部分。而Acer宏碁作为知名笔记本电脑品牌之一,凭借着卓越的性能和可靠的品质,赢得了众多用户的青睐。本文将详细介绍Acer...2025-11-04

最新评论