几行Python代码实现文字识别,你敢信?
今天给大家分享的你敢信主题是用百度的接口实现图片的文字识别。

环境和配置要求
整体是行P现文用Python实现,所需要使用的码实第三方库包括aip、PIL、字识keyboard、你敢信pyinstaller,行P现文如未安装,码实可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。字识
百度接口
打开https://cloud.baidu.com/,你敢信
如未注册请先注册,行P现文然后登录点击管理控制台,码实点击左侧产品服务→人工智能→文字识别,字识点击创建应用,你敢信输入应用名称如Baidu_OCR,行P现文选择用途如学习办公,码实最后进行简单应用描述,即可点击立即创建。
会出现应用列表,香港云服务器包括AppID、API Key、Secret Key等信息,这些稍后会用到。

打开步骤

具体实现步骤
整个程序的大致思路是,在用截图软件获得截图之后,交给百度接口识别,并返回结果,当然,也可以是本地图片识别,我用的是QQ自带截图软件,快捷键CTRL+ALT+A用来打开截图,在选中所截区域后,按Enter键即可保存到粘贴板中,也可用其他截图软件。
①获取截图
keyboard类库是用来监听键盘动作的,云服务器提供商所以在有快捷键按下之后,便会有相应动作。并用PIL中的ImageGrab来获取到剪切板中的图片并生成本地图片文件。
#1.截图
keyboard.wait(ctrl+alt+a)
print(开始截图)
keyboard.wait(enter)
print(保存截图)
time.sleep(0.1)
#2.保存图片
image = ImageGrab.grabclipboard()image.save(img.png)
②调用Baidu aip识别并打印文字
先用注册时生成的应用的AppID、API Key、Secret Key初始化应用,再读取保存到的图片并打印识别的文字。
with open(img.png, rb) as fp:
image = fp.read() text_list = client.basicAccurate(image)[words_result]
for text in text_list:
print(text[words])
运行结果如图所示:

运行截图
我们还可增加一个无限循环使得一直能截图。
③调用打包程序生成专属识别文字小程序
用pyinstaller库实现小程序的打包,生成.exe文件,这样就能随时识别文字了。在命令行中用pyinstaller xxx.py来打包生成exe文件,最后在生成的dist文件夹即可找到xxx.exe文件如下:

专属文字识别小程序
完整源代码下载见文末!
附图图片识别案例

相关文章
比较820和X10处理器(探索两款处理器的性能和特点,为你的智能设备做出明智选择)
摘要:在智能设备的选择中,处理器是一个至关重要的因素。它决定了设备的性能、速度和功能。目前市场上有许多不同的处理器可供选择,其中两款备受瞩目的是820和X10处理器。本文将探索这两款处理...2025-11-05
盘点 Spring Security 框架中的八大经典设计模式
上次有小伙伴建议,源码分析太枯燥了,要是能够结合设计模式一起来,这样更有助于大家理解 Spring Security 源码,同时还能复习一波设计模式。因此松哥今天就试着整一篇,和大家来聊一聊 Spri2025-11-05
优步:面向“域”的微服务架构,满足2200个关键微服务的扩展
最近,业界围绕面向服务的架构,尤其是微服务架构的弊端进行了大量讨论。几年前,由于许多用户关注微服务架构的众多优势,例如独立部署形式的灵活性,明确的所有权,系统稳定性的改进,以及关注点的更好分离,许多企2025-11-05
幸运的是,有关HTML5游戏开发的指南现在已经有很多了。而这篇文章则是要告诉开发者在开发HTML5游戏以前应该具备的一些全局概念。你能从这 篇 文章中学到什么?这里会介绍HTML5游戏开发的一些框架,2025-11-05超能全汉400w的卓越性能和出色表现(领先同类产品的高效能源转换和可靠性能)
摘要:超能全汉400w是一款具备卓越性能和出色表现的电源产品,其高效能源转换和可靠性能使其在同类产品中独占鳌头。本文将从多个方面介绍超能全汉400w的优点和特点。创新科技,高效能...2025-11-05
本文转载自公众号“读芯术”(ID:AI_Discovery)。使用和学习Python的人不在少数,但是真正掌握了解这门语言的人并不多。你了解最新的Python功能和技术吗?这12个小技巧能帮助你提高代2025-11-05

最新评论