0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何使用Python把图片变成文字

Wildesbeast 来源:今日头条 作者:玩物有智 2020-02-15 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为什么要让孩子学编程?看了这篇文章,你就知道编程的强大之处了!

你遇到以下的情况吗?

你负责整理一些文件,结果发现文件没有word存档,这又需要我们把图片变成word。

或者是在今日头条上看到了某片好文章,结果内容却是图片,你特别想把他变成文字分享给朋友。

如果你遇到过这些问题,千万不要错过 pytesseract 这个好工具!它能够用很简单、基础的方法将图片转换成文字(分辨图片中的文字)。在我们开始介绍 pytesseract 这个 Python 模块之前,先来认识一下 Tesseract OCR 到底是什么吧!

OCR 与 Tesseract

OCR 为光学文字识别的缩写(Optical Character Recognition,OCR),白话一点就是将图片翻译为文字。而 Tesseract 是一个 OCR 模组,目前由 Google 赞助。Tesseract 已经有 30 年历史,一开始它是惠普实验室的一款专利软体,于 2005 年开源,从 2006 年后由 Google 赞助进行后续的开发和维护, Tesseract 也是目前公认最优秀、最精准的开源 OCR 系统。

除了极高的精准度外,Tesseract 也有很高的灵活性,能够通过训练识别出任何字体(只要这些字体的风格不变就可以),也能识别出任何 Unicode 字符,是不是非常厉害呢?我们待会会用到的 pytesseract 模块就像是Tesseract的 python 包。

下面让我们来动手尝试下:

第一步 安装模块

pip3 install pillowpip3 install pytesseract

第二步 编写程序

from PIL import Imageimport pytesseractimg = Image.open('test1.png')text = pytesseract.image_to_string(img, lang='eng')print(text)

首先,第一行和第二行是将我们刚刚安装的模块导入到程序中。

PIL 包含在刚刚安装的 pillow 模组,其中的 Image 模组能够读取图片档。

我们将想要转成文字的图片档,放在和这支程式相同的目录。

第四行的 'test1.png' 是相对于这个程序(.py文件)的路径,也就是该图片的文件名,因此必须放在同一个资料夹程序才找得到文件,而且文件名与路径名都是不可省略的。

所有辨识文字、转换的複杂过程全部都写在 pytesseract 中了,我们只需要知道如何调用即可。接著看到第五行,image_to_string函式有一个关键字引数 lang,默认是英文,可以改变成你想要的语言字串。

结语

简单暴力,5行代码就可以将图片转化为文字,是不是很方便呢?除了生活中的一些小问题能用 pytesseract 解决,在开发爬虫程序时,经常会遇到需要验证码的情况,这时就能利用这个模块轻松解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • word
    +关注

    关注

    1

    文章

    79

    浏览量

    22829
  • Unicode
    +关注

    关注

    0

    文章

    25

    浏览量

    12948
  • python
    +关注

    关注

    58

    文章

    4886

    浏览量

    90315
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [VirtualLab] 使用Python运行VirtualLab Fusion光学仿真

    摘要 VirtualLab Fusion允许Python外部访问其建模技术、求解器和结果。这个用例介绍了一种使用路径变量和Visual Studio代码将Python连接到VirtualLab
    发表于 03-31 09:39

    淘宝图片搜索API接口指南

    一、前言 淘宝图片搜索 API(核心为「拍立淘」相关接口)是淘宝开放平台(TOP)提供的视觉检索接口,核心能力是基于上传的图片 / 图片 URL,检索淘宝 / 天猫平台的同款、相似商品。 该接口
    的头像 发表于 01-12 14:17 610次阅读

    瑞芯微(EASY EAI)RV1126B OCR文字识别

    1.OCR文字识别简介文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般包含两个步骤:
    的头像 发表于 01-12 10:19 7101次阅读
    瑞芯微(EASY EAI)RV1126B OCR<b class='flag-5'>文字</b>识别

    钉钉正式开源HarmonyOS图片编辑组件

    ArkTS语言开发,提供了画板、马赛克、裁剪、文字四大核心图像处理能力,助力开发者以低代码成本、高集成效率,为应用构建功能完整、交互流畅的图片编辑体验。
    的头像 发表于 01-05 09:58 679次阅读

    1688拍立淘图片搜索API概述

    图片批量搜索。 数据维度:返回商品 ID、价格、销量、供应商资质等全维度信息。 2.请求地址:c0b.cc/R4rbK2 。 3.Python 调用建议 虽然无法提供完整代码,但调用流程通常包括: 图片预处理(压缩、格式转换)。
    的头像 发表于 12-17 14:56 485次阅读

    没有专利的opencv-python 版本

    费用于商业产品,仅需保留版权声明); 包含所有核心功能:图片读取/处理、视频读写、绘图、形态学操作、边缘检测(Canny)、阈值分割、轮廓检测等,满足 90%+ 开发场景; 适配 Python 3.13,安装
    发表于 12-13 12:37

    Termux中调试圣诞树Python代码

    在Termux中调试Python代码(以圣诞树立例)非常简单,核心分为环境准备、代码编写、运行调试三个步骤,下面一步步教你操作: 一、环境准备(首次使用需做) Termux默认可能没有Python
    发表于 12-09 09:02

    商品图片批量上传接口设计与实现

    设计、实现步骤、代码示例、错误处理和性能优化。文章基于Python Flask框架,确保内容真实可靠,适合开发者快速上手。 1. 接口设计概述 一个标准的商品图片批量上传接口应遵循RESTful原则,使用HTTP POST方法。关键设计点包括: 端点定义:例
    的头像 发表于 10-13 15:25 566次阅读

    【EASY EAI Orin Nano开发板试用体验】PP-OCRV5文字识别实例搭建与移植

    参数中填上dec模型的路径,在第三个参数中填上rec模型的路径,在第四个参数中填上需要进行文字识别的源图片: 看看效果: RK3588s开发板上面成功运行,但是RK3576开发板上的librknnrt.so文件版本不匹配,因此无法正常运行...这个问题只能等待瑞芯微
    发表于 08-18 16:57

    python app不能运行怎么解决?

    ;python_agent[1241]: xmlrpc request method supervisor.stopProcess failed;python_agent[1241]: xmlrpc request method supervisor.stopProces
    发表于 08-06 06:27

    产品图片上传API接口

    ​ 在电商平台、内容管理系统或移动应用中,产品图片上传API接口是核心功能之一。它允许用户或第三方应用通过HTTP请求将图片文件上传到服务器,实现产品图像的快速添加和管理。本文将逐步介绍该接口
    的头像 发表于 07-25 14:30 853次阅读
    产品<b class='flag-5'>图片</b>上传API接口

    端侧OCR文字识别实现 -- Core Vision Kit ##HarmonyOS SDK AI##

    获取图片url,这个url和token再发给百度的ocr接口获取识别数据……或者图片转base64以后这个base64发给接口,然而鸿蒙这里,目前我也不知道啥原因(可能是发送请求的
    发表于 06-30 18:07

    HarmonyOS实战:一招搞定保存图片到相册

    保存图片功能几乎是每个应用程序必备的功能之一,当用户遇到喜欢的图片时可以保存到手机相册。那么在鸿蒙中保存图片是否也需要申请用户存储权限以及如何将图片保存到相册,本文将详细讲述怎么保存网
    的头像 发表于 06-24 17:04 1423次阅读

    Hi3861 wifiiot_hispark_pegasus 按教程安装python3 -m pip install build/lite 报错

    问题1: 报错: 问题2: 我安装网上搜的方法执行 python3 -m pip install --user ohos-build==0.4.3 hb -v [OHOS INFO] hb
    发表于 06-14 16:48

    现在有一个三维数组rgb,怎么通过k230他转变成图片显示出来?

    现在有一个三维数组rgb,怎么通过k230他转变成图片显示出来
    发表于 06-10 08:17