软件介绍
Umi OCR是一款文字识别类软件,使用PaddleOCR模块制作,可帮助用户离线识别文字中的图片,并且支持批量导入图片,快速的对多张图片进行文字的提取。软件还支持忽略区域功能,可屏蔽图片中的指定区域,只提取图片中所需要的内容,还支持设置判定条件,自动忽略游戏截图中的复杂UI。
软件简介
本软件用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件/md文件。
除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。
本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。
使用说明
准备
下载压缩包并解压全部文件即可,无需安装。
快速开始
打开主程序,将任意 图片/文件夹 拖入窗口中的白色背景表格区域,或点击左上方的 浏览 选择图片。
点击右上方 开始任务 ,等待进度条走完。
点击 识别内容 选项卡查看输出文字,或者前往 第一张图片的目录 查看识别结果txt文件。
忽略区域功能
忽略区域是本软件特色功能。
可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下所需的文本。
简单案例见下。
简单排除视频截图中的水印:
打开忽略区域设置窗口,拖入任一张截图。
稍等约1秒,面板上会显示出图片,识别到的文字区域会被虚线框起来。发现右上角的水印也被识别到了。
点击选择 +忽略区域 1 ,鼠标按住,绘制矩形完全包裹住水印区域,范围可以大一些。
点击 完成 。返回主窗口, 开始任务 。
设置条件判断,排除游戏截图中的复杂UI:
详见项目页面。
切换模型库和语言
切换日文模式
软件自带日文识别库,将 识别器路径 修改为 PaddleOCR-json\PaddleOCR_json_jp.exe 即可。
系统支持
支持 win10 x64 。
不建议使用 win7 ,核心c++模块PaddleOCR-json基本无法运行。如果想尝试,win7 x64 sp1 打满系统升级补丁+安装vc运行库后有小概率能跑起来……
更新内容
v1.2版本新功能:支持生成内联图片的Markdown文件
网友评论