Tesseract是github上的OCR开源库
使用官方源
yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/
安装密钥
sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key
执行安装
yum install tesseract
安装语言包
前往github下载对应版本的中文语言包(chi_sim.traineddata)
https://github.com/tesseract-ocr/tessdata/tree/4.1.0
将语言包放至如下目录
/usr/share/tesseract/4/tessdata/
使用tesseract识别图片文字
tesseract ./tmp.png stdout -l chi_sim --dpi 100
文章作者:DOTATONG
发布日期:2021-11-18
评论