Welcome to PersianOCR Project
In this Project we try to add Persian supporting for tesseract-ocr
Tools
For making box file in a fast way you can use Boxmaker
RTL Languages
For rtl (Right to Left) Languages after making unicharset For supporting rtl in tesseract-ocr you can run convert unicharset to RTL.py. this code needs python
این پروژه در ادامه پروژهٔ tesseract-ocr و در تلاش برای افزودن قابلیت تشخیص کامپیوتری متنهای نوشته شده به زبان فارسی است.
برای اطلاعات بیشتر ویکی این پروژه را مطالعه نمائيد.
نشانی: https://github.com/reza1615/PersianOcr/wiki
برای ساخت فایل باکس به روش سریع از ابزار جعبه ساز استفاده نمائید
برای اصلاح راست به چپ بعد از ساخت فایل unicharset کد convert unicharset to RTL.py را اجرا نمائید توجه داشته باشید که برای اجرای فایل باید پایتون بر روی سیستم شما نصب باشد.