الگوریتمها و تکنیکهای OCR سنتی فرض میکنند که ما با یک نوع فونت ثابت کار میکنیم. در اوایل دهه 1900، این می توانست فونت مورد استفاده میکروفیلم ها باشد.
در دهه 1970، فونت های تخصصی به صراحت برای الگوریتم های OCR توسعه یافتند و در نتیجه آنها را دقیق تر کردند. در دهه 2000، میتوانستیم از فونتهای از پیش نصب شده روی رایانههایمان برای تولید خودکار دادههای آموزشی استفاده کنیم و از این فونتها برای آموزش مدلهای OCR خود استفاده کنیم.
هر کدام از این فونت ها دارای ویژگی های مشترک بودند:
آنها به نوعی مهندسی شده بودند:
1- یک فضای قابل پیش بینی و فرضی بین هر شخصیت وجود دارد (در نتیجه تقسیم بندی آسان تر می شود).
2- سبک فونت ها برای OCR مساعدتر بود.
این مجموعه داده از تصاویر اعداد و حروف عربی ساخته شده با فونت های مختلف است تشکیل شده است
نقد و بررسیها
هنوز بررسیای ثبت نشده است.