نرم افزار تشخیص متن

به عنوان یک قاعده، هنگامی که به برنامه های به رسمیت شناختن متن اسکن شده (OCR، تشخیص نویسه نویسی) می آید، اکثر کاربران تنها محصول را به یاد ABBYY FineReader می اندازند که بدون شک رهبر این نرم افزار در روسیه و یکی از رهبران جهان است.

با این وجود، FineReader تنها راه حل این نوع نیست: برنامه های رایگان برای به رسمیت شناختن متن، سرویس های آنلاین برای اهداف مشابهی وجود دارد و علاوه بر این، چنین توابع در برخی از برنامه های آشنا نیز وجود دارد که ممکن است بر روی رایانه شما نصب شوند . من سعی خواهم کرد در مورد این همه در این مقاله بنویسم. همه برنامه های در نظر گرفته شده در ویندوز 7، 8 و XP کار می کنند.

رهبر شناخت متن - ABBYY Finereader

درباره FineReader (تلفظ شده به عنوان Fine Reader) احتمالا بیشتر از شما شنیده می شود. این برنامه بهترین یا بهترین برای به رسمیت شناختن متن با کیفیت بالا در روسیه است. این برنامه پرداخت می شود و قیمت مجوز برای استفاده از خانه کمی کمتر از 2000 روبل است. همچنین ممکن است نسخه آزمایشی FineReader را دانلود کنید یا از طریق تشخیص متن آنلاین در ABBYY Fine Reader Online (شما می توانید چندین صفحه را به صورت رایگان و سپس برای هزینه) تشخیص دهید. همه اینها در سایت رسمی توسعه دهنده //www.abbyy.ru موجود است.

نصب نسخه آزمایشی FineReader هیچ مشکلی ایجاد نکرد. این نرم افزار می تواند با مایکروسافت آفیس و ویندوز اکسپلورر ادغام شود تا قابلیت شناسایی آن را آسان تر کند. از محدودیت نسخه آزمایشی رایگان - 15 روز استفاده و توانایی تشخیص بیش از 50 صفحه.

Screenshot برای تست نرم افزار تشخیص

از آنجایی که من اسکنر ندارم، از یک دوربین تلفن با کیفیت ضعیف استفاده کردم که در آن کمی contrast را ویرایش کردم تا بررسی شود. کیفیت خوب نیست، بگذار ببینیم چه کسی می تواند آن را اداره کند.

منوی FineReader

FineReader می تواند یک تصویر گرافیکی از متن به طور مستقیم از اسکنر، از فایل های گرافیکی یا دوربین دریافت کند. در مورد من، برای باز کردن فایل تصویر کافی بود. من با نتیجه خوشحال شدم - فقط چند اشتباه بود. بلافاصله می گویم این بهترین نتیجه تمام برنامه های تست شده در هنگام کار با این نمونه است - کیفیت تشخیص مشابه تنها در سرویس رایگان آنلاین رایگان OCR (اما در این بررسی ما فقط درباره نرم افزار صحبت می کنیم، نه به رسمیت شناختن آنلاین).

نتیجه تشخیص متن در FineReader

صادقانه بگویم، FineReader احتمالا هیچ رقابتی برای متون سیریلیک ندارد. مزایای این برنامه نه تنها کیفیت تشخیص متن، بلکه قابلیت گسترده، پشتیبانی از قالب بندی، صادرات مجاز به بسیاری از فرمت ها، از جمله docx ورد، pdf و سایر ویژگی ها می باشد. بنابراین، اگر کار OCR چیزی است که شما دائما در معرض، پس از مقدار نسبتا کمی از پول پشیمان نیست و آن را پرداخت: شما صرفه جویی در مقدار زیادی از زمان، به سرعت نتایج با کیفیت در FineReader. به هر حال من چیزی را تبلیغ نمی کنم - من واقعا فکر می کنم که کسانی که نیاز به شناسایی بیش از دوازده صفحه داشته باشند باید به خرید چنین نرم افزاری فکر کنند.

CuneiForm یک برنامه تشخیص متن آزاد است.

براساس برآورد، دومین برنامه محبوب OCR در روسیه CuneiForm رایگان است که از سایت رسمی //cognitiveforms.ru/products/cuneiform/ دانلود شده است.

نصب برنامه نیز بسیار ساده است، سعی نکنید نصب نرم افزارهای شخص ثالث (مانند بسیاری از نرم افزارهای آزاد) را انجام دهید. رابط کاربری مختصر و روشن است. در برخی موارد، ساده ترین راه برای استفاده از جادوگر، که اولین بار از آیکون ها در منو است.

با نمونه ای که من در FineReader استفاده کردم، این برنامه نتوانسته بود، یا دقیق تر، چیزهایی را که به شدت قابل خواندن و قطعاتی از کلمات بود، منتشر کرد. تلاش دوم با یک تصویر از متن از سایت این برنامه انجام شد، که باید افزایش یابد (نیاز به اسکن با وضوح 200dpi و بالاتر، تصاویری با عرض خط فونت 1-2 پیکسل ندارد). در اینجا او به خوبی کار کرد (بعضی از متن ها به رسمیت شناخته نشده بود، چون فقط روسی انتخاب شد).

تشخیص متن CuneiForm

بنابراین، ما می توانیم فرض کنیم که CuneiForm چیزی است که شما باید امتحان کنید، به ویژه اگر شما دارای صفحات اسکن شده با کیفیت بالا هستید و می خواهید آنها را به صورت رایگان تشخیص دهید.

مایکروسافت OneNote - برنامه ای است که شما ممکن است قبلا داشته باشید

در مایکروسافت آفیس، با شروع از نسخه 2007 و تا پایان 2013، یک برنامه برای یادداشت برداری وجود دارد - OneNote. همچنین دارای ویژگی های تشخیص متن است. برای استفاده از آن، به سادگی تصویر اسکن شده یا هر متن دیگر را در یادداشت قرار دهید، روی آن راست کلیک کرده و از منوی زمینه استفاده کنید. من متوجه شدم که پیش فرض برای تشخیص به زبان انگلیسی تنظیم شده است.

شناخت در Microsoft OneNote

من نمی توانم بگویم که متن به طور کامل به رسمیت شناخته شده است، اما تا آنجا که من می توانم بگویم، آن را تا حدی بهتر از CuneiForm بهتر است. به علاوه برنامه، همانطور که قبلا ذکر شد، این است که با احتمالی قابل توجهی در حال حاضر بر روی کامپیوتر شما نصب شده است. اگرچه، البته، استفاده از آن در صورت نیاز به کار با تعداد زیادی اسکن اسکن، بعید به نظر می رسد راحت است، بلکه مناسب برای تشخیص سریع کارت های کسب و کار است.

OmniPage Ultimate OmniPage 18 - باید چیزی بسیار جالب باشد

من نمی دانم که نرم افزار تشخیص متن OmniPage چقدر خوب است: هیچ نسخه آزمایشی وجود ندارد، من نمی خواهم آن را در جایی دانلود کنم. اما اگر قیمت آن توجیه شود و هزینه آن حدود 5،000 روبل در نسخه برای استفاده فردی و نه Ultimate هزینه خواهد شد، پس این باید چیزی چشمگیر باشد. صفحه برنامه: //www.nuance.com/for-individualals/by-product/omnipage/index.htm

قیمت نرم افزار OmniPage

اگر خواندن ویژگی ها و بررسی ها، از جمله آن ها در نشریات روسی، آنها متوجه شده اند که OmniPage واقعا به رسمیت شناختن با کیفیت بالا و دقیق، از جمله در روسیه، نسبتا آسان است برای اسکن اسکن با کیفیت بالا و مجموعه ای از ابزار های اضافی را فراهم می کند. از نقاط ضعف، این راحت ترین، به ویژه برای رابط کاربر تازه کار نیست. به هر حال، در بازار غربی OmniPage یک رقیب مستقیم از FineReader است و در رأی دادن به زبان انگلیسی آنها دقیقا در میان خود در حال مبارزه هستند و بنابراین من فکر می کنم برنامه باید ارزشمند باشد.

اینها همه برنامه های این نوع نیستند، گزینه های مختلف برای برنامه های رایگان کوچک نیز وجود دارد، اما در حین آزمایش با آنها، من دو معضل اصلی ذاتی در آنها را پیدا کردم: عدم پشتیبانی سیریلیک یا نرم افزار متفاوت و غیرممکن در مجموعه نصب، و بنابراین تصمیم گرفتند که آنها را ذکر نکنند اینجا