خدمات تشخیص متن آنلاین

تبریک به همه خوانندگان وبلاگ!

من فکر می کنم که کسانی که اغلب در کامپیوتر کار می کنند (بازی نمی کند، اما کار می کند)، مجبور بودند با شناخت متن برخورد کنند. خوب، به عنوان مثال، شما گزیده ای از کتاب را اسکن کرده اید و حالا شما باید این قسمت را در سند خود قرار دهید. اما اسکن اسکن شده یک تصویر است و ما به متن نیاز داریم - برای این منظور ما نیاز به برنامه های ویژه و خدمات آنلاین برای شناخت متن از تصاویر است.

درباره برنامه های به رسمیت شناختن، من در پست های قبلی نوشتم:

- متن اسکن و تشخیص در FineReader (برنامه پرداخت)؛

- کار در FineReader آنالوگ - CuneiForm (برنامه رایگان).

در همان مقاله می خواهم به خدمات آنلاین برای تشخیص متن تمرکز کنم. پس از همه، اگر شما نیاز به سرعت متن را با 1-2 عکس دریافت کنید - هیچ مشکلی با نصب برنامه های مختلف وجود ندارد ...

مهم است! کیفیت تشخیص (تعداد اشتباهات، قابلیت خواندن و غیره) بسیار بستگی به کیفیت تصویر اولیه دارد. بنابراین، هنگام اسکن کردن (عکسبرداری، و غیره)، کیفیت را تا آنجا که ممکن است انتخاب کنید. در بیشتر موارد، کیفیت 300-400 نقطه در اینچ کافی خواهد بود (dpi پارامتر مشخص کننده کیفیت تصویر است. در تنظیمات تقریبا همه اسکنر، این پارامتر معمولا نشان داده می شود).

خدمات آنلاین

برای نشان دادن کار خدمات، تصویری از یکی از مقالاتم را تهیه کردم. این تصویر به تمام خدمات ارسال خواهد شد، شرح آن در زیر ارائه شده است.

1) //www.ocrconvert.com/

من این سرویس را به خاطر سادگی آن دوست دارم. اگرچه این سایت انگلیسی است، اما با زبان روسی نیز کار می کند. لازم نیست ثبت نام کنید برای شروع تشخیص، شما باید 3 مرحله انجام دهید:

- تصویر خود را آپلود کنید

- زبان متن را انتخاب کنید، که در تصویر است؛

- دکمه تشخیص شروع را فشار دهید.

پشتیبانی از فرمت: PDF، GIF، BMP، JPEG.

نتیجه در تصویر زیر نشان داده شده است. باید بگویم، متن به خوبی شناخته شده است. علاوه بر این، خیلی سریع - به طور معنادار 5-10 ثانیه صبر کردم.

2) //www.i2ocr.com/

این سرویس به همان شیوه کار می کند. در اینجا شما همچنین باید فایل را دانلود کنید، زبان شناسایی را انتخاب کنید و روی دکمه متن عصاره کلیک کنید. این سرویس بسیار سریع کار می کند: 5-6 ثانیه. یک صفحه

فرمت های پشتیبانی شده: TIF، JPEG، PNG، BMP، GIF، PBM، PGM، PPM.

نتیجه این سرویس آنلاین بسیار راحت است: بلافاصله دو پنجره را می بینید - در نتیجه اول، نتیجه به رسمیت شناختن، در مرحله دوم - تصویر اصلی. بنابراین، به اندازه کافی آسان است که ویرایش را در طول ویرایش انجام دهید. به هر حال، ثبت نام در سرویس نیز ضروری نیست.

3) //www.newocr.com/

این سرویس به چندین روش منحصر به فرد است. اول، آن را پشتیبانی از "جدید" قالب DJVU (به هر حال، لیست کامل از فرمت های: JPEG، PNG، GIF، BMP، TIFF، PDF، DjVu). ثانیا، از انتخاب مناطق متن در تصویر پشتیبانی می کند. این بسیار مفید است زمانی که شما در تصویر نه تنها مناطق متن، بلکه همچنین تصاویر گرافیکی است که شما لازم نیست به رسمیت شناختن.

کیفیت تشخیص بالاتر از حد متوسط ​​است، بدون نیاز به ثبت نام.

4) //www.free-ocr.com/

یک سرویس بسیار ساده برای شناخت: یک تصویر را آپلود کنید، زبان را مشخص کنید، کپچا را وارد کنید (به هر حال، تنها سرویس در این مقاله که در آن شما باید آن را انجام دهید)، و دکمه را برای ترجمه تصویر به متن فشار دهید. در واقع همه چیز!

فرمت های پشتیبانی شده: PDF، JPG، GIF، TIFF، BMP.

نتیجه به رسمیت شناختن متوسط ​​است. اشتباهات وجود دارد، اما نه چندان. با این حال، اگر کیفیت تصویر اصلی بالاتر باشد، خطایی در حد کمتری وجود خواهد داشت.

PS

این همه برای امروز است اگر از خدمات جالب دیگری برای شناخت متن مطلع شوید - به اشتراک گذاری در نظرات، سپاسگزارم. یک شرط: مطلوب است که نیازی به ثبت نام وجود ندارد و سرویس رایگان است.

با احترام!