متن را در یک فایل PDF بصورت آنلاین شناسایی کنید.


همیشه امکان استخراج متن از یک فایل PDF با استفاده از کپی معمول وجود ندارد. اغلب صفحات این اسناد محتوی اسکن شده در نسخه های کاغذی خود هستند. برای تبدیل چنین فایل ها به داده های متنی قابل ویرایش قابل استفاده، برنامه های ویژه ای با عملکرد تشخیص نوری (OCR) استفاده می شود.

چنین راه حل هایی برای اجرای بسیار دشوار است و به همین دلیل هزینه زیادی را صرف می کنند. اگر به طور منظم متن را با PDF به رسمیت بشناسید، توصیه می شود که برنامه مناسب را خریداری کنید. برای موارد نادر، استفاده از یکی از خدمات آنلاین موجود با عملکردهای مشابه، منطقی تر است.

نحوه تشخیص متن از PDF آنلاین

البته، ویژگی های سرویس های آنلاین OCR در مقایسه با راه حل های کامل دسکتاپ محدود است. اما شما می توانید با این منابع به صورت رایگان یا برای هزینه اسمی کار کنید. نکته اصلی این است که برنامه های کاربردی مربوطه با کار اصلی خود، یعنی به رسمیت شناختن متن، نیز مقابله می کنند.

روش 1: ABBYY FineReader Online

شرکت توسعه خدمات یکی از رهبران در زمینه شناسایی سند نوری است. ABBYY FineReader برای ویندوز و مک یک راه حل قدرتمند برای تبدیل PDF به متن و کار با آن است.

مطمئنا، همپوشانی وب از این قابلیت در عملکرد پایین تر است. با این وجود، سرویس می تواند متن را از اسکن و عکس در بیش از 190 زبان تشخیص دهد. پشتیبانی از تبدیل فایل های PDF به اسناد ورد، اکسل و غیره

ABBYY FineReader آنلاین سرویس آنلاین

  1. قبل از شروع به کار با ابزار، یک حساب کاربری در سایت ایجاد کنید یا با استفاده از حساب فیس بوک، گوگل یا مایکروسافت وارد شوید.

    برای رفتن به پنجره ورود، بر روی دکمه کلیک کنید. "ورود" در نوار منوی بالای صفحه
  2. پس از وارد شدن، سند PDF مورد نظر را با استفاده از دکمه FineReader وارد کنید "آپلود فایلها".

    سپس کلیک کنید "شماره صفحه را انتخاب کنید" و فاصله مورد نظر برای به رسمیت شناختن متن را مشخص کنید.
  3. سپس زبان های موجود در سند، فرمت فایل نتیجه را انتخاب کرده و روی دکمه کلیک کنید "تشخیص".
  4. پس از پردازش، طول مدت آن کاملا به اندازه سند بستگی دارد، شما می توانید فایل به پایان رسید با داده های متنی را به سادگی با کلیک بر روی نام آن دانلود کنید.

    یا آن را به یکی از خدمات ابری موجود تبدیل کنید.

این سرویس، احتمالا توسط الگوریتم های دقیق تر به رسمیت شناختن متن در تصاویر و فایل های PDF مشخص می شود. اما، متاسفانه، استفاده رایگان آن محدود به پنج صفحه پردازش شده در هر ماه است. برای کار با اسناد بیشتر، شما مجبور به خرید یک سال اشتراک هستید.

با این حال، اگر عملکرد OCR بسیار به ندرت مورد نیاز است، ABBYY FineReader Online یک گزینه عالی برای استخراج متن از فایل های کوچک PDF است.

روش 2: OCR آنلاین رایگان

سرویس ساده و راحت برای دیجیتالی کردن متن. بدون نیاز به ثبت نام، این منابع به شما اجازه می دهد تا 15 صفحه PDF کامل را در ساعت تشخیص دهید. Free Online OCR به طور کامل با اسناد در 46 زبان کار می کند و بدون مجوز پشتیبانی از سه فرمت صادرات متن - DOCX، XLSX و TXT.

هنگام ثبت نام، کاربر قادر به پردازش اسناد چند صفحه ای است، اما تعداد رایگان این صفحات به 50 واحد محدود می شود.

سرویس آنلاین آنلاین OCR آنلاین رایگان

  1. برای به رسمیت شناختن متن از PDF به عنوان مهمان، بدون مجوز در منبع، از فرم مناسب در صفحه اصلی سایت استفاده کنید.

    سند دلخواه را با استفاده از دکمه انتخاب کنید "پرونده"، زبان اصلی متن، فرمت خروجی را مشخص کنید، سپس فایل را برای بارگذاری و کلیک کنید منتظر بمانید "تبدیل".
  2. در پایان روند دیجیتال سازی، روی کلیک کنید "دانلود فایل خروجی" برای ذخیره سند به پایان رسید با متن در کامپیوتر.

برای کاربران مجاز، دنباله ای از اقدامات تا حدودی متفاوت است.

  1. از دکمه استفاده کنید "ثبت نام" یا "ورود" در نوار منوی بالا به ترتیب، ایجاد یک حساب کاربری رایگان آنلاین OCR یا رفتن به آن.
  2. پس از تأیید در پانل شناسایی، کلید را نگه دارید "CTRL"، انتخاب کنید تا دو زبان سند اصلی را از لیست ارائه شده انتخاب کنید.
  3. گزینه های بیشتر برای استخراج متن از PDF را مشخص کنید و روی دکمه کلیک کنید. "انتخاب فایل" برای بارگذاری سند در سرویس.

    سپس، برای شروع تشخیص، روی کلیک کنید "تبدیل".
  4. پس از پردازش سند، روی پیوند با نام فایل خروجی در ستون مربوطه کلیک کنید.

    نتیجه به رسمیت شناختن بلافاصله در حافظه کامپیوتر شما ذخیره می شود.

اگر شما نیاز به استخراج متن از یک سند PDF کوچک دارید، می توانید با استفاده از ابزار فوق توضیح داده شده با خیال راحت. برای کار با فایل های بزرگ، شما مجبور به خرید علامت های اضافی در Free Online OCR و یا استفاده از راه حل دیگری.

روش 3: NewOCR

سرویس کاملا رایگان OCR که به شما اجازه می دهد متن را از تقریبا هر اسناد گرافیکی و الکترونیکی مانند DjVu و PDF استخراج کنید. این منابع محدودیت های اندازه و تعداد فایل های قابل تشخیص را اعمال نمی کند، نیازی به ثبت نام ندارد و طیف وسیعی از توابع مرتبط را ارائه می دهد.

NewOCR از 106 زبان پشتیبانی می کند و قادر است به درستی اسکن اسناد حتی با کیفیت پایین را اداره کند. این امکان وجود دارد که به طور دستی منطقه برای تشخیص متن را در صفحه فایل انتخاب کنید.

سرویس آنلاین NewOCR

  1. بنابراین، شما می توانید بدون نیاز به انجام اقدامات غیر ضروری، بلافاصله با منابع کار کنید.

    به طور مستقیم بر روی صفحه اصلی یک فرم برای وارد کردن سند به سایت وجود دارد. برای آپلود یک فایل به NewOCR، از دکمه استفاده کنید "انتخاب فایل" در بخش "فایل خود را انتخاب کنید". سپس در زمینه "زبان شناختی (های)" یک یا چند زبان سند اصلی را انتخاب کنید، سپس روی آن کلیک کنید "آپلود + OCR".
  2. تنظیمات تشخیص مورد نظر خود را تنظیم کنید، صفحه دلخواه را برای استخراج متن انتخاب کنید و روی دکمه کلیک کنید. "OCR".
  3. کمی پایین بروید و دکمه را پیدا کنید. دانلود.

    روی آن کلیک کنید و در لیست کشویی فرمت سند مورد نیاز برای دانلود را انتخاب کنید. پس از آن، فایل به پایان رسید با متن استخراج شده به کامپیوتر شما دانلود می شود.

این ابزار مناسب است و تمام کاراکترها را به اندازه کافی با کیفیت بالا تشخیص می دهد. با این حال، پردازش هر صفحه سند PDF وارد شده باید به طور مستقل راه اندازی شود و در یک فایل جداگانه نمایش داده شود. البته می توانید، بلافاصله نتایج تشخیص را به کلیپ بورد کپی کنید و آنها را با دیگران ادغام کنید.

با این وجود، با توجه به تفاوت های بالا، مقدار زیادی از متن با استفاده از NewOCR برای استخراج بسیار دشوار است. با همان سرویس فایل های کوچک با "انفجار" مقابله می کند.

روش 4: OCR.Space

یک منبع ساده و قابل درک برای دیجیتالی کردن متن به شما امکان می دهد اسناد PDF را شناسایی کنید و نتیجه را در فایل TXT بیابید. محدودیت تعداد صفحات وجود ندارد. تنها محدودیت این است که اندازه سند ورودی نباید بیش از 5 مگابایت باشد.

سرویس آنلاین OCR.Space

  1. ثبت نام برای کار با ابزار ضروری نیست

    فقط روی لینک بالا کلیک کنید و سند PDF را به وب سایت خود از طریق رایانه خود با استفاده از دکمه آپلود کنید "انتخاب فایل" یا از شبکه - با مرجع.
  2. در لیست کشویی "انتخاب زبان OCR" زبان سند وارد شده را انتخاب کنید.

    سپس با کلیک بر روی دکمه فرایند به رسمیت شناختن متن شروع می شود. "شروع OCR!".
  3. در پایان پردازش فایل، نتیجه در نتیجه را ببینید "نتیجه OCR'ed" و کلیک کنید دانلودبرای دانلود سند TXT به پایان رسید.

اگر فقط نیاز به استخراج متن از PDF دارید و قالب بندی نهایی در همه چیز مهم نیست، OCR.Space انتخاب خوبی است. تنها سند باید "تک تک" باشد، زیرا شناخت دو یا چند زبان در یک زمان در سرویس ارائه نشده است.

همچنین نگاه کنید به: آنالوگ رایگان FineReader

با ارزیابی ابزارهای آنلاین ارائه شده در این مقاله، باید توجه داشت که FineReader Online از ABBYY دقیق تر و دقیق تر عملکردهای OCR را مدیریت می کند. اگر حداکثر دقت تشخیص متن برای شما مهم است، بهتر است به طور خاص این گزینه را در نظر بگیرید. اما برای پرداخت آن، به احتمال زیاد، نیز باید.

اگر شما نیاز دارید که اسناد کوچک را دیجیتالی کنید و آماده باشید که خودتان خطاهای خود را در این سرویس اصلاح کنید، بهتر است از NewOCR، OCR.Space یا Free OCR آنلاین استفاده کنید.