نحوه کپي کردن متن فارسي موجود در pdf در word که بصورت عادي کپي نمي شود:
گاهي اوقات کپي کردن متن از داخل فايل pdf بصورت عادي غير ممکن است . براي حل اين مشکل ما بايد متن مورد نظر را بصورت عکس در نظر بگيريم و از طريق نرم افزار هاي موجود اقدام به تبديل آن بکنيم. براي اين کار ما نرم افزار ridiris را پيشنهاد ميکنيم.
همچنين ما براي تبديل عکس به متن از برخي سايتها بصورت آنلاين ميتوانيم استفاده کنيم. که البته مشکل اين سايتها اين است که زبان فارسي را پشتيباني نمي کند. و براي تبديل عکس به زبان انگليسي مناسب است.ما براي اين کار سايت http://www.onlineocr.net/ را پيشنهاد مي کنيم.
نحوه کار با نرم افزار ridiris:
پس از گزينه تايپ دستي، تکنولوژي OCR مخفف عبارت Optical character recognition مطرح ميشود. در اين روش که بهصورت نرمافزاري صورت ميگيرد، شما صفحات اسکن شده خود را در اختيار برنامه رايانهاي قرار ميدهيد. اين برنامه محتواي صفحه را بررسي کرده و با توجه به الگوريتمهاي تشخيص متن و ديگر روشهايي که در خود جاي داده است، حروف موجود را تشخيص داده، آنها را بازسازي کرده و بهطور خودکار آنها را در يک فايل جديد بهصورت متنهاي تايپ شده در اختيار شما قرار ميدهد.
در اين روش تشخيص زبانهايي مانند انگليسي که حروف آنها بهصورت جدا از هم نوشته ميشود، بسيار ساده است؛ اما پيچيدگيهاي زبان فارسي و قلمهاي متنوعي که اين زبان از آنها بهره ميبرد، موجب شده است زبان فارسي جزو يکي از دشوارترين زبانها براي استفاده از فناوري او. سي. آر باشد. اکنون در اين مقاله شما را با نرمافزاري آشنا ميکنيم که علاوه بر پشتيباني از 130 زبان مختلف، زبان فارسي را نيز پوشش داده و صفحات و تصاويري را که شامل متوني به زبان فارسي هستند به فايلهايي با متنهاي قابل ويرايش تبديل کند.
ايجاد پيديافهاي قابل جستجو: گاهي اوقات ممکن است فايل پيديافي را که در اختيار داريد از يک تصوير اسکن شده ايجاد شده يا فايل شما به زبان فارسي باشد، اما حروف فارسي در آن بهصورت کد شده باشد. در اين شرايط شما نميتوانيد از سادهترين قابليت فايلهاي پيدياف که همان جستجوي محتواي موردنظر است بهرهمند شويد. با نرمافزار Readiris و تبديل سريع و آسان فايلهاي پيدياف، ميتوان براحتي محتواي موردنظر در اين فايلها را جستجو کرد.
ذخيرهسازي روي ابرها: ذخيرهسازي اسناد ديجيتال روي سرورهاي ابري و دسترسي به آنها از هريک از دستگاههاي مورد نظر شما در هرکجاي دنيا از ديگر امکاناتي است که در نسخه جديد اين نرمافزار گنجانده شده است. شما ميتوانيد براحتي با واردکردن اطلاعات کاربري خود در سرويسهايي همچون Evernote، Dropbox، Box، Google Drive اسناد ديجيتال شده خود را در اين سرويسها ذخيره کنيد.
تبديل همزمان: يک صفحه يا هزار صفحه براي نرمافزار Readiris هيچ تفاوتي ندارد؛زيرا شما ميتوانيد به هر تعداد فايل يا يک فايل با هر تعداد صفحه را که قصد داشته باشيد در آن فراخواني کنيد. اين نرمافزار به شما اين اطمينان را ميدهد عمليات تبديل بدون کوچکترين مشکل و وقفهاي با بالاترين سرعت ممکن به انجام خواهد رسيد.
پشتيباني از 130 زبان مختلف: زبانهاي آسيايي، عربي، فارسي و بسياري از زبانهايي که حتي اسمشان هم تابهحال نشنيدهايد، توسط اين برنامه پشتيباني ميشوند و تقريبا شما ميتوانيد صفحات اسکنشده خود را در هر زباني که باشند به کمک اين برنامه به اسناد ديجيتال قابل ويرايش و جستجو تبديل کنيد.
نحوه کار با او. سي. آر
قدم اول: دانلود نرمافزار
قدم دوم: اسکن يا فراخواني
با اجراي نرمافزار ميتوانيد در بالا سمت چپ، دو عدد 1 و 2 را مشاهده کنيد. عدد يک به معناي فراخواني فايل موردنظر براي او. سي. آر است و عدد 2 گزينههاي لازم به منظور ذخيره فايل تايپي را در اختيار شما قرار ميدهد. براي استفاده از نرمافزار بايد ابتدا با استفاده از يکي از گزينههاي Scan يا From File، صفحه شامل متن موردنظرتان را اسکن کنيد يا فايل پيدياف، عکس و ديگر فرمتهاي پشتيباني شده با نرمافزار را از روي هاردديسک رايانه در آن فراخواني کنيد.
قدم سوم: تنظيم جزئيات
پس از فراخواني اطلاعات موردنظر، نرمافزار بهطور خودکار عمليات بررسي و تشخيص متن از روي عکس را آغاز ميکند. پس از اين عمليات، شما بايد در بخش language زبان اصلي و زبان دوم متن موردنظرتان را مشخص کنيد. براي مثال چنانچه متن شما به زبان فارسي است بايد زبان اصلي را روي farsi و زبان دوم را خالي بگذاريد.
همچنين در صورتيکه متن شامل محتواي فارسي و بهطور همزمان کمي هم متن انگليسي داخل آن است، بايد زبان اصلي را Farsi و زبان دوم را English قرار دهيد. همانطور که مشاهده ميکنيد در اين مرحله فهرستي از صفحات براي شما بهنمايش درآمده است و هرجا متني مشاهده شده باشد نيز با کادرهايي رنگي به حالت انتخاب درآمده است. در اين مرحله ميتوانيد با مراجعه به تب Zones به ويرايش بخشهاي موردنظر جهت تبديل و ويرايش کنيد. بهعنوان مثال شما ميتوانيد بخشهايي را که با نرمافزار شناخته نشده است، اضافه کنيد يا بخشهايي را که قصد نداريد عمليات تبديل متن روي آنها صورت گيرد، از حالت انتخاب خارج کنيد.
در ادامه با مراجعه به تب Page ميتوانيد به مديريت صفحات و اعمال تغييراتي همچون حرکت ميان صفحات، حذف صفحات خالي، اصلاح چرخش صفحات، ذخيرهسازي تصاوير و... بپردازيد.
تب Cloud Setup نيز گزينههاي لازم براي ذخيرهسازي اطلاعات کاربري در هر يک از سرويسهاي ابري را در اختيار شما قرار ميدهد.
قدم چهارم: ذخيره سند ديجيتال
در نهايت پس از اعمال تغييرات موردنظر و اصلاح مشکلات احتمالي در تشخيص متنها ميتوانيد با مراجعه به تب Home و مشخص کردن موارد موجود در بخش Output فايل ديجيتال شده را ذخيره کنيد.
براي مـــثال مـــيتوانيد نوع فايل را Microsoft Word 2007، 2010 قرار داده و روش ذخيرهسازي را نيز Save as File انتخاب کنيد.
در پايان با کليک روي آيکون Send که به شکل يک موشک کاغذي است، ذخيره فايل آغاز و ميتوانيد نتيجه عمليات تبديل را مشاهده کنيد.
منبع : jamejamonline.ir
meisamshafiei@yahoo.com