مبدل PDF فارسي به Word

omid1979 · 5 آپریل 2005

سلام دوستان
كسي برنامه سراغ داره كه بشه PDF هاي فارسي را تبديل به WORD كرد ؟
برنامه Adobe Acrobat Pro رو امتحان كردم PDF فارسي رو نميتونه تبديل كنه . دنبال برنامه ميگردم كه PDF فارسي رو تبديل كنه . اگر كسي برنامه سراغ داده ممنون ميشم به من هم بگيد .
مرسي
اميد حسيني

rezadogar · 5 آپریل 2005

من شنیدم اکروبات ریدر نسخه me ( خاورمیانه ) این کار رو میکنه
ولی هنوز خودم امتحان نکردم

دوستان اگر مطلب فوق درسته لطفا بگید ، این برنامه رو تهیه کنیم
اگر برنامه دیگری نیز میشناسید لطفاً معرفی کنی
خیلی به این تبدیل نیاز دارم

PHA · 6 آپریل 2005

شما متون و عکسها رو در همون برنامه اکروبات ریدر کپی و پیست کن تو ورد.البته قبلش نشانگر موس رو تو برنامه تبدیلش کن به ابزار تکست سلکتور.

hamids54 · 6 آپریل 2005

پیشنهاد دوستمون PHA1 رو من دقیق نمیدونم عملی هست یا نه... ولی در اینباره تابحال چندین بار
و از جنبه های مختلف صحبت شده و نتیجه ای گرفته نشده. تا اونجائیکه من میدونم
PDF در واقع یک جور عکس از متن است... و برای اینکه شما عکس را به متن تبدیل کنید احتیاج
به نرم افزار های بسیار قدرتمندی دارید که OCR نام دارد. OCR های انگلیسی در بازار فراوان است
اما OCR فارسی در مرحله تولید است و مثل اینکه چندین سال شاید 20 سال طول بکشه تا مثل نمونه انگلیسی
کامل بشه... بهر حال در حال تکمیل شدن توسط مراکز تحقیقاتی ما هست.
در باره نرم افزار هائی که ادعا میشد اینکارو انجام میدن هم چندین نفر try کردن.. ولی نتیجه ای نگرفتن..

rezadogar · 6 آپریل 2005

در مورد OCR
____________

من این OCR
Readiris
رو از سایت سنباد
http://sanbad.com/index.php?ind=downloads&op=entry_view&iden=11
دانلود کردم
حجمش 16.7 مگه
به سه زبان انگلیسی فرانسه عربی میتونه متن هایی که عکس هستند رو به کاراکتر تبدیل کنه
با فتوشاپ پی دی اف رو عکس کردم دادم بهش نسبتاً خوب تبدیل کرد
اگر اشتباه نکنم 70 تا 80 درصد کار میکنه
فقط چون زبان عربی 4 حرف ¤گ چ پ ژ¤ رو نداره باید خودتون بطور دستی این 4 کاراکتر رو درست کنید.
دو تامشکل هست
1- باید پی دی اف رو صفحه به صفحه عکس کنی
2- بطور دستی 4 کاراکتر رو درست کنی

یه مزیت دیگری هم داره اینه که میتونید طوری تنظیمش کنید که مانند صفحه بندی اصلی فایل تبدیل رو تو ورد انجام بده.

PHA · 6 آپریل 2005

نه دوست عزیز Ocr برای کار با عکسه . اما PDF عکس نیست. من خودم چندین بار این کار رو کردم . یعنی براحتی متن رو از PDF انتخاب و در جای دیگه پیست کردم .

rezadogar · 6 آپریل 2005

PHA1 جان
ببیند پی دی افی که دارید وتونستید فارسی رو بدون مشکل کپی پیست کنید ، مهم اینه که با چه

برنامه ایی درست شده باشه

من وقتی با ورد فارسی می نویسم و توسط Jaw PDF Factory یا برنامه هایی مشابه که پی دی اف

درست میکنند ، پی دی اف درست میکنم.
یا
یک سری پی دی اف فارسی رو که از جاهای مختلف دانلود کردم و نمی دونم با چی درستش کردند

مشکل تبدیل به ورد و مشکل کپی پیست دارم .

ولی وقتی با برنامه open office فارسی مینویسم و پی دی اف درست میکنم ، دقیقا مثل شما

بدون مشکلی میتونم از پی دی اف درست شده، کپی پیست کنم یا اون رو به ورد تبدیل کنم .

در مورد ocr ، اگر مطلب من رو در پست 5 با دقت بخونی می بینی که گفتم ابتدا پی دی اف رو توسط

فتوشاپ به عکس تبدیل کردم و ...

PHA1 جان آیا شما با تمام پی دی اف های فارسی که دارید مشکل تبدیل به ورد رو ندارید؟ یا یکی از

اونها رو امتحان کردید؟

PHA · 6 آپریل 2005

راستش من اصلا اطلاعی از اینکه این پی دی اف ها با چه برنامه هایی درست میشن و چه فرقهایی با هم دارند ندارم. من هم قبلا یک فایل پی دی اف رو بدون مشکل در ورد پیست کردم و اصلا نمیدونم با چه برنامه ای ساخته شده بود. ولی واضحه که شما قبل از پیست کردن باید نوع فونت رو شناسایی و اون رو اینستال کنید. وگرنه نباید مشکلی باشه.

hamids54 · 7 آپریل 2005

روشی را که PHA1 معرفی کرد رو من یک بار امتحان کردم وموفق شدم که متن word رو بدست بیارم
و خیلی خوشحال شدم ... اما با pdf های دیگه امتحان نکردم که ببینم کار میکنه یا نه..

در باره OCR هم به نظر جالب میاد...و اگه فقط اون چند تا حرف باشه مسئله ای نیست... اما من فکر کنم
مشکل در فونتهای مختلف هست که اغلب اونها را support میکنه یا نه...خیلی مایل هستم تحقیق مختصری
رو انجام بدم ولی بدليل کمبود وقت به یک ماه دیگه موکول میکنم .. از همه دوستان تشکر میکنم.

rezadogar · 7 آپریل 2005

در مورد فونت باید امتحان کنم

yar1356 · 15 آپریل 2005

www.verypdf.com/pdf2word/index.html
امتحان نکرده ام.

hamids54 · 28 آگوست 2005

به نقل از PHA1 :
شما متون و عکسها رو در همون برنامه اکروبات ریدر کپی و پیست کن تو ورد.البته قبلش نشانگر موس رو تو برنامه تبدیلش کن به ابزار تکست سلکتور.

سلام به همگی
روشی رو که PHA1 معرفی کرد.. رو همون موقع من امتحان کردم وجواب داد.. و خیلی خوشحال شدم که یکی
از مشکلات اساسیم حل شده..ولی جدیدا با متون PDF ای مواجه شدم که با روش ذکر شده جواب نمیده..
و وقتی روی WORD میبرم.. یک همچین فونتهائی نمایش داده میشه...
å| ô ± …Ö}©†° Þú| øíý»ú| {†°üª| ‹± ²ô°ì~…°…ó| ºõ°ü~û|

و هر کاری کردم که تبدیل به لغات فارسی کنم.. نشد..

میخواستم از دوستان بپرسم که راه حلی میدونن؟

Humpop.com · 29 آگوست 2005

آقا مشکل اصلی در ساخت و طراحی OCR فارسی ، وجود دستخط های متفاوت هست . OCR فارسی الان توانایی استخراج متن از عکسهایی رو داره که متن تایپ شده ، اما توانایی استخراج متون دست خطی را نداره و افزودن این قابلیت وقت فوق العاده زیادی میبره ، چون به تعداد آدم ها دست خط وجود داره ، در زبان انگلیسی این کار به سرعت انجام شد به دلیل این که حروف جدا از هم بودند ، اما تو زبان فارسی چون حروف به هم چسبیده اند بنابراین به صورت دست خطی عمل میشود . اگر با کامپیوتر جیبی های i-mate کار کرده باشین با قابلیتی مشابه OCR مواجهه میشین . فوق العاده هم جالب هست . احسان چون تو شریف درس خونده باید اطلاعات خوبی از OCR داشته باشه ، همجنین محمد رضا هم ظاهرا یک کامپیوتر جیبی داره .

hamids54 · 30 آگوست 2005

به نقل از hamids54 :
سلام به همگی
روشی رو که PHA1 معرفی کرد.. رو همون موقع من امتحان کردم وجواب داد.. و خیلی خوشحال شدم که یکی
از مشکلات اساسیم حل شده..ولی جدیدا با متون PDF ای مواجه شدم که با روش ذکر شده جواب نمیده..
و وقتی روی WORD میبرم.. یک همچین فونتهائی نمایش داده میشه...
å| ô ± …Ö}©†° Þú| øíý»ú| {†°üª| ‹± ²ô°ì~…°…ó| ºõ°ü~û|

و هر کاری کردم که تبدیل به لغات فارسی کنم.. نشد..

میخواستم از دوستان بپرسم که راه حلی میدونن؟

مثل اینکه کسی جوابی برای مشکل من نداره..

اما چون HUMPOP.COM صحبت OCR فارسی رو بمیان کشید...علاقه مند شدم اخبار جدید در بارش بشنوم
چون خیلی وقته که دنبالش هستم.. در همین تالار و در طی چند ماه گذشته.. چندین بار و توسط چند نفر که تاپیک های جدیدی رو در اینباره باز کردن .. در اینباره صحبت کردیم.. ولی من شخصا نتیجه ای نگرفتم..
http://forum.persiantools.com/t16906.html

HUMPOP.COM جان .. شما گفتی که:...OCR فارسی الان توانایی استخراج متن از عکسهایی رو داره که متن تایپ شده داشته باشه. و توانائی خوندن متون دست خطی رو نداره...
میخواستم بپرسم.. همین قابلیت هم برای من خیلی مهمه و تا حالا دنبالش میگشتم.. اگه راهنمائی کنی.. چطوری اونو بدست
بیارم .. ممنون میشم..
اما در باره اینکه گفتی OCR های انگلیسی میتونن دست خط انگلیسی رو هم تشخیص بدن.. خیلی برام جالب بود..چون من نشنیده
بودم و هر چی OCR انگلیسی دیدم و خریدم.. فقط میتونستن متن تایپ شده رو بخونن.. بهر حال کار خیلی خیلی بزرگیه و اگه
فارسیش درست بشه.. خیلی کارا راحت میشه..

سجاد
www.iransalamat.com
http://community.iransalamat.com/index.php

yar1356 · 30 آگوست 2005

به نقل از hamids54 :
اما در باره اینکه گفتی OCR های انگلیسی میتونن دست خط انگلیسی رو هم تشخیص بدن.. خیلی برام جالب بود..

قابلیت اون توی ویندوز ایکس پی وجود داره امتحان کنید خیلی جالبه

مبدل PDF فارسي به Word

omid1979

Registered User

rezadogar

Registered User

PHA

Registered User

hamids54

Registered User

rezadogar

Registered User

PHA

Registered User

rezadogar

Registered User

PHA

Registered User

hamids54

Registered User

rezadogar

Registered User

yar1356

کاربر تازه وارد

hamids54

Registered User

Humpop.com

کاربر تازه وارد

hamids54

Registered User

yar1356

کاربر تازه وارد

بک‌لینک