• پایان فعالیت بخشهای انجمن: امکان ایجاد موضوع یا نوشته جدید برای عموم کاربران غیرفعال شده است

مبدل PDF فارسي به Word

omid1979

Registered User
تاریخ عضویت
2 آپریل 2004
نوشته‌ها
38
لایک‌ها
0
سلام دوستان
كسي برنامه سراغ داره كه بشه PDF هاي فارسي را تبديل به WORD كرد ؟
برنامه Adobe Acrobat Pro رو امتحان كردم PDF فارسي رو نميتونه تبديل كنه . دنبال برنامه ميگردم كه PDF فارسي رو تبديل كنه . اگر كسي برنامه سراغ داده ممنون ميشم به من هم بگيد .
مرسي
اميد حسيني
 

rezadogar

Registered User
تاریخ عضویت
10 اکتبر 2004
نوشته‌ها
14
لایک‌ها
0
من شنیدم اکروبات ریدر نسخه me ( خاورمیانه ) این کار رو میکنه
ولی هنوز خودم امتحان نکردم

دوستان اگر مطلب فوق درسته لطفا بگید ، این برنامه رو تهیه کنیم
اگر برنامه دیگری نیز میشناسید لطفاً معرفی کنی
خیلی به این تبدیل نیاز دارم
 

PHA

Registered User
تاریخ عضویت
24 ژانویه 2005
نوشته‌ها
806
لایک‌ها
5
شما متون و عکسها رو در همون برنامه اکروبات ریدر کپی و پیست کن تو ورد.البته قبلش نشانگر موس رو تو برنامه تبدیلش کن به ابزار تکست سلکتور.
 

hamids54

Registered User
تاریخ عضویت
14 مارس 2004
نوشته‌ها
449
لایک‌ها
0
پیشنهاد دوستمون PHA1 رو من دقیق نمیدونم عملی هست یا نه... ولی در اینباره تابحال چندین بار
و از جنبه های مختلف صحبت شده و نتیجه ای گرفته نشده. تا اونجائیکه من میدونم
PDF در واقع یک جور عکس از متن است... و برای اینکه شما عکس را به متن تبدیل کنید احتیاج
به نرم افزار های بسیار قدرتمندی دارید که OCR نام دارد. OCR های انگلیسی در بازار فراوان است
اما OCR فارسی در مرحله تولید است و مثل اینکه چندین سال شاید 20 سال طول بکشه تا مثل نمونه انگلیسی
کامل بشه... بهر حال در حال تکمیل شدن توسط مراکز تحقیقاتی ما هست.
در باره نرم افزار هائی که ادعا میشد اینکارو انجام میدن هم چندین نفر try کردن.. ولی نتیجه ای نگرفتن..
 

rezadogar

Registered User
تاریخ عضویت
10 اکتبر 2004
نوشته‌ها
14
لایک‌ها
0
در مورد OCR
____________

من این OCR
Readiris
رو از سایت سنباد
http://sanbad.com/index.php?ind=downloads&op=entry_view&iden=11
دانلود کردم
حجمش 16.7 مگه
به سه زبان انگلیسی فرانسه عربی میتونه متن هایی که عکس هستند رو به کاراکتر تبدیل کنه
با فتوشاپ پی دی اف رو عکس کردم دادم بهش نسبتاً خوب تبدیل کرد
اگر اشتباه نکنم 70 تا 80 درصد کار میکنه
فقط چون زبان عربی 4 حرف ¤گ چ پ ژ¤ رو نداره باید خودتون بطور دستی این 4 کاراکتر رو درست کنید.
دو تامشکل هست
1- باید پی دی اف رو صفحه به صفحه عکس کنی
2- بطور دستی 4 کاراکتر رو درست کنی

یه مزیت دیگری هم داره اینه که میتونید طوری تنظیمش کنید که مانند صفحه بندی اصلی فایل تبدیل رو تو ورد انجام بده.
 

PHA

Registered User
تاریخ عضویت
24 ژانویه 2005
نوشته‌ها
806
لایک‌ها
5
نه دوست عزیز Ocr برای کار با عکسه . اما PDF عکس نیست. من خودم چندین بار این کار رو کردم . یعنی براحتی متن رو از PDF انتخاب و در جای دیگه پیست کردم .
 

rezadogar

Registered User
تاریخ عضویت
10 اکتبر 2004
نوشته‌ها
14
لایک‌ها
0
PHA1 جان
ببیند پی دی افی که دارید وتونستید فارسی رو بدون مشکل کپی پیست کنید ، مهم اینه که با چه

برنامه ایی درست شده باشه

من وقتی با ورد فارسی می نویسم و توسط Jaw PDF Factory یا برنامه هایی مشابه که پی دی اف

درست میکنند ، پی دی اف درست میکنم.
یا
یک سری پی دی اف فارسی رو که از جاهای مختلف دانلود کردم و نمی دونم با چی درستش کردند

مشکل تبدیل به ورد و مشکل کپی پیست دارم .

ولی وقتی با برنامه open office فارسی مینویسم و پی دی اف درست میکنم ، دقیقا مثل شما

بدون مشکلی میتونم از پی دی اف درست شده، کپی پیست کنم یا اون رو به ورد تبدیل کنم .

در مورد ocr ، اگر مطلب من رو در پست 5 با دقت بخونی می بینی که گفتم ابتدا پی دی اف رو توسط

فتوشاپ به عکس تبدیل کردم و ...

PHA1 جان آیا شما با تمام پی دی اف های فارسی که دارید مشکل تبدیل به ورد رو ندارید؟ یا یکی از

اونها رو امتحان کردید؟
 

PHA

Registered User
تاریخ عضویت
24 ژانویه 2005
نوشته‌ها
806
لایک‌ها
5
راستش من اصلا اطلاعی از اینکه این پی دی اف ها با چه برنامه هایی درست میشن و چه فرقهایی با هم دارند ندارم. من هم قبلا یک فایل پی دی اف رو بدون مشکل در ورد پیست کردم و اصلا نمیدونم با چه برنامه ای ساخته شده بود. ولی واضحه که شما قبل از پیست کردن باید نوع فونت رو شناسایی و اون رو اینستال کنید. وگرنه نباید مشکلی باشه.
 

hamids54

Registered User
تاریخ عضویت
14 مارس 2004
نوشته‌ها
449
لایک‌ها
0
روشی را که PHA1 معرفی کرد رو من یک بار امتحان کردم وموفق شدم که متن word رو بدست بیارم
و خیلی خوشحال شدم ... اما با pdf های دیگه امتحان نکردم که ببینم کار میکنه یا نه..

در باره OCR هم به نظر جالب میاد...و اگه فقط اون چند تا حرف باشه مسئله ای نیست... اما من فکر کنم
مشکل در فونتهای مختلف هست که اغلب اونها را support میکنه یا نه...خیلی مایل هستم تحقیق مختصری
رو انجام بدم ولی بدليل کمبود وقت به یک ماه دیگه موکول میکنم .. از همه دوستان تشکر میکنم.
 

rezadogar

Registered User
تاریخ عضویت
10 اکتبر 2004
نوشته‌ها
14
لایک‌ها
0
در مورد فونت باید امتحان کنم
 

hamids54

Registered User
تاریخ عضویت
14 مارس 2004
نوشته‌ها
449
لایک‌ها
0
به نقل از PHA1 :
شما متون و عکسها رو در همون برنامه اکروبات ریدر کپی و پیست کن تو ورد.البته قبلش نشانگر موس رو تو برنامه تبدیلش کن به ابزار تکست سلکتور.

سلام به همگی
روشی رو که PHA1 معرفی کرد.. رو همون موقع من امتحان کردم وجواب داد.. و خیلی خوشحال شدم که یکی
از مشکلات اساسیم حل شده..ولی جدیدا با متون PDF ای مواجه شدم که با روش ذکر شده جواب نمیده..
و وقتی روی WORD میبرم.. یک همچین فونتهائی نمایش داده میشه...
å| ô ± …Ö}©†° Þú| øíý»ú| {†°üª| ‹± ²ô°ì~…°…ó| ºõ°ü~û|

و هر کاری کردم که تبدیل به لغات فارسی کنم.. نشد..

میخواستم از دوستان بپرسم که راه حلی میدونن؟
 

Humpop.com

کاربر تازه وارد
تاریخ عضویت
8 آگوست 2005
نوشته‌ها
42
لایک‌ها
0
آقا مشکل اصلی در ساخت و طراحی OCR فارسی ، وجود دستخط های متفاوت هست . OCR فارسی الان توانایی استخراج متن از عکسهایی رو داره که متن تایپ شده ، اما توانایی استخراج متون دست خطی را نداره و افزودن این قابلیت وقت فوق العاده زیادی میبره ، چون به تعداد آدم ها دست خط وجود داره ، در زبان انگلیسی این کار به سرعت انجام شد به دلیل این که حروف جدا از هم بودند ، اما تو زبان فارسی چون حروف به هم چسبیده اند بنابراین به صورت دست خطی عمل میشود . اگر با کامپیوتر جیبی های i-mate کار کرده باشین با قابلیتی مشابه OCR مواجهه میشین . فوق العاده هم جالب هست . احسان چون تو شریف درس خونده باید اطلاعات خوبی از OCR داشته باشه ، همجنین محمد رضا هم ظاهرا یک کامپیوتر جیبی داره .
 

hamids54

Registered User
تاریخ عضویت
14 مارس 2004
نوشته‌ها
449
لایک‌ها
0
به نقل از hamids54 :
سلام به همگی
روشی رو که PHA1 معرفی کرد.. رو همون موقع من امتحان کردم وجواب داد.. و خیلی خوشحال شدم که یکی
از مشکلات اساسیم حل شده..ولی جدیدا با متون PDF ای مواجه شدم که با روش ذکر شده جواب نمیده..
و وقتی روی WORD میبرم.. یک همچین فونتهائی نمایش داده میشه...
å| ô ± …Ö}©†° Þú| øíý»ú| {†°üª| ‹± ²ô°ì~…°…ó| ºõ°ü~û|

و هر کاری کردم که تبدیل به لغات فارسی کنم.. نشد..

میخواستم از دوستان بپرسم که راه حلی میدونن؟


مثل اینکه کسی جوابی برای مشکل من نداره..

اما چون HUMPOP.COM صحبت OCR فارسی رو بمیان کشید...علاقه مند شدم اخبار جدید در بارش بشنوم
چون خیلی وقته که دنبالش هستم.. در همین تالار و در طی چند ماه گذشته.. چندین بار و توسط چند نفر که تاپیک های جدیدی رو در اینباره باز کردن .. در اینباره صحبت کردیم.. ولی من شخصا نتیجه ای نگرفتم..
http://forum.persiantools.com/t16906.html

HUMPOP.COM جان .. شما گفتی که:...OCR فارسی الان توانایی استخراج متن از عکسهایی رو داره که متن تایپ شده داشته باشه. و توانائی خوندن متون دست خطی رو نداره...
میخواستم بپرسم.. همین قابلیت هم برای من خیلی مهمه و تا حالا دنبالش میگشتم.. اگه راهنمائی کنی.. چطوری اونو بدست
بیارم .. ممنون میشم..
اما در باره اینکه گفتی OCR های انگلیسی میتونن دست خط انگلیسی رو هم تشخیص بدن.. خیلی برام جالب بود..چون من نشنیده
بودم و هر چی OCR انگلیسی دیدم و خریدم.. فقط میتونستن متن تایپ شده رو بخونن.. بهر حال کار خیلی خیلی بزرگیه و اگه
فارسیش درست بشه.. خیلی کارا راحت میشه..

سجاد
www.iransalamat.com
http://community.iransalamat.com/index.php
 

yar1356

کاربر تازه وارد
تاریخ عضویت
5 مارس 2005
نوشته‌ها
59
لایک‌ها
0
سن
47
به نقل از hamids54 :
اما در باره اینکه گفتی OCR های انگلیسی میتونن دست خط انگلیسی رو هم تشخیص بدن.. خیلی برام جالب بود..

قابلیت اون توی ویندوز ایکس پی وجود داره امتحان کنید خیلی جالبه
 
بالا