• پایان فعالیت بخشهای انجمن: امکان ایجاد موضوع یا نوشته جدید برای عموم کاربران غیرفعال شده است

Persian OCR

rezadignity

کاربر تازه وارد
تاریخ عضویت
30 ژانویه 2005
نوشته‌ها
1,588
لایک‌ها
6
محل سکونت
Iran
مساله OCR فارسي اصلا مساله ساده‌اي نيست.شما در انگليسي 26 حرف داريد كه كلا به 52 حالت (كوچيك و بزرگ) نوشته ميشه ولس در فارسي 32 حرف هست كه بعضي از حروف مثل ع چهار حالت دارند.مساله بعدي هم مشكل چسبيده بودن حروف به همديگست كه دقت را خيلي مياره پايين.
خلاصه كار سختيه.مخصوصا براي دستخط كه فكر كنم اصلا امكان نداشته باشه.
ولی در اداره جات از OCR و اون هم برای دست خط استفاده میشه ها؟ نمونه اش همین فرم ثبت نام موبایل ( اینو مطمئن نیستم ) یا فرم ثبت نام کنکور و این چیزا .....
وقتی برای دست خط هست حتما میشه برای فونت OCR با کیفیت مناسب نوشت. روی هم رفته به نظر من یک کار اساسی و شدنیه ، درسته که سخته ولی شرکتهای پدر و مادر دار میتونن بنویسن. مخصوصا اگر برای فونت باشه.

الان يك محصول توي بازار هست مال شركت "هوش مصنوعي رايورز" با قيمت فكر كنم 300000 تومان يا دويست هزارو خرده اي كه اونم كارش صد در صد نيست.
کسی رو سراغ نداری که داشته باشه و رو اینترنت شیر کنه؟ ثواب داره هـــــــــــــا:D :D
در مورد پست بالا نظرتون چیه؟ راه خوبی میتونه باشه از هر کی بر نیاد از HP که بر میاد ، بخصوص که بازار کشورهای الفبایی یعنی ایران و کشورهای عربی بازار بزرگی برای HP به حساب میاد.
 

arashcs

Registered User
تاریخ عضویت
3 فوریه 2006
نوشته‌ها
178
لایک‌ها
4
راه راه حل خوبیه.
الانم میگن hp رو بعضی از اسکنرهاش ocr عربی میذازه(البته میگن ولی من ندیدم).
تو بازار رضا هم فرشتگان عربیشو داره میده حدود 5-6 هزار.ولی فقط تایپ شده رو میخونه و سرعتشم میگفتن پایینه.
کلا بحث ocr فارسی از انگلیسی جداست و برنامه باید از اول طراحی بشه و کار خیلی سخت تری هم هست.تازه اگرم درست کنند اولا تو ایران کی میخواد ازشون بخره ثانیا هم بعیده که زیر 400-500 دلار بفروشند.معروفترین شرکتهایی که تو این زمینه فعالیت دارند Scansoft هست و abby که بقیه هم از محصولات اونها استفاده میکنند.

به نظر من مساله مهمتر از OCR ساخت نرم افزار Speech Recognize به زبان فارسی هست که تا حالا هیچ فعالیتی در موردش نشده و حتی عربیشم فکر کنم نباشه.در مورد این مساله هم sr برای فارسی باز از همه زبونها سخت تره چون ما مثلا 4 نوع "ز" داریم ولی همرو یکجور تلفظ میکنیم.مگر اینکه به برنامه یک لغت نامه بزرگ بدیم که اونم مشکلات خودشو داره. خلاصه اگر sr فارسی بیاد خیلی از مشکلات حل میشه و البته صنف تایپیستها هم تا حدی بیکار میشن.

میمونه آخرین راه حل که هم سریعه هم راحت.ما هم مثل ترکها طرز نوشتنمون را لاتین کنیم.اینطوری دیگر نه تنها احتیاجی به ocr فارسی نداریم بلکه احتیاج به هیچ فارسی سازی برای هیچ برنامه ای نخواهیم داشت.و 90 درصد مشکلات و ناسازگاریها حل میشه.
انشالله که این کار صورت بگیره.
 

rezadignity

کاربر تازه وارد
تاریخ عضویت
30 ژانویه 2005
نوشته‌ها
1,588
لایک‌ها
6
محل سکونت
Iran
بر خلاف نرم افزار که در ایران به صورت غیرقانونی و کرک شده در دست مردم هست سخت افزار مانند دیگر کشورهای جهان در ازای پرداخت قیمت تعیین شده خرید و فروش میشه. به همین دلیل شرکتهایی مثل HP و رقیبانش از لحاظ فروش در ایران با معضلی به نام کرک و این حرفا روبرو نیستند. در نتیجه ارائه Ocr فارسی به همراه پرینتر میتونه بازار رو از دست رقیبان خارج کنه و سود سرشاری به جیب این شرکتها بریزه.

از نظر توجه پذیری مالی هم هیچ مشکلی نیست. چون بازار ایران با بازار کشورهای عربی با تفاوت کمی از نظر الفبایی هستند و ساختن یک Ocr برای کشورهای عربی و گسترش آن برای زبان فارسی کاملا منطقی است. بازار کشورهای عربی و ایران روی هم رفته بازار بزرگی به حساب میاد.

در مورد دگرگون کردن الفبای فارسی به لاتین به نظر من لزومی نداره ، این الفبا با تاریخ و فرهنگ ایران گره خورده و نباید به خاطر یک Ocr و مواردی از این قبیل که با کمی دقت و حوصله می توان آنرا ساخت دست به چنین اقداماتی زد.
در مورد تشخیص صوت هم نظر من اینه که باید زیاف فارسی عربی زدایی بشه و حروف عربی هم از الفبای فارسی بیرون رانده بشه. این بهترین راه حله!

خوب کسی پیدا میشه که راههای تماس با شرکتهای بزرگ رو بدونه؟ اگر ایمیلی چیزی پیدا بشه و از بچه های فروم خواسته بشه که تماس بگیرن خیلی جالب خواهد شد.
 

mehdixp

Registered User
تاریخ عضویت
1 نوامبر 2003
نوشته‌ها
327
لایک‌ها
1
به نقل از rezadignity :
بر خلاف نرم افزار که در ایران به صورت غیرقانونی و کرک شده در دست مردم هست سخت افزار مانند دیگر کشورهای جهان در ازای پرداخت قیمت تعیین شده خرید و فروش میشه. به همین دلیل شرکتهایی مثل HP و رقیبانش از لحاظ فروش در ایران با معضلی به نام کرک و این حرفا روبرو نیستند. در نتیجه ارائه Ocr فارسی به همراه پرینتر میتونه بازار رو از دست رقیبان خارج کنه و سود سرشاری به جیب این شرکتها بریزه.

خوب کسی پیدا میشه که راههای تماس با شرکتهای بزرگ رو بدونه؟ اگر ایمیلی چیزی پیدا بشه و از بچه های فروم خواسته بشه که تماس بگیرن خیلی جالب خواهد شد.

به اين نكته توجه كن كه معمولا شركتهاي سخت افزاري به غير از درايور ساير نرم افزارهايي كه همراه دستگاهشون ميدن را خودشون نمينويسند بلكه LICENSE فروش همراه دستگاه را از شركت سازنده نرم‌افزار ميخرند.مثلا اكثر شركتهاي اسكنر سازي Abbyy Fine Reader را همراه دستگاه ميدن.
و اين نكته را هم توجه كن كه نسخه‌اي كه همراه سخت‌افزار داده ميشه در 99 درصد مواقع نسخه Lite و با امكانات محدود هست و معمولا يك نسخه هم قديميتره.
 

rezadignity

کاربر تازه وارد
تاریخ عضویت
30 ژانویه 2005
نوشته‌ها
1,588
لایک‌ها
6
محل سکونت
Iran
به نقل از mehdixp :
به اين نكته توجه كن كه معمولا شركتهاي سخت افزاري به غير از درايور ساير نرم افزارهايي كه همراه دستگاهشون ميدن را خودشون نمينويسند بلكه LICENSE فروش همراه دستگاه را از شركت سازنده نرم‌افزار ميخرند.مثلا اكثر شركتهاي اسكنر سازي Abbyy Fine Reader را همراه دستگاه ميدن.
و اين نكته را هم توجه كن كه نسخه‌اي كه همراه سخت‌افزار داده ميشه در 99 درصد مواقع نسخه Lite و با امكانات محدود هست و معمولا يك نسخه هم قديميتره.
خوب فرقی نمیکنه خودشون بنویسند یا بدن به شرکتهای دیگه ، مهم اینه که اونا با پول و اعتباری که دارن وقتی کاری رو سفارش بدن نتیجه اش درست و حسابی از آب در میاد.
اگر Ocr فارسی نوشته بشه من یکی همیشه از ورژن اولش استفاده می کنم ورژنهای جدیدش پیشکش!:D

حالا پایه پیدا میشه بریم رو مخ اچ پی و این شرکتا؟ اگر برای فارسی راه نیومدند با ذکر اینکه اختلاف الفبای فارسی با عربی در چهار حرف ناقابل " گ چ پ ژ " هست حتما یکی فکری برای دو تاش می کنند. باید گفت ما مشتری شما هستیم و مثلا فلان مدل پرینتر و یا اسکنر شما رو داریم و تو کف Ocr به زبان خودومون موندیم. شما وظیفه دارید از مشتری خودتون پشتیبانی کنید و از این حرفا ...
آدرسی ، ایمیلی چیزی برای مخ زنی سراغ ندارید؟

میگم نکنه نایابی Ocr نتیجه توطئه شوم از سوی تکثیراتی ها و تایپیستها است؟:eek: :wacko:
 

rezadignity

کاربر تازه وارد
تاریخ عضویت
30 ژانویه 2005
نوشته‌ها
1,588
لایک‌ها
6
محل سکونت
Iran
این نبش قبر نیست ، موضوع بحث همچنان تازه است.


یه OCR فارسی هست ساخت یک شرکت ایرانی قیمتش هم 470 هزار تومنه ، حالا فکر می کنید می ارزه بریم تو کارش؟ دسته جمعی؟ یه نفره ؟:eek: :eek: :wacko:
 

god

Registered User
تاریخ عضویت
20 سپتامبر 2004
نوشته‌ها
56
لایک‌ها
0
پس به همین قانع باشید

http://www.tebyan.net/download/new/download.asp?fileid=698

نام برنامه : READIRIS PRO V8.0 ARABIC 2003
برنامه اي براي تبديل کردن عکس به متن. اساس کار اين نرم افزار بر مبناي OCR مي باشد. يعني با تشخيص حروف بر روي يک تصوير آن را به متن تبديل مي کند. اين برنامه توانايي OCR کردن متن هاي عربي و به تبع آن فارسي را دارد. تعجب نکنيد. فايلهاي PDF تصويري فارسي را به WORD تبديل کنيد. اين برنامه کامل است و هيچ محدوديتي ندارد. بعد از نصب و اجرا بايد زبان ARABIC را از قسمت LANGUAGE انتخاب کنيد. اين برنامه را در هيچ سايت ديگري پيدا نخواهيد کرد و اولين بار توسط تبيان بر روي اينترنت قرار داده شده است. شرکتهاي ايراني زيادي هم بر روي OCR متنهاي فارسي کار مي کنند و بيشتر کاربران نمي دانند که چنين نرم افزار خارجي هم براي اين کار وجود دارد. هرچه کيفيت تصوير اسکن شده بهتر باشد درصد خطاي اين برنامه در تشخيص متن کاهش پيدا مي کند.
حجم فايل : 39.3MB


موضوع : Utility
تعداد دفعات دانلود شده : 5732
مجوز استفاده : آزاد و کامل ( Free )

http://www.tebyan.net/download/new/download.asp?fileid=698
 

aliali1262

Registered User
تاریخ عضویت
3 سپتامبر 2005
نوشته‌ها
64
لایک‌ها
1
به نقل از god :
پس به همین قانع باشید

http://www.tebyan.net/download/new/download.asp?fileid=698

نام برنامه : READIRIS PRO V8.0 ARABIC 2003
برنامه اي براي تبديل کردن عکس به متن. اساس کار اين نرم افزار بر مبناي OCR مي باشد. يعني با تشخيص حروف بر روي يک تصوير آن را به متن تبديل مي کند. اين برنامه توانايي OCR کردن متن هاي عربي و به تبع آن فارسي را دارد. تعجب نکنيد. فايلهاي PDF تصويري فارسي را به WORD تبديل کنيد. اين برنامه کامل است و هيچ محدوديتي ندارد. بعد از نصب و اجرا بايد زبان ARABIC را از قسمت LANGUAGE انتخاب کنيد. اين برنامه را در هيچ سايت ديگري پيدا نخواهيد کرد و اولين بار توسط تبيان بر روي اينترنت قرار داده شده است. شرکتهاي ايراني زيادي هم بر روي OCR متنهاي فارسي کار مي کنند و بيشتر کاربران نمي دانند که چنين نرم افزار خارجي هم براي اين کار وجود دارد. هرچه کيفيت تصوير اسکن شده بهتر باشد درصد خطاي اين برنامه در تشخيص متن کاهش پيدا مي کند.
حجم فايل : 39.3MB


موضوع : Utility
تعداد دفعات دانلود شده : 5732
مجوز استفاده : آزاد و کامل (

Free )




http://www.tebyan.net/download/new/download.asp?fileid=698


فارسي ندارد دانلود كردم
 

god

Registered User
تاریخ عضویت
20 سپتامبر 2004
نوشته‌ها
56
لایک‌ها
0
به نقل از aliali1262 :
فارسي ندارد دانلود كردم
بعد از نصب و اجرا بايد زبان ARABIC را از قسمت LANGUAGE انتخاب کنيد
عربی دارد یعنی فقط حروف گچ پژ هست که در زبان عربی نیست ولی زیان فارسی و عربی در بقیه حروف مشترکند منظور هم همین است یعنی زیان فارسی بدون حروف گچ پژ که در زبان عربی نیست خلاصه زیان عربی را دارد
 

rezadignity

کاربر تازه وارد
تاریخ عضویت
30 ژانویه 2005
نوشته‌ها
1,588
لایک‌ها
6
محل سکونت
Iran
این ایمیل آدرس رو بمباران کنید شاید از رو رفتن و ورژن خاورمیانه رو برای دانلود ترایال گذاشتن!

arnaud.destree[at]irislink[dot]com

البته به روی خودتون نیارید که ایرانی هستین! چون اونا میدونن از طرف ایرانی پولی بهشون داده نمیشه! فقط بگین از خاورمیانه هستید و قبل از دادن 1200 دلار پول باید برنامه رو امتحان کنید.
من ایمیل زدم و جواب منفی گرفتم ، اگر ایمیلها زیاد بشه شاید ترایالشو گذاشتن!

اصولا ترایال گذاشتن برای نرم افزار جز حقوق خریدار هست.
ایمیل زدین به این آدرس؟ باید بترکونین!
حتما ایمیل بزنین!
 

4ng3l

Registered User
تاریخ عضویت
17 فوریه 2006
نوشته‌ها
238
لایک‌ها
1
سن
35
محل سکونت
مشهد
سلام بچه ها من گرفتمش
هر کی خواست براش مجانی میفرستم
معرفتی - لوتی بازی
به خاطر این که قاطی پاتی نشه برید تو این تاپیک

http://forum.persiantools.com/t67612.html
 
بالا