برگزیده های پرشین تولز

!چگونه يك جستجوي موفق داشته باشيم

moonomid

کاربر فعال علم و دانش
کاربر فعال
تاریخ عضویت
15 اکتبر 2004
نوشته‌ها
1,437
لایک‌ها
4
در سال 2000 حدود يكصدميليون پايگاه وب بر روي شبكه جهاني اينترنت وجوددارد و پيش بيني مي شود كه تنها پس از گذشت 2 سال ، در سال 2002 به 250 ميليون پايگاه برسد. با رشد تصاعدي حجم اطلاعات ، يافتن اطلاعات موردنظر در اين درياي پهناور كار مشكلي است و بكارگيري ابزارهاي جستجوي مناسب يكي از ضروريات كار باشبكه مي باشد.
موتورهاي جستجو از سال 1994 مورداستفاده قرار گرفتند. در ابتدا فعاليت آنها فقطجستجو در وب بود ولي با گذشت زمان ، خدمات ديگري از جمله فروش كالا، اجاره فضاي وب و پست الكترونيك ، تحليل سايتها و... به فعاليت آنها اضافه شد.

انواع موتور جستجو

1 - موتورهاي عمومي كه در كليه پايگاهها فارغ از نوع آن جستجو مي كنند. موتورهاي عمومي معروف عبارتند از: altavista.com, google.com, go.com, hotbot.com
2 - موتورهاي تخصصي در يك رشته خاص مانند اخبار "news.com"، تجارت "deja.com"، شركتها "yellow pages.com"،افراد "whowhere.com"، مقالات و انتشارات "infojump.com"
3 - موتورهاي تخصصي در خدمات اينترنت مانند گروههاي خبري و مباحثه "deja.com"، بهترين پايگاه "magellan.com".
4 - موتورهاي كلان ; اين موتورها عبارت مورد جستجو را همزمان به چند موتورجستجو داده و پاسخها را اولويت بندي كرده و با ذكر نام موتور جستجو نمايش مي دهند.مانند mamma.com,savvysearch.com
5 - نقطه شروع ; اينگونه سايتها موتورهاي جستجو را برحسب موضوعات مختلف معرفي مي كنند. درصورتي كه موتورهاي تخصصي و عمومي را نمي شناسيد از اين پايگاهها شروع كنيد. مانند allonesearch.com
6 - موتور اختصاصي پايگاهها; بعضي از پايگاههاي بزرگ مانند مايكروسافت ، جنرال الكتريك ،... از داخل پايگاه خود موتور جستجو دارند. جديدا مي توان از موتورهاي جستجو عمومي مانند hotbot,altavista,... در يك پايگاه جهت جستجو در آن استفاده كرد.
تقسيم بندي ديگري كه از موتور جستجو مي توان كرد، موتورهاي جستجوگر، و دوم موتورهايي است كه پايگاهها را دسته بندي موضوعي كرده اند و به آنها web directoryگفته مي شود. معروفترين آنها webcrawear,yahooاست . درحال حاضر اكثر موتورهاي جستجو دسته بندي موضوعي نيز دارند و در هر دسته و يا زيرشاخه هاي بعدي مي توان جستجو كرد.

نحوه كار موتورهاي جستجو


در اين مقاله فقط نحوه كار موتورهاي عمومي بررسي مي شود. موتورهاي عمومي ازبرنامه هايي معروف به crawler,robot و يا spiderبراي يافتن و مرور صفحات وب استفاده مي كنند. نحوه كار اين برنامه ها بدين صورت است كه با يافتن يك صفحه كلمات مورداستفاده در آن را شناسايي كرده و به جداول فهرست بانك اطلاعاتي خود اضافه مي كنند درواقع موتورها صفحات وب را در بانك اطلاعاتي نگهداري نمي كنند بلكه دربانك اطلاعاتي فهرستي از كلمات وآدرس صفحات مشمول اين كلمات مي باشد.
كار ديگر اين برنامه ها اين است كه به صفحات فهرست شده قبلي مراجعه كرده ودرصورت به روز شدن صفحات ، مجددا آنها را فهرست بندي مي كنند. ممكن است پايگاه موردنظرموجودنبوده وياآدرس آن عوض شده باشد. عوامل مهم در فهرست كردن يك صفحه وب ، تعداد وقوع كلمه در صفحه ، محل قرارگيري آن ، نوع فايلهاي مورداستفاده در صفحه ، درجه اهميت كلمه در صفحه با توجه به كليد واژه هاي تعيين شده توسط مالك صفحه و توضيحات آمده در بخش دستورات meta در شناسنامه صفحه مي باشد. موتورهاي جستجو باتوجه به حجم بانك اطلاعاتي و برنامه هايشان به پايگاههاي جديد مراجعه مي كنند ولي مطمئنا تمام پايگاههاي وب را شامل نمي شوند. بزرگترين موتور جستجوي عمومي حدود 500 ميليون صفحه وب را شامل مي شود. درصورتي كه مي خواهيد پايگاه وب شما به بانك اطلاعاتي يك موتور جستجو اضافه شود پايگاه وب خود را به آن موتور جستجو معرفي كنيد در صفحات وب ، در بخش دستورات شناسنامه اي صفحه ، كليد واژه هاي موردنظر خود را معرفي كنيد. موتورهاي جستجوعمومي به دو روش كلمات را فهرست بندي مي كنند.

1- keyword indexing اغلب موتورهاي جستجو براساس كلمات فهرست بندي مي كنند.درواقع درجستجوكلمات هم معني راتشخيص نمي دهند.
concept based indexing - 2براساس مفهوم كلمه فهرست بندي مي كنند. بدين ترتيب كه اگر شما به دنبال كلمه y2kبگرديد، صفحاتي كه كلمات 2000 year problem نيز در نتايج مي آيد.
معروفترين موتوري كه براساس مفهوم جستجو مي كند excite.com مي باشد.
نكته ديگري كه در فهرست بندي بايد بدانيد اين است كه هر موتور چه بخشهايي ازيك صفحه را فهرست مي كند. براي مثال ممكن است فقط hyperlink,heading, titleها ويا چند خط اول صفحه را فهرست كند. در برخي از موتورهاي جستجو مانند opentextمي توان تعيين كرد كه كلمه مورد جستجو در كجاي صفحه باشد. براي مثال در...,heading,title نكته ديگر كلمات معروف به stop word هستند مانندweb,and,or,the,is,an,a و... بعضي از موتورها اين كلمات را درنظر نمي گيرند.

عوامل مهم در انتخاب موتور جستجو


عوامل زيردرانتخاب موتورجستجومهم هستند:
حجم بانك اطلاعاتي موتور جستجو و تعداد صفحات مرور شده توسط آن
به روز بودن بانك اطلاعاتي
تعداد صفحات مرورشده در روز
سرعت برگرداندن نتايج جستجو
تعداد سرويس دهنده هاي آن در شبكه اينترنت جهت كاهش ترافيك و افزايش سرعت
نحوه نمايش نتايج جستجو و كنترل آن توسط كاربر
نحوه اولويت بندي نتايج حاصله و ارتباط آنها با يكديگر و كنترل آن توسط كاربر
راحتي استفاده
صفحات معرفي شده به آن طي چند روز در فهرست قرار مي گيرند
پشتيباني ,imagemap,frameامنيت در پايگاهها
قابليت جستجو در نتايج
پشتيباني stop words
حساس به حروف بزرگ و كوچك
پشتيباني عبارت
عدم محدوديت درتعدادحروف عبارت جستجو
دسته بندي موضوعي وامكان جستجودرهردسته
جستجو در خدمات اينترنت شامل وب ، گروههاي خبري و مباحثه ،...
پشتيباني عملگرهاي جستجو
پشتيباني زبانهاي مختلف وتبديل زبانهابه يكديگر
جستجو براساس تاريخ
ارائه امكانات بهتر از جمله ارسال نتايج به آدرس پست الكترونيك ، ارائه تبليغات "banner" مرتبط با عبارت .
جستجو براساس نوع فايل مانند تصوير
جستجو در مكان خاصي از صفحه وب
جستجو در دستورات "tag" صفحه وب
ارائه كليد واژه ها و نتايج مشابه

عملگرهاي جستجو


عملگر REQUIRED TERM "+" وقتي اين عملگر در كنار يك كلمه مي آيد به معني اين است كه كلمه موردنظر حتما در صفحه باشد.
عملگر PROHIBITED TERM"-" با گذاشتن اين عملگر كنار كلمه ، صفحاتي آورده مي شود كه كلمه موردنظر در آن نباشد، در مثال language-english +تمام صفحاتي آورده مي شود كه كلمه language در آن باشد ولي زبان english در آنها نباشد.
عملگر PROXIMITY كلمات موردنظر در كنار هم و يا نزديك هم باشند. با عملگرnear/n دو كلمه به تعداد n كلمه نزديك يكديگر باشند. با عملگر followed byمابين دوكلمه ، دوكلمه دقيقا در كنار هم و با ترتيب قيدشده بيايند. موتور جستجوي webcrawler قويترين موتور در زمينه PROXIMITY است .
عملگرWILDCARD"* ويا$" با اين عملگر براي مثال radio* تمام صفحاتي كه كلمه radio و مشتقات آن را داشته باشد مي آورد. مثل كلمه radiology، باتوجه به موتور،تعداد حروف آورده شده بعداز كلمه متفاوت خواهدبود.
عملگر منطقي BOOLEAN شامل AND NOT, OR, AND با استفاده از ANDمابين دوكلمه صفحاتي كه هم كلمه اول وهم كلمه دوم را شامل شود مي آورد. با استفاده ORمابين دوكلمه ، صفحاتي كه يا كلمه اول و يا كلمه دوم را شامل شود مي آورد.
بااستفاده AND NOT مابين دوكلمه ، صفحاتي آورده مي شود كه شامل كلمه اول باشد و حتي شامل كلمه دوم نباشد. بجاي عبارت AND NOT,OR,AND مي توان ازنشانه هاي آن استفاده كرد:
& به جاي AND، ا به جاي OR و ! به جاي NOT
گروهبندي منطقي با استفاده از پرانتز () مثل : iran and "tourism or hotel"
استفاده از quotation mark براي مشخص كردن عبارت . " search engine" دقيقا دوكلمه به صورت يك عبارت در صفحه باشد. مي توان براي مشخص كردن عبارت ازعلامت |;بين كلمات استفاده كرد.
بسياري از موتورهاي جستجو در دو حالت ساده و پيشرفته "advanced" جستجومي كنند. معمولا درحالت پيشرفته ، عملگرهاي منطقي و PROXIMITY قابل استفاده مي باشد.

چگونه جستجوي بهتري انجام دهيم


بخاطر داشته باشيد كليد جستجوي موفق در اين است كه شما باهوش تر از كامپيوترهستيد.
ابتدا ببينيدكه به دنبال چه موضوعي هستيد باتوجه به انواع موتور جستجو كه درابتداي مقاله ذكر شد، موتور خود را انتخاب كنيد. قبل از جستجو لازم است با مراجعه به برنامه helpهر موتور دستورالعمل هاي آن را مطالعه كنيد تا حداكثراستفاده ازآن رابكنيد.عملگرهاي گفته شده دربالا معمولا دراكثرموتورهاقابل استفاده هستند.
علاوه بر نكات قيدشده در مقاله رعايت نكات ذيل كمك بسياري در انجام جستجوي بهتر دارد:
1 - از حروف بزرگ براي جستجو اسامي خاص ، شركتها و محصولات استفاده كنيد. درانگليسي بسياري از كلمات عام و خاص هستند مثلORACLE كه به معني الهام غيبي است ولي به صورت خاص ORACLE يك RDBMSاست .
2 - بعضي از كلمات از ساير كلمات مشتق شده است كوچكترين آن مجموعه را بدهيد.
3 - از كلمات مفرد استفاده كنيد جمع آن نيز در نتايج خواهدآمد.
4 - اگر تلفظ صحيح يك كلمه را نمي دانيد چند تلفظ را با هم بدهيد مثل : dostoyevski dostoevski dostoevsky
5 - از عبارت استفاده كنيد " best search engine "
6 - چند مترادف كلمه را باهم بدهيد.
secure security privacy safe
7 - مي توان درجه بندي نتايج را كنترل كرد و يا مي توان به يك كلمه در يك عبارت وزن بيشتري دادبراي مثال shopping shopping shopping mall
8 - از كلمات عمومي مثل كتاب car استفاده نكنيد بلكه با استفاده از عبارت ، دقيقا دريك زمينه ســــوال كنيـد بــــراي مثــــال اگر مي خواهيد ماشين بخريد نام ماشين و
شهر موردنظر خود را وارد كنيد
"toyota dealership" and texas
9 - بسياري از موتورهاي جستجو در كنار نتايج حاصله similar sites دارند كه امكان دسترسي به نتايج بهتر را مي دهند.
10 - تاريخ صفحات را مشخص كنيد.
11 - نوع زبان را مشخص كنيد.
در انتها پايگاههايي هستند كه مي توان از طريق آنها استراتژي جستجو را تعريف كرد.باتوجه به عوامل مهم ازنظر شما، موتور جستجوي مناسب را معرفي مي كند. نمونه آن noodlequest.com است .

موتورهاي جستجو


موتورهاي جستجو به دو دسته کلي تقسيم مي‌شوند. موتورهاي جستجوي پيمايشي و فهرستهاي تکميل دستي. هر کدام از آنها براي تکميل فهرست خود از روشهاي متفاوتي استفاده مي‌کنند که هر يک را بطور جداگانه مورد بررسي قرار مي‌دهيم:
موتورهاي جستجوي پيمايشي يا Crawler-Based Search Engines
موتورهاي جستجوي پيمايشي مانند A Google ليست خود را بصورت خودکار تشکيل مي‌دهند. آنها وب را پيمايش کرده و سپس کاربران آنچه را که مي‌خواهند از ميانشان جستجو مي‌کنند. اگر شما در صفحه وب خود تغييراتي را اعمال نماييد، موتورهاي جستجوي پيمايشي آنها را به خودي خود مي‌يابند و سپس اين تغييرات ليست خواهند شد. عنوان، متن و ديگر عناصر صفحه، همگي شامل اين ليست خواهند بود.
فهرستهاي تکميل دستي يا Human-Powered Directories
يک فهرست تکميل دستي مانند يک Open Directory مثل Dmoz وابسته به کاربراني است که آنرا تکميل مي‌کنند. شما صفحه مورد نظر را به همراه توضيحي مختصر در فهرست ثبت مي‌کنيد يا اين کار توسط ويراستارهايي که براي آن فهرست در نظر گرفته شده انجام مي‌شود.
عمل جستجو در اين حالت تنها بر روي توضيحات ثبت شده صورت مي‌گيرد و در صورت تغيير روي صفحه وب، روي فهرست تغييري بوجود نخواهد آورد. چيزهايي که براي بهبود يک فهرست‌بندي در يک موتور جستجو مفيد هستند، تاثيري بر بهبود فهرست‌بندي يک دايرکتوري ندارند. تنها استثناء اين است که يک سايت خوب با پايگاه داده‌اي با محتواي خوب شانس بيشتري به نسبت يک سايت با پايگاه داده ضعيف دارد.


موتورهاي جستجوي ترکيبي با نتايج مختلط

به موتورهايي اطلاق مي‌شود که هر دو حالت را در کنار هم نمايش مي‌دهند. غالبا، يک موتور جستوي ترکيبي در صورت نمايش نتيجه جستجو از هر يک از دسته‌هاي فوق، نتايج حاصل از دسته ديگر را هم مورد توجه قرار مي‌دهد. مثلا موتور جستجوي MSN بيشتر نتايج حاصل از فهرستهاي تکميل دستي را نشان مي‌دهد اما در کنار آن نيم نگاهي هم به نتايج حاصل از جستجوي پيمايشي دارد.

بررسي يک موتور جستجوي پيمايشي

موتورهاي جستجوي پيمايشي شامل سه عنصر اصلي هستند. اولي در اصطلاح عنکبوت (Spider) است که پيمايشگر (Crawler) هم ناميده مي‌شود. پيمايشگر همينکه به يک صفحه مي‌رسد، آنرا مي‌خواند و سپس لينکهاي آن به صفحات ديگر را دنبال مي‌نمايد. اين چيزيست که براي يک سايت پيمايش‌شده (Crawled) اتفاق افتاده است. پيمايشگر با يک روال منظم، مثلا يک يا دو بار در ماه به سايت مراجعه مي‌کند تا تغييرات موجود در آنرا بيابد. هر چيزي که پيمايشگر بيابد به عنصر دوم يک موتور جستجو يعني فهرست انتقال پيدا مي کند. فهرست اغلب به کاتالوگي بزرگ اطلاق مي‌شود که شامل ليستي از آنچه است که پيمايشگر يافته است. مانند کتاب عظيمي که فهرستي را از آنچه که پيمايشگرها از صفحات وب يافته‌اند، شامل شده است. هرگاه سايتي دچار تغيير شود، اين فهرست نيز به روز خواهد شد.
از زماني که تغييري در صفحه‌اي از سايت ايجاد شده تا هنگاميکه آن تغيير در فهرست موتور جستجو ثبت شود مدت زماني طول خواهد کشيد. پس ممکن است که يک سايت پيمايش‌شده باشد اما فهرست‌شده نباشد. تا زمانيکه اين فهرست‌بندي براي آن تغيير ثبت نشده باشد، نمي‌توان انتظار داشت که در نتايج جستجو آن تغيير را ببينيم. نرم‌افزار موتور جستجو، سومين عنصر يک موتور جستجو است و به برنامه‌اي اطلاق مي‌شود که بصورت هوشمندانه‌اي داده‌هاي موجود در فهرست را دسته‌بندي کرده و آنها را بر اساس اهميت طبقه‌بندي مي‌کند تا نتيجه جستجو با کلمه‌هاي درخواست شده هر چه بيشتر منطبق و مربوط باشد.
 

♂MAJID

کاربر تازه وارد
تاریخ عضویت
28 مارس 2005
نوشته‌ها
1,239
لایک‌ها
2
سن
35
محل سکونت
HellioN !!!
مرسی
عالی و کار آمد بود
46.gif
90.gif
 

Benyaminj

کاربر فعال بازیهای کامپیوتری
کاربر فعال
تاریخ عضویت
24 آگوست 2005
نوشته‌ها
4,528
لایک‌ها
1,888
محل سکونت
Tehran
جالب بود..دستت درد نکنه:happy:
 

Persiana

مدیر بازنشسته
تاریخ عضویت
18 جولای 2005
نوشته‌ها
4,220
لایک‌ها
129
سن
47
محل سکونت
Persian Empire
منکه هميشه با اين عملگر PROHIBITED TERM"-" مشکل دارم!! ولي ممنون، مطالب جالبي بود.
 

من

کاربر قدیمی پرشین تولز
کاربر قدیمی پرشین تولز
تاریخ عضویت
18 مارس 2005
نوشته‌ها
1,402
لایک‌ها
167

♂MAJID

کاربر تازه وارد
تاریخ عضویت
28 مارس 2005
نوشته‌ها
1,239
لایک‌ها
2
سن
35
محل سکونت
HellioN !!!
به نقل از من :
آقا جون جدیدا msn عجب موتور جستجویی از خودش در وکرده ها ! خیلی جیگر بید
الان یه نگاه در وکنم ببینم جیگر بید یا نبید
 

Persiana

مدیر بازنشسته
تاریخ عضویت
18 جولای 2005
نوشته‌ها
4,220
لایک‌ها
129
سن
47
محل سکونت
Persian Empire
آقا جون جدیدا msn عجب موتور جستجویی از خودش در وکرده ها ! خیلی جیگر بید
البته همه چيز مربوط به مايکروسافت اصولا خيلي جيگر بيد ولي اين جستجوي تصاويرش هنوز خيلي کار داره تا به پاي گوگل برسه (با پوزش از عمو بيلي عزيز
40.gif
).
 
بالا