• پایان فعالیت بخشهای انجمن: امکان ایجاد موضوع یا نوشته جدید برای عموم کاربران غیرفعال شده است

چرا یوز yooz.ir رو باید جدی بگیریم ؟

sayyid

کاربر تازه وارد
تاریخ عضویت
24 مارس 2015
نوشته‌ها
5
لایک‌ها
51
سن
39
محل سکونت
تهران
سلام خدمت کلیه‌ی دوستان
من یکی از بچه‌های تیم فنی موتور یوز هستم.
اومدم اینجا دیدم چه خبره!
سعی می‌کنم یکی یکی حرف‌هایی که زده شده رو پاسخ بدم. امیدوارم بحث خوبی اینجا در بگیره و درگیر حاشیه‌های بی‌خود نشیم.

خرید ماشین رو سرچ کردم
اولین لینکش خرید ماشین لباسشویی بود :D
خوب انتظار که ندارید یه موتور جستجوی تازه‌کار هر چی توش سرچ می‌کنید همه رو درست جواب بده! من شخصاً تمام جستجوهای فارسیم رو توی یوز می‌زنم، اکثراً جواب می‌گیرم. اونایی که جواب نمی‌گیرم می‌رم توی گوگل. البته مدتیه جستجوهای انگلیسیم رو هم توی یوز آزمایش می‌کنم، بعضی وقت‌ها جواب می‌گیرم، ولی در مجموع جوابای جستجوهای انگلیسی توی یوز اصلاً خوب نیست. دلیلش هم اینه که تمرکز ما تا به حال روی سایت‌های فارسی زبان بوده. ان‌شاءالله توی برنامه‌ی فاز بعدیمون (یعنی امسال) ورود به سایت‌های انگلیسی هست.
یه نکته هم همینجا بگم: نتیجه‌ی نوزدهم همین جستجو، سایت autotrader.ca هست که انگلیسی هست. قابل توجه دوستی که می‌گفت گوگل مترجمش رو با جستجوش تلفیق کرده (البته ما هنوز در این زمینه ادعایی نداریم چون راه خیلی طولانیه و کار زیاده. ولی اینطوری هم نیست که ما هیچ کاری نکرده باشیم!).

در مورد هزینه‌ی موتور: همونطور که یکی از دوستان اشاره کردند، کل هزینه‌ای که این موتور داشته ۷ میلیارد بوده نه ۱۷۰ میلیارد. اگه یه حساب خیلی ساده بکنید، می‌بینید که ۷ میلیارد خیلی هزینه‌ی کمی بوده. بیش از ۴ سال هزینه‌ی نیروها رو جمع بزنید با هزینه‌ی سرورها و پهنای باند و غیره.

اما در مورد این که گوگل هست و مگه ما بیکاریم موتور بسازیم و ...: دوستانی که نمی‌دونن اگه یه تحقیقی در مورد موتورهای جستجو بکنن، متوجه می‌شن که موتور جستجو در دنیا به عنوان لکوموتیو IT شناخته می‌شه. یعنی زیرساختی که موتور جستجو فراهم می‌کنه می‌تونه IT کشور رو تکون بده. گوگل هم از یه موتور جستجوی ساده شروع کرده و الان IT جهان رو داره تکون می‌ده. همین الان ما زیرساختی درست کردیم که باهاش می‌شه خیییییلی کارها انجام داد. به عنوان مثال انواع پروژه‌های دانشگاهی رو می‌شه تعریف کرد و بهشون سرویس داد. ما الان هم data داریم و هم قدرت پردازش کافی و هم تکنولوژی پردازش داده‌ی حجیم (big data).

اصلا معلوم نی بر اساس چی رتبه بندی میکنه
این رو قبول دارم که باید یه توضیح اجمالی در مورد الگوریتم‌های رتبه‌بندی‌مون منتشر کنیم تا دوستانی که می‌خوان کارهای seo انجام بدن بدونن چه کاری تأثیر داره. ان‌شاءالله در آینده‌ی نزدیک این کار رو می‌کنیم. ما تا به حال تقریباً تمام انرژی‌مون رو روی کار فنی موتور گذاشتیم و قصد داریم از این به بعد بیشتر روی ارتباط با کاربرا و مدیران سایت وقت بذاریم تا بتونیم کاربر جذب کنیم و سرویس خوبی ارائه بدیم. البته توجه کنید که پایه‌ی رتبه‌بندی توی تمام موتورهای جستجو یکسان هستن و یه سری نکات هستند که تفاوت ایجاد می‌کنن. بنابراین به طور کلی اگه یه سایت رفتار اسپم مانند داشته باشه، رتبه‌اش میاد پایین (البته دیگه این هنر موتوره که چقدر بتونه سایت‌های اسپم رو درست تشخیص بده، که همونطور که می‌دونید توی فارسی گوگل هم خیلی در تشخیص اسپم موفق نیست). یا مثلاً تیتر صفحه بخش مهمی هست، ولی اگه توی تیتر یه صفحه انشا بنویسید ارزشش میاد پایین! این کلیات توی موتور یوز هم هستن ولی در مورد جزئیاتش ان‌شاءالله بعداً توضیح می‌دیم.
اما این رو خیلی با قاطعیت می‌گم: ما هیچ کار خاصی توی رتبه‌بندی نتایج نکردیم که مثلاً فکر کنید فلان سایت رو همیشه بالاتر میاریم (با توجه به ارتباط تنگاتنگی که با تیم رتبه‌بندیمون دارم (چون الگوریتم‌های رتبه‌بندی باید توی index اعمال بشن)، در جریان ریز کارهاشون هستم). حتی ویکیپدیا رو هم یه مدت بهش فکر کردیم که توی نتایج بالاتر از بقیه‌ی سایت‌ها بیاریم، اما دیدیم نتایج به هم می‌ریزه و برگردوندیمش. یعنی شما توی رتبه‌بندی 1,000,000,000 صفحه، هر کاری که خارج از الگوریتم‌های هوشمند انجام بشه، کار رو کلاً خراب می‌کنه. یعنی اصلاً شدنی نیست که دستی فلان سایت رو توی نتایج بیاریم بالا! به جز تبلیغات که هنوز ما روش کار نکردیم.

همین بچه های متخصص داخل برای ساخت انتی ویروس شید از موتور ناد و کسپر استفاده کردن. من شک دارم کاملا تخصص داخلی باشه!
منظورتون رو متوجه نمی‌شم. یعنی انتظار دارن از هیچ کتابخونه‌ای استفاده نکنیم و همممممممه‌ی همه‌اش رو خودمون بنویسیم؟! مثلاً از MySql یا MSSql یا هر پایگاه داده‌ی دیگه‌ای استفاده نکنیم و خودمون بنویسیم!!! خوب قطعاً این کار منطقی نیست! همونطور که احتمالاً خبر دارید، گوگل هم از MySql استفاده می‌کرده که البته به MariaDb تغییر داده (نگفتم موتور جستجوش با MySql پیاده‌سازی شده ها! تو بخش‌هایی از سیستم‌های مختلفش از MySql استفاده می‌کنه) و حتی یه نیرو فرستاده کمک تیم MariaDb:
http://www.i-programmer.info/news/84-database/6386-google-drops-mysql-for-mariadb.html
(این صفحه رو با جستجوی «google mariadb» توی یوز پیدا کردم)
و همچنین یکی از کاربران اساسی MySql، فیس بوک هست:
http://www.mysql.com/customers/view/?id=757
صد البته این شرکت‌ها بعد از این که از این تکنولوژی‌ها استفاده می‌کنن، بعد از چند سال بهشون مسلط می‌شن و شروع می‌کنن توشون تغییرات اساسی می‌دن و در واقع تکنولوژی رو دستشون می‌گیرن.
خوب توی پروژه‌ی ما هم این اتفاق تو بخش‌های مختلف افتاده، با این تفاوت که موتور جستجوی متن‌باز آماده‌ای در scale ای که ما می‌خواستیم وجود نداشت که بگیریم ازش استفاده کنیم. برای همین بعد از امتحان کردن solution های مختلف، مجبور شدیم بیشتر بخش‌های موتور رو خودمون بسازیم (همونطور که می‌دونید گوگل و بینگ و غیره هیچ وقت نه کدشون رو منتشر می‌کنن و نه تکنولوژیشون رو). الان بعد از این همه کار، من که مسئول تیم index هستم خدمتتون می‌گم که به معماری distributed, scalable, realtime و fault-tolerant رسیدیم که دوستانی که زمینه‌ی نرم‌افزار داشته باشن می‌دونن که فراهم کردن همه‌ی اینها یا هم چقدر سخته. گوگل که ۱۷ ساله داره سرویس جستجو ارائه می‌ده، تنها چهار ساله که به معماری realtime رسیده. یعنی چی؟ یعنی این که اکثر موتورهای جستجو به صورت batch کار می‌کنن: یه index دارن که جواب جستجوهای کاربران رو می‌ده، و یه index دیگه دارن که به‌روزرسانی می‌شه. بعد از یه مدت (مثلاً هر هفته، یا هر شب) جای این دو تا رو با هم عوض می‌کنن و در نتیجه نتایجی که مثلاً دیروز خزش شدن، امروز توسط کاربرا دیده می‌شن. اما توی سیستم realtime، هر صفحه‌ای که خزش می‌شه، با یه فاصله خیلی کوتاه قابل جستجو می‌شه (که این فاصله توی موتور یوز حدود یک دقیقه هست).
توجه کنید! منظور من از این همه سخنرانی این نیست که موتور یوز خیلی هم خوب هست و هیچ مشکلی هم نداره و حرف هم نباشه! منظور اینه که توی بخش‌های مختلفی که موتور داره، ما سعی کردیم بهترین کار ممکن رو انجام بدیم و البته می‌دونیم توی رتبه‌بندی هنوز کار زیاد داریم. یه بخشی از این کار هم از طریق استفاده‌ی کاربرا از موتور انجام می‌شه. هر چقدر جستجو توی موتور بیشتر باشه، پروسه‌ی learning موتور بهتر انجام می‌شه.
نتیجه‌گیری اخلاقی: الان تکنولوژی موتور کاملاً در دست ماست و کاملاً بومی هست.

در مورد جستجوی «how i can paint my car»: دوست من ما هنوز روی انگلیسی تمرکز نکردیم. بعد هم شما یه مدت از یوز استفاده‌ی واقعی بکن، بعد بگو چقدر ازش راضی بودی. با یه جستجو که نمی‌شه چیزی رو نفی یا اثبات کرد!

والا تنها و بدترین مسئلش همین فیلتر شدن گوگل هستش اگه فیلتر بشه ننور الانور هستش دیگه
در مورد ف.ی.ل.ت.ر کردن گوگل: اصلاً قرار نیست چنین چیزی اتفاق بیافته. چون مشخصه که اگه این اتفاق بیافته، اولین کسی که ضررش رو می‌بینه، موتور یوز هست چون همه از چشم اون می‌بینن. بنابراین هیچ یک از مسئولین موتور قصد چنین کاری رو ندارن.
اون حرفی هم که یکی از دوستان زده که:
اگه کاربر حق انتخاب داشته باشه، هیچ مشکلی نیست.

هر کی خواست از گوگل استفاده کنه، هر کی خواست از این موتور جستجو و هرکی خواست از بینگ و یاهو. کسی هم معترض نیست. وبمسترها هم در همه موتورهای جستجوگر عضو خواهند شد.
دقیقاً حرفیه که ما می‌زنیم.

دقیقا به همین دلیل باید نباید استفاده کرد ، برای رسیدن به جایی که الان موتور های جستجوگر مثل یاندکس یا بایدو هستن باید 4-5 سال کار کنن (که همون رو هم نمیتونن )برید ببینید سایت های یاندکس یا بایدو چه دم دستگاهی دارن ، چه تیم های توسعه ای دارن ، الان این سایت یوز فوق اش 4-5 نفر باشن.

من خودم هیچ مخالفتی با موتور جستجوگر فارسی ندارم ، اگر بتونه من رو سریع تر به نتیجه برسونه ، چرا ازش استفاده نکنم ! اما وقتی در عمل باعث میشه به نتیجه ای که میخواهم نرسم ، با وجود ابزار بهتر هیج دلیلی عقلانی وجود نداره که بخواهم ازش استفاده کنم.
:|
دوست من، حداقل قبلش یه سر خبرای منتشر شده در مورد موتور یوز رو می‌خوندی! همونجا گفتن که هشتاد نفر روی این موتور کار کردن. بازم :|

بحثِ از ذهن رفتن و از ذهن نرفتن نیست. بحث اینه که درحال حاضر کسی نتونسته تکنولوژی به کار رفته توسط گوگل و همچنین سخت افزارهای مناسب + توجیه اقتصادیش رو فراهم کنه. حتی موتور جستجوی یاهو هم آخر سر کم آورد و با بینگ یکی شد و حالا که یاهو و بینگ هم با هم شدن، هنوز نتونستن به گرد پای گوگل هم برسن. (نمونه سادش زمان اندیکس کردن صفحاته. شما اگه یه سایت معمولی داشته باشی، گوگل به سرعت شاید در کمتر از یک روز، مطلبت رو اندیکس می کنه ولی یاهو و بینگ ممکنه تا 15 روز هم زمان ببره تا مطلب رو اندیکس کنن )
این که بینگ نتونسته به پای گوگل برسه، یه دلیل عمده داره: گوگل دیتای کاربرا رو داره! و البته یه زیرساخت خیلی قوی. ما توی موتورمون زیرساخت قوی داریم (نمی‌خوام با گوگل مقایسه کنم! در scale خودمون زیرساختمون مناسب هست)، ولی دیتای کاربرا رو نداریم! (البته توی این یکی دو ماهه یه مقداری دیتا به دست اوردیم که داریم روش کار می‌کنیم تا موتور از روش learn بشه) به لطف دوستانی هم که می‌گن ما از این موتور استفاده نمی‌کنیم هیچ وقت این دیتا رو به دست نخواهیم اورد! :|
اما یه نکته‌ی دیگه رو توجه کنید: بینگ داره تو scale بین‌المللی با گوگل رقابت می‌کنه در حالی که یوز می‌خواد تو ۳ فاز اولش در scale ایران با گوگل رقابت کنه. این خیلی فرق می‌کنه!

چطور باید وبسایت هامون رو توش ثبت کنیم ؟
خزشگر ما به صورت خودکار صفحات رو استخراج می‌کنه و خزش می‌کنه. اما بالاخره ممکنه یه سایتی رو پیدا نکنه، یا تعداد صفحاتی که از یه سایت داره کم باشه. برای رفع این جور موارد، می‌تونید آدرس سایتتون رو به [email protected] بفرستید تا سایت رو در اسرع وقت در فهرست خزش قرار بدیم.

این پروژه چیزی نیست جز یک اسپایدر و استفاده از تابع FULLTEXT .!
به قول فامیل دور: من دیگه حرفی ندارم!
دوست گرامی! اولاً که اون اسپایدر که شما می‌گی، برای خودش عظمتی داره! فقط در نظر داشته باش که بیش از چهار میلیارد link رو آماده داریم، که یک میلیاردشون رو خزش کردیم! و این یک میلیارد صفحه نیاز به update شدن دارن! علاوه بر این باید صفحات جدید هم گرفته بشن! حالا شما با توجه به محدودیت پهنای باند، باید بتونی از بین این چهار میلیارد صفحه انتخاب کنی که کدوم صفحات جدید خزش بشن، و کدوما update بشن!
ثانیاً همونطور که یکی از دوستان اشاره کرد، شما بیا و برای ما یک میلیارد صفحه رو با تابع FULLTEXT شاخص‌گذاری و جستجو کن! ببینم به ده برابر این زمانهای جستجویی که یوز داره جواب می‌ده می‌رسی؟! همونطور که قبلاً گفتم index ما توزیع‌شده، realtime، مقیاس پذیر (یعنی برای افزایش گنجایشش کافیه بهش سرور اضافه کنید و خود خوشه به صورت dynamic داده‌ها رو balance می‌کنه و نیازی به restart کردن و از این قبیل کارها نیست) و با قابلیت تحمل خطا هست (یعنی اگه یک یا چند سرور crash کنن، کل خوشه مشکلی پیدا نمی‌کنه و به صورت خودکار سرورهای دیگه رو جایگزین می‌کنه). حالا شما بیا این رو با FULLTEXT مقایسه کن!
یکی از دوستان هم گفته بودن:
بحث رو فنیش نکنید . چون مسلما یک میلیارد رکورد شامل محتوا نیستن و محتوا به صورت Hash های فایلی با استفاده از ژورنال های کاستوم نگهداری میشن که قابلیت جستجوی این ژورنال ها در برابر fulltext مثل 1 به 100 هست . نمونه اش تو نرم افزار های کتابخانه دیجیتال مرکز تحقیقات مخابرات استفاده شده .
در جواب باید بگم که نخیر این طور نیست و تمام یک میلیارد رکورد ما دارای محتوای کامل صفحه هستن. تمام هنر ما هم همین بوده! البته روی کوتاه کردن متن صفحات کارهایی کردیم، اما کار سختیه که بتونید متن رو کوتاه کنید، و کیفیت جستجو رو از دست ندید (بعضی وقت‌ها جستجو روی کلمات خاصی هست که ممکنه شما موقع کوتاه کردن متن حذفش کرده باشید و در نتیجه، نتیجه‌ی جستجوتون خراب خواهد شد).
فقط بگم که حجم index ما بیش از دو ساله که از یک ترابایت گذشته.

این خودش از bing میگیره اگه اشتباه نکنم :|
خوب دوست من اشتباه می‌کنی! :) ما crawler و index خودمون رو داریم و کاری به bing یا گوگل یا هر موتور دیگه‌ای نداریم. البته انصافاً واقعاً خوشحال شدم که شما از لفظ «اگه اشتباه نکنم» استفاده کردید. مورد داشتیم توی یه فروم دیگه یه بنده خدایی با اطمینان کامل گفته بود که یوز از بینگ استفاده می‌کنه! :)

ریپورتش کنیم به گوگل بعنوان اسپم و کلیک دزد؟:confused:
الکساش شد 845
دوست من ما از هیچ تکنیک خاصی برای دزدیدن کلیک و بالا بردن رتبه‌ی الکسا استفاده نمی‌کنیم چون این کار برای موتور جستجو بی‌معنیه. یعنی ایده زیاد داشتیم ها! ولی استفاده نکردیم (می‌تونید سایت رو زیر و رو کنید تا ببینید هیچ کار اضافه‌ای توی موتور انجام نمی‌شه، بر خلاف سایت‌هایی که تا یه جا کلیک می‌کنی ده تا popup باز می‌کنن!). البته رتبه‌ی الکسامون به ۱۱۹ هم رسید که به خاطر استفاده‌ی کاربرا بوده نه چیز دیگه‌ای. البته‌تر(!) این که الان رتبه‌ی الکسامون توی ایران افت کرده (جهانیش داره هنوز رشد می‌کنه) که دلیلش ضعف ما توی تبلیغات بوده و این که به هر دلیل نتونستیم همه‌ی کاربرامون رو حفظ کنیم. این رو می‌دونیم و داریم سعی می‌کنیم کیفیت سرویس رو بالاتر ببریم تا بتونیم کاربرا رو نگه داریم.

هم yooz و هم gorgor از یه اسکریپت دارند استفاده می کنند!!!
حالا چه نیازی بود که دوتا موتور جستجوی یکسان راه اندازی بشه و پول حروم بشه خدا عالمهo_O
در جواب باید بگم که همونطور که قبلاً هم مدیر پروژه توضیح داده ( http://itiran.com/d/68499 ) تیم یوز از تیم گرگر کمک گرفته. در واقع فقط شباهت توی بخش UI سیستم هست و حتی الگوریتم‌های رتبه‌بندی گرگر با یوز خیلی فرق می‌کنه (با چند تا جستجو توی دو تا موتور و مقایسه‌ی نتایج متوجه موضوع خواهید شد). توجه دارید که UI فقط یکی از کامپوننت‌های متعدد موتور جستجو هست (Crawler, Parser, Ranker (Offline, Online), Indexer, Searcher, ...).

یکی از دوستان حرف خوبی زده:
اگر خوب بود مردم استفاده می کنند ، نبود نمی کنن
واقعاً همینطوره. ما موتور رو برای کاربرا ساختیم نه برای دل خودمون! فکر هم نکنید چقدر پول گرفتیم و خوردیم! الان نزدیک ۲ ساله که شخص بنده از چند جای دیگه با حقوق نزدیک به دو برابر اینجا پیشنهاد کار دارم، اما نرفتم، چون معتقدم این پروژه می‌تونه کشور رو تکون بده. بقیه‌ی نیروهامون هم کم و بیش همینطوری هستن. بالاخره بچه‌ها فارغ‌التحصیلای دانشگاه‌های تراز اول کشورن و جاهای مختلفی می‌تونن کار بکنن. بگذریم!

حالا تعداد بالای این موتورها برای چی هست من موندم.
yooz
gorgor
salam
zal
شاید بازم باشه!
نخیر دوست من! اولاً که zal به تنهایی قابل استفاده نیست و فقط از طریق salam قابل استفاده هست که خود salam یه meta search engine هست، یعنی نتیجه رو از چندین موتور جستجو می‌گیره و ترکیب می‌کنه و نمایش می‌ده (البته این کار، اگه قرار باشه درست انجام بشه کار سختیه. فکر نکنید که با دو خط کد می‌شه این کارو کرد! بچه‌های salam زحمت کشیدن روی این پروژه. ولی مقایسه‌اش با یوز درست نیست). بقیه‌ی اونایی هم که به اسم موتور جستجو عنوان می‌شن، تماماً یا موتور جستجوی خاص منظوره هستن (مثلاً موتور جستجوی خانه، یا ماشین)، یا meta search engine هستن، یا تعداد صفحاتشون خیلی کمه (زیر ۱۰ میلیون صفحه) که عملاً نمی‌شه ازشون استفاده کرد! فقط پارسی‌جو هست که ۲۰۰ میلیون صفحه داره، و یوز که یک میلیارد صفحه داره. گرگر هم که قبلاً درباره‌اش صحبت کردم.

یه کلمه سرچ کردم در مورد یکی از سایت های خودم و یه نتیجه آورد که تقریبا 3 ماه پیش اون مطلب از رو سایت من دیلیت شده و کل دامنه عوض شده!
به نظر می رسه یه دیتا از چندماه پیش گوگل داخل این سایت ایمپورت شده و تقریبا بروز عمل نمی کنه!
دوستان متخصص دلیلشو بگن!
نخیر اینطور نیست! ما خزش رو خودمون انجام می‌دیم. دلیل این که یه همچین اتفاقی افتاده، همونه که بالاتر توضیح دادم. خزشگر کار سختی داره! توی یک میلیارد صفحه باید همه رو بره update کنه که در نتیجه ممکنه بعضیا از دستش در بره. شما بی‌زحمت آدرس سایتتون رو برای ما به آدرس [email protected] بفرستید تا بررسی کنیم مشکل از کجاس.

در مورد جستجوی عکس: جستجوی عکس یوز خیلی تازه کار هست و در نتیجه کاملاً قابل انتظاره که توش اشکال زیاد باشه. البته بچه‌های تیم عکس دارن شدیداً روش کار می‌کنن و خیلی از اشکالا رو اخیراً برطرف کردن. تعداد عکس‌هامون هم قراره به زودی به حدود ۱۵ برابر برسه.

مثالی که زده واسه سرچ تو گوگل ما اولی هستیم pofیوز مارو اصلا نیاورد هرچی پایین رفتم:D
فقط به عنوان حمایت از برنامه نویسی داخلی مارو بیچاره نکنن گوگل رو ببندن به خدا شانس نداریم کارو کاسبیمون رو باید جمع کنیم
من عاجزانه درخواست می‌کنم یه همچین چیزایی رو به ما خبر بدید، تا بررسی کنیم اشکال کار از کجاس. دوستان ما تمام ایمیل‌هایی که به آدرس [email protected] می‌فرستید رو می‌خونن و برای رفعش به بخش مربوطه ارجاع می‌دن.

فک میکنی اختلاس ها کجا ها انجام میشه؟؟؟؟
توی دل همین پروژه ها دیگه:D
روسیه برای یاندکس 42 میلیون دلار هزینه کرد یعنی 120 میلیارد تومان، اونوقت اینا 200 میلیارد هزینه کردند (البته اگه خبر درست باشه!) یوز از توش اومده بیرون o_O
ببخشید می‌شه منبع خبرتون رو برای این که روسیه برای یاندکس ۴۲ میلیون دلار هزینه کرده بفرمایید؟ من خبر ندارم yandex چقدر هزینه برده، ولی این عدد یه کم، همچین یه کم به شدت کم به نظر می‌رسه! شما فرض بگیر که yandex کلهم اجمعین ۵۰ هزار تا سرور بیشتر نداشته باشه! (توجه داشته باشید که گوگل بیش از ۲ میلیون سرور داره!) هر سرور رو چند حساب کنیم خوبه؟! دیگه سرور در پیت هم بگیرید قیمتش ۲۰۰۰ دلار هست! چقدر می‌شه؟ می‌شه ۱۰۰ میلیون دلار! فقط هزینه‌ی سرور! هزینه‌ی دیتاسنتر، پهنای باند، نیروها و بقیه‌ی هزینه‌ها رو هم بذارید روش! من نمی‌دونم شما این عدد رو از کجا اوردید! بعد هم مقایسه‌اش کردید با عدد موهومی ۲۰۰ میلیارد تومن! که درستش ۷ میلیارد تومن بوده!

من خودم چند سال پیش درگیر یه پروژه موتور جستجو بودم و در نهایت اون رو نیمه کاره رها کردم!
ساخت یه موتور جستجو خیلی خیلی سخته و از لحاظ اقتصادی خیلی طول میکشه به سوددهی برسه و دوما کار چند نفر آدم نیست و حداقل 50 نفر آدم میخواد با چند صد تا سرور !
مهم ترین بخش هاش هم هوش مصنوعی و دیتابیس و سرعت اینترنته!
من به طور قطع میگم که این پروژه شکست میخوره چون اهداف روشنی براش تعریف نشده و این 200 میلیارد هم هزینه مفت خوری یه تیمه که تا چند سال حقوقشون تامین شده تا این سایت داغون به این زودی ها ورشکست نشه !
خوب این دوستمون حسابی از خجالت تیم ما در اومدن! :|

اگه اشتباه نکنم طراحان یوز انتی ویروس شید رو هم قبلا ارایه کردن که از موتور انتی ویروس های دیگه استفاده میکرد.
یکی دیگه از دوستان گفتن «اگه اشتباه نکنم طراحان یوز انتی ویروس شید رو هم قبلا ارایه کردن که از موتور انتی ویروس های دیگه استفاده میکرد.»
خوب دوست من اشتباه می‌کنید! ما هیچ ربطی به آنتی ویروس نداریم!

گوگل اول و آخر چیزی به نام موتور جستجوست. هر جای دنیا هم کسی حرفی برای زدن در این زمینه داشته باشه توسط گوگل استخدام و سرویسش هم توسط گوگل خریداری میشه. یوز ؟ :general304:
فقط ما نفهمیدیم چرا تا حالا گوگل yandex و baidu و امثالهم رو نخریده!

حرف آخر : یک موتور جست و جو از پایه توسط جوان های ایرانی طراحی بشود و به مرور زمان تکمیلش شود همه جوره پشتیبانی خواهیم کرد .
خوب برادر من! این همه فک زدم که بگم این موتور از پایه توسط جوان‌های ایرانی طراحی شده! به مرور زمان هم تکمیل شده. ما بیش از چهار ساله داریم روی این موتور کار می‌کنیم. یه شبه که هواش نکردیم! خوب پس بسم‌الله: پای حرفت باش و همه جوره ما رو پشتیبانی کن.

شما وقتی هیچ سایتی در دیتابیس اینا ثبت نمیکنی چطور شمارو ایندکس میکنن ( بدون انجام کاری )
من دیگه چیزی نگم بهتره! واضحه که خزشگر به صورت خودکار صفحات رو استخراج می‌کنه!

آقا به جان بچه‌ام خسته شدم! چقدر تایپ کنم! :)

بازم خوشحال می‌شم اگه دوستی سؤال داره بپرسه.
 

MOHAMMAD026_1

مدیر بازنشسته
تاریخ عضویت
16 ژوئن 2014
نوشته‌ها
5,065
لایک‌ها
8,693
محل سکونت
ROOT
سلام خدمت کلیه‌ی دوستان
من یکی از بچه‌های تیم فنی موتور یوز هستم.
اومدم اینجا دیدم چه خبره!
سعی می‌کنم یکی یکی حرف‌هایی که زده شده رو پاسخ بدم. امیدوارم بحث خوبی اینجا در بگیره و درگیر حاشیه‌های بی‌خود نشیم.


خوب انتظار که ندارید یه موتور جستجوی تازه‌کار هر چی توش سرچ می‌کنید همه رو درست جواب بده! من شخصاً تمام جستجوهای فارسیم رو توی یوز می‌زنم، اکثراً جواب می‌گیرم. اونایی که جواب نمی‌گیرم می‌رم توی گوگل. البته مدتیه جستجوهای انگلیسیم رو هم توی یوز آزمایش می‌کنم، بعضی وقت‌ها جواب می‌گیرم، ولی در مجموع جوابای جستجوهای انگلیسی توی یوز اصلاً خوب نیست. دلیلش هم اینه که تمرکز ما تا به حال روی سایت‌های فارسی زبان بوده. ان‌شاءالله توی برنامه‌ی فاز بعدیمون (یعنی امسال) ورود به سایت‌های انگلیسی هست.
یه نکته هم همینجا بگم: نتیجه‌ی نوزدهم همین جستجو، سایت autotrader.ca هست که انگلیسی هست. قابل توجه دوستی که می‌گفت گوگل مترجمش رو با جستجوش تلفیق کرده (البته ما هنوز در این زمینه ادعایی نداریم چون راه خیلی طولانیه و کار زیاده. ولی اینطوری هم نیست که ما هیچ کاری نکرده باشیم!).

در مورد هزینه‌ی موتور: همونطور که یکی از دوستان اشاره کردند، کل هزینه‌ای که این موتور داشته ۷ میلیارد بوده نه ۱۷۰ میلیارد. اگه یه حساب خیلی ساده بکنید، می‌بینید که ۷ میلیارد خیلی هزینه‌ی کمی بوده. بیش از ۴ سال هزینه‌ی نیروها رو جمع بزنید با هزینه‌ی سرورها و پهنای باند و غیره.

اما در مورد این که گوگل هست و مگه ما بیکاریم موتور بسازیم و ...: دوستانی که نمی‌دونن اگه یه تحقیقی در مورد موتورهای جستجو بکنن، متوجه می‌شن که موتور جستجو در دنیا به عنوان لکوموتیو IT شناخته می‌شه. یعنی زیرساختی که موتور جستجو فراهم می‌کنه می‌تونه IT کشور رو تکون بده. گوگل هم از یه موتور جستجوی ساده شروع کرده و الان IT جهان رو داره تکون می‌ده. همین الان ما زیرساختی درست کردیم که باهاش می‌شه خیییییلی کارها انجام داد. به عنوان مثال انواع پروژه‌های دانشگاهی رو می‌شه تعریف کرد و بهشون سرویس داد. ما الان هم data داریم و هم قدرت پردازش کافی و هم تکنولوژی پردازش داده‌ی حجیم (big data).


این رو قبول دارم که باید یه توضیح اجمالی در مورد الگوریتم‌های رتبه‌بندی‌مون منتشر کنیم تا دوستانی که می‌خوان کارهای seo انجام بدن بدونن چه کاری تأثیر داره. ان‌شاءالله در آینده‌ی نزدیک این کار رو می‌کنیم. ما تا به حال تقریباً تمام انرژی‌مون رو روی کار فنی موتور گذاشتیم و قصد داریم از این به بعد بیشتر روی ارتباط با کاربرا و مدیران سایت وقت بذاریم تا بتونیم کاربر جذب کنیم و سرویس خوبی ارائه بدیم. البته توجه کنید که پایه‌ی رتبه‌بندی توی تمام موتورهای جستجو یکسان هستن و یه سری نکات هستند که تفاوت ایجاد می‌کنن. بنابراین به طور کلی اگه یه سایت رفتار اسپم مانند داشته باشه، رتبه‌اش میاد پایین (البته دیگه این هنر موتوره که چقدر بتونه سایت‌های اسپم رو درست تشخیص بده، که همونطور که می‌دونید توی فارسی گوگل هم خیلی در تشخیص اسپم موفق نیست). یا مثلاً تیتر صفحه بخش مهمی هست، ولی اگه توی تیتر یه صفحه انشا بنویسید ارزشش میاد پایین! این کلیات توی موتور یوز هم هستن ولی در مورد جزئیاتش ان‌شاءالله بعداً توضیح می‌دیم.
اما این رو خیلی با قاطعیت می‌گم: ما هیچ کار خاصی توی رتبه‌بندی نتایج نکردیم که مثلاً فکر کنید فلان سایت رو همیشه بالاتر میاریم (با توجه به ارتباط تنگاتنگی که با تیم رتبه‌بندیمون دارم (چون الگوریتم‌های رتبه‌بندی باید توی index اعمال بشن)، در جریان ریز کارهاشون هستم). حتی ویکیپدیا رو هم یه مدت بهش فکر کردیم که توی نتایج بالاتر از بقیه‌ی سایت‌ها بیاریم، اما دیدیم نتایج به هم می‌ریزه و برگردوندیمش. یعنی شما توی رتبه‌بندی 1,000,000,000 صفحه، هر کاری که خارج از الگوریتم‌های هوشمند انجام بشه، کار رو کلاً خراب می‌کنه. یعنی اصلاً شدنی نیست که دستی فلان سایت رو توی نتایج بیاریم بالا! به جز تبلیغات که هنوز ما روش کار نکردیم.


منظورتون رو متوجه نمی‌شم. یعنی انتظار دارن از هیچ کتابخونه‌ای استفاده نکنیم و همممممممه‌ی همه‌اش رو خودمون بنویسیم؟! مثلاً از MySql یا MSSql یا هر پایگاه داده‌ی دیگه‌ای استفاده نکنیم و خودمون بنویسیم!!! خوب قطعاً این کار منطقی نیست! همونطور که احتمالاً خبر دارید، گوگل هم از MySql استفاده می‌کرده که البته به MariaDb تغییر داده (نگفتم موتور جستجوش با MySql پیاده‌سازی شده ها! تو بخش‌هایی از سیستم‌های مختلفش از MySql استفاده می‌کنه) و حتی یه نیرو فرستاده کمک تیم MariaDb:
http://www.i-programmer.info/news/84-database/6386-google-drops-mysql-for-mariadb.html
(این صفحه رو با جستجوی «google mariadb» توی یوز پیدا کردم)
و همچنین یکی از کاربران اساسی MySql، فیس بوک هست:
http://www.mysql.com/customers/view/?id=757
صد البته این شرکت‌ها بعد از این که از این تکنولوژی‌ها استفاده می‌کنن، بعد از چند سال بهشون مسلط می‌شن و شروع می‌کنن توشون تغییرات اساسی می‌دن و در واقع تکنولوژی رو دستشون می‌گیرن.
خوب توی پروژه‌ی ما هم این اتفاق تو بخش‌های مختلف افتاده، با این تفاوت که موتور جستجوی متن‌باز آماده‌ای در scale ای که ما می‌خواستیم وجود نداشت که بگیریم ازش استفاده کنیم. برای همین بعد از امتحان کردن solution های مختلف، مجبور شدیم بیشتر بخش‌های موتور رو خودمون بسازیم (همونطور که می‌دونید گوگل و بینگ و غیره هیچ وقت نه کدشون رو منتشر می‌کنن و نه تکنولوژیشون رو). الان بعد از این همه کار، من که مسئول تیم index هستم خدمتتون می‌گم که به معماری distributed, scalable, realtime و fault-tolerant رسیدیم که دوستانی که زمینه‌ی نرم‌افزار داشته باشن می‌دونن که فراهم کردن همه‌ی اینها یا هم چقدر سخته. گوگل که ۱۷ ساله داره سرویس جستجو ارائه می‌ده، تنها چهار ساله که به معماری realtime رسیده. یعنی چی؟ یعنی این که اکثر موتورهای جستجو به صورت batch کار می‌کنن: یه index دارن که جواب جستجوهای کاربران رو می‌ده، و یه index دیگه دارن که به‌روزرسانی می‌شه. بعد از یه مدت (مثلاً هر هفته، یا هر شب) جای این دو تا رو با هم عوض می‌کنن و در نتیجه نتایجی که مثلاً دیروز خزش شدن، امروز توسط کاربرا دیده می‌شن. اما توی سیستم realtime، هر صفحه‌ای که خزش می‌شه، با یه فاصله خیلی کوتاه قابل جستجو می‌شه (که این فاصله توی موتور یوز حدود یک دقیقه هست).
توجه کنید! منظور من از این همه سخنرانی این نیست که موتور یوز خیلی هم خوب هست و هیچ مشکلی هم نداره و حرف هم نباشه! منظور اینه که توی بخش‌های مختلفی که موتور داره، ما سعی کردیم بهترین کار ممکن رو انجام بدیم و البته می‌دونیم توی رتبه‌بندی هنوز کار زیاد داریم. یه بخشی از این کار هم از طریق استفاده‌ی کاربرا از موتور انجام می‌شه. هر چقدر جستجو توی موتور بیشتر باشه، پروسه‌ی learning موتور بهتر انجام می‌شه.
نتیجه‌گیری اخلاقی: الان تکنولوژی موتور کاملاً در دست ماست و کاملاً بومی هست.

در مورد جستجوی «how i can paint my car»: دوست من ما هنوز روی انگلیسی تمرکز نکردیم. بعد هم شما یه مدت از یوز استفاده‌ی واقعی بکن، بعد بگو چقدر ازش راضی بودی. با یه جستجو که نمی‌شه چیزی رو نفی یا اثبات کرد!


در مورد ف.ی.ل.ت.ر کردن گوگل: اصلاً قرار نیست چنین چیزی اتفاق بیافته. چون مشخصه که اگه این اتفاق بیافته، اولین کسی که ضررش رو می‌بینه، موتور یوز هست چون همه از چشم اون می‌بینن. بنابراین هیچ یک از مسئولین موتور قصد چنین کاری رو ندارن.
اون حرفی هم که یکی از دوستان زده که:

دقیقاً حرفیه که ما می‌زنیم.


:|
دوست من، حداقل قبلش یه سر خبرای منتشر شده در مورد موتور یوز رو می‌خوندی! همونجا گفتن که هشتاد نفر روی این موتور کار کردن. بازم :|


این که بینگ نتونسته به پای گوگل برسه، یه دلیل عمده داره: گوگل دیتای کاربرا رو داره! و البته یه زیرساخت خیلی قوی. ما توی موتورمون زیرساخت قوی داریم (نمی‌خوام با گوگل مقایسه کنم! در scale خودمون زیرساختمون مناسب هست)، ولی دیتای کاربرا رو نداریم! (البته توی این یکی دو ماهه یه مقداری دیتا به دست اوردیم که داریم روش کار می‌کنیم تا موتور از روش learn بشه) به لطف دوستانی هم که می‌گن ما از این موتور استفاده نمی‌کنیم هیچ وقت این دیتا رو به دست نخواهیم اورد! :|
اما یه نکته‌ی دیگه رو توجه کنید: بینگ داره تو scale بین‌المللی با گوگل رقابت می‌کنه در حالی که یوز می‌خواد تو ۳ فاز اولش در scale ایران با گوگل رقابت کنه. این خیلی فرق می‌کنه!


خزشگر ما به صورت خودکار صفحات رو استخراج می‌کنه و خزش می‌کنه. اما بالاخره ممکنه یه سایتی رو پیدا نکنه، یا تعداد صفحاتی که از یه سایت داره کم باشه. برای رفع این جور موارد، می‌تونید آدرس سایتتون رو به [email protected] بفرستید تا سایت رو در اسرع وقت در فهرست خزش قرار بدیم.


به قول فامیل دور: من دیگه حرفی ندارم!
دوست گرامی! اولاً که اون اسپایدر که شما می‌گی، برای خودش عظمتی داره! فقط در نظر داشته باش که بیش از چهار میلیارد link رو آماده داریم، که یک میلیاردشون رو خزش کردیم! و این یک میلیارد صفحه نیاز به update شدن دارن! علاوه بر این باید صفحات جدید هم گرفته بشن! حالا شما با توجه به محدودیت پهنای باند، باید بتونی از بین این چهار میلیارد صفحه انتخاب کنی که کدوم صفحات جدید خزش بشن، و کدوما update بشن!
ثانیاً همونطور که یکی از دوستان اشاره کرد، شما بیا و برای ما یک میلیارد صفحه رو با تابع FULLTEXT شاخص‌گذاری و جستجو کن! ببینم به ده برابر این زمانهای جستجویی که یوز داره جواب می‌ده می‌رسی؟! همونطور که قبلاً گفتم index ما توزیع‌شده، realtime، مقیاس پذیر (یعنی برای افزایش گنجایشش کافیه بهش سرور اضافه کنید و خود خوشه به صورت dynamic داده‌ها رو balance می‌کنه و نیازی به restart کردن و از این قبیل کارها نیست) و با قابلیت تحمل خطا هست (یعنی اگه یک یا چند سرور crash کنن، کل خوشه مشکلی پیدا نمی‌کنه و به صورت خودکار سرورهای دیگه رو جایگزین می‌کنه). حالا شما بیا این رو با FULLTEXT مقایسه کن!
یکی از دوستان هم گفته بودن:

در جواب باید بگم که نخیر این طور نیست و تمام یک میلیارد رکورد ما دارای محتوای کامل صفحه هستن. تمام هنر ما هم همین بوده! البته روی کوتاه کردن متن صفحات کارهایی کردیم، اما کار سختیه که بتونید متن رو کوتاه کنید، و کیفیت جستجو رو از دست ندید (بعضی وقت‌ها جستجو روی کلمات خاصی هست که ممکنه شما موقع کوتاه کردن متن حذفش کرده باشید و در نتیجه، نتیجه‌ی جستجوتون خراب خواهد شد).
فقط بگم که حجم index ما بیش از دو ساله که از یک ترابایت گذشته.


خوب دوست من اشتباه می‌کنی! :) ما crawler و index خودمون رو داریم و کاری به bing یا گوگل یا هر موتور دیگه‌ای نداریم. البته انصافاً واقعاً خوشحال شدم که شما از لفظ «اگه اشتباه نکنم» استفاده کردید. مورد داشتیم توی یه فروم دیگه یه بنده خدایی با اطمینان کامل گفته بود که یوز از بینگ استفاده می‌کنه! :)


دوست من ما از هیچ تکنیک خاصی برای دزدیدن کلیک و بالا بردن رتبه‌ی الکسا استفاده نمی‌کنیم چون این کار برای موتور جستجو بی‌معنیه. یعنی ایده زیاد داشتیم ها! ولی استفاده نکردیم (می‌تونید سایت رو زیر و رو کنید تا ببینید هیچ کار اضافه‌ای توی موتور انجام نمی‌شه، بر خلاف سایت‌هایی که تا یه جا کلیک می‌کنی ده تا popup باز می‌کنن!). البته رتبه‌ی الکسامون به ۱۱۹ هم رسید که به خاطر استفاده‌ی کاربرا بوده نه چیز دیگه‌ای. البته‌تر(!) این که الان رتبه‌ی الکسامون توی ایران افت کرده (جهانیش داره هنوز رشد می‌کنه) که دلیلش ضعف ما توی تبلیغات بوده و این که به هر دلیل نتونستیم همه‌ی کاربرامون رو حفظ کنیم. این رو می‌دونیم و داریم سعی می‌کنیم کیفیت سرویس رو بالاتر ببریم تا بتونیم کاربرا رو نگه داریم.


در جواب باید بگم که همونطور که قبلاً هم مدیر پروژه توضیح داده ( http://itiran.com/d/68499 ) تیم یوز از تیم گرگر کمک گرفته. در واقع فقط شباهت توی بخش UI سیستم هست و حتی الگوریتم‌های رتبه‌بندی گرگر با یوز خیلی فرق می‌کنه (با چند تا جستجو توی دو تا موتور و مقایسه‌ی نتایج متوجه موضوع خواهید شد). توجه دارید که UI فقط یکی از کامپوننت‌های متعدد موتور جستجو هست (Crawler, Parser, Ranker (Offline, Online), Indexer, Searcher, ...).

یکی از دوستان حرف خوبی زده:

واقعاً همینطوره. ما موتور رو برای کاربرا ساختیم نه برای دل خودمون! فکر هم نکنید چقدر پول گرفتیم و خوردیم! الان نزدیک ۲ ساله که شخص بنده از چند جای دیگه با حقوق نزدیک به دو برابر اینجا پیشنهاد کار دارم، اما نرفتم، چون معتقدم این پروژه می‌تونه کشور رو تکون بده. بقیه‌ی نیروهامون هم کم و بیش همینطوری هستن. بالاخره بچه‌ها فارغ‌التحصیلای دانشگاه‌های تراز اول کشورن و جاهای مختلفی می‌تونن کار بکنن. بگذریم!


نخیر دوست من! اولاً که zal به تنهایی قابل استفاده نیست و فقط از طریق salam قابل استفاده هست که خود salam یه meta search engine هست، یعنی نتیجه رو از چندین موتور جستجو می‌گیره و ترکیب می‌کنه و نمایش می‌ده (البته این کار، اگه قرار باشه درست انجام بشه کار سختیه. فکر نکنید که با دو خط کد می‌شه این کارو کرد! بچه‌های salam زحمت کشیدن روی این پروژه. ولی مقایسه‌اش با یوز درست نیست). بقیه‌ی اونایی هم که به اسم موتور جستجو عنوان می‌شن، تماماً یا موتور جستجوی خاص منظوره هستن (مثلاً موتور جستجوی خانه، یا ماشین)، یا meta search engine هستن، یا تعداد صفحاتشون خیلی کمه (زیر ۱۰ میلیون صفحه) که عملاً نمی‌شه ازشون استفاده کرد! فقط پارسی‌جو هست که ۲۰۰ میلیون صفحه داره، و یوز که یک میلیارد صفحه داره. گرگر هم که قبلاً درباره‌اش صحبت کردم.


نخیر اینطور نیست! ما خزش رو خودمون انجام می‌دیم. دلیل این که یه همچین اتفاقی افتاده، همونه که بالاتر توضیح دادم. خزشگر کار سختی داره! توی یک میلیارد صفحه باید همه رو بره update کنه که در نتیجه ممکنه بعضیا از دستش در بره. شما بی‌زحمت آدرس سایتتون رو برای ما به آدرس [email protected] بفرستید تا بررسی کنیم مشکل از کجاس.

در مورد جستجوی عکس: جستجوی عکس یوز خیلی تازه کار هست و در نتیجه کاملاً قابل انتظاره که توش اشکال زیاد باشه. البته بچه‌های تیم عکس دارن شدیداً روش کار می‌کنن و خیلی از اشکالا رو اخیراً برطرف کردن. تعداد عکس‌هامون هم قراره به زودی به حدود ۱۵ برابر برسه.


من عاجزانه درخواست می‌کنم یه همچین چیزایی رو به ما خبر بدید، تا بررسی کنیم اشکال کار از کجاس. دوستان ما تمام ایمیل‌هایی که به آدرس [email protected] می‌فرستید رو می‌خونن و برای رفعش به بخش مربوطه ارجاع می‌دن.


ببخشید می‌شه منبع خبرتون رو برای این که روسیه برای یاندکس ۴۲ میلیون دلار هزینه کرده بفرمایید؟ من خبر ندارم yandex چقدر هزینه برده، ولی این عدد یه کم، همچین یه کم به شدت کم به نظر می‌رسه! شما فرض بگیر که yandex کلهم اجمعین ۵۰ هزار تا سرور بیشتر نداشته باشه! (توجه داشته باشید که گوگل بیش از ۲ میلیون سرور داره!) هر سرور رو چند حساب کنیم خوبه؟! دیگه سرور در پیت هم بگیرید قیمتش ۲۰۰۰ دلار هست! چقدر می‌شه؟ می‌شه ۱۰۰ میلیون دلار! فقط هزینه‌ی سرور! هزینه‌ی دیتاسنتر، پهنای باند، نیروها و بقیه‌ی هزینه‌ها رو هم بذارید روش! من نمی‌دونم شما این عدد رو از کجا اوردید! بعد هم مقایسه‌اش کردید با عدد موهومی ۲۰۰ میلیارد تومن! که درستش ۷ میلیارد تومن بوده!


خوب این دوستمون حسابی از خجالت تیم ما در اومدن! :|


یکی دیگه از دوستان گفتن «اگه اشتباه نکنم طراحان یوز انتی ویروس شید رو هم قبلا ارایه کردن که از موتور انتی ویروس های دیگه استفاده میکرد.»
خوب دوست من اشتباه می‌کنید! ما هیچ ربطی به آنتی ویروس نداریم!


فقط ما نفهمیدیم چرا تا حالا گوگل yandex و baidu و امثالهم رو نخریده!


خوب برادر من! این همه فک زدم که بگم این موتور از پایه توسط جوان‌های ایرانی طراحی شده! به مرور زمان هم تکمیل شده. ما بیش از چهار ساله داریم روی این موتور کار می‌کنیم. یه شبه که هواش نکردیم! خوب پس بسم‌الله: پای حرفت باش و همه جوره ما رو پشتیبانی کن.


من دیگه چیزی نگم بهتره! واضحه که خزشگر به صورت خودکار صفحات رو استخراج می‌کنه!

آقا به جان بچه‌ام خسته شدم! چقدر تایپ کنم! :)

بازم خوشحال می‌شم اگه دوستی سؤال داره بپرسه.
یا خودا!
صابش اومد :D
در کل بنده بخاطر شباهت نتایج اون مورد رو عرض کردم
 

sayyid

کاربر تازه وارد
تاریخ عضویت
24 مارس 2015
نوشته‌ها
5
لایک‌ها
51
سن
39
محل سکونت
تهران
یا خودا!
صابش اومد :D
در کل بنده بخاطر شباهت نتایج اون مورد رو عرض کردم
:)
نه مشکلی نیست! بالاخره شبهه پیش میاد! :)

پ.ن. می‌خواستم نوشته‌ی قبلی رو ویرایش کنم نشد!
یه نکته‌ای رو یادم رفت بگم: حرفایی که من اینجا زدم، موضع‌گیری‌های رسمی تیم موتور یوز نیست! موضع‌گیری‌های رسمی رو فقط از زبان مدیر پروژه می‌تونید بشنوید!
(اینو اگه نمی‌گفتم پس‌فردا علیه خودم در دادگاه استفاده می‌شد! :D )
 

babapooldar

Registered User
تاریخ عضویت
6 نوامبر 2009
نوشته‌ها
1,370
لایک‌ها
1,044
نه مشکلی نیست! بالاخره شبهه پیش میاد! :)

پ.ن. می‌خواستم نوشته‌ی قبلی رو ویرایش کنم نشد!
یه نکته‌ای رو یادم رفت بگم: حرفایی که من اینجا زدم، موضع‌گیری‌های رسمی تیم موتور یوز نیست! موضع‌گیری‌های رسمی رو فقط از زبان مدیر پروژه می‌تونید بشنوید!
(اینو اگه نمی‌گفتم پس‌فردا علیه خودم در دادگاه استفاده می‌شد! :D )

خیلی خوشحال شدم که جواب بعضی از دوستان رو دادید البته باید توجه کنید افراد زیر 18 سال در این فروم هم وجود دارن که کارشون فقط فکر کردنه !
 

aalirezaa1376

Registered User
تاریخ عضویت
12 سپتامبر 2014
نوشته‌ها
461
لایک‌ها
455
محل سکونت
خارج
با API گوگل هم میشه یه موتور جستجو زد :D (شوخی)
تا اونجایی که من میدونم برای این موتور جست جو خیلی زحمت کشیدن که واقعا جای سپاس دارن و باید از طرح ایرانی حمایت بشه
فقط من چند تا سوال دارم
الان این موتور نتایج رو هر چند وقت یک بار آپدیت میکنه ؟؟؟
مثلا من یه چیزی سرچ کردم یه سایت که خیلی وقته بسته شده و کلا نابود شده (حدود شش ماه پیش) آورد !!
 

MOHAMMAD026_1

مدیر بازنشسته
تاریخ عضویت
16 ژوئن 2014
نوشته‌ها
5,065
لایک‌ها
8,693
محل سکونت
ROOT
الان این موتور نتایج رو هر چند وقت یک بار آپدیت میکنه ؟؟؟
مثلا من یه چیزی سرچ کردم یه سایت که خیلی وقته بسته شده و کلا نابود شده (حدود شش ماه پیش) آورد !!
حالا ی سوال بره من پیش اومد!
یوز ک 6 ماه پیش نبوده (البته استارت پروژه اش خورده بود، اما ب مرحله بهره برداری نرسیده بود هنوز)
پ یعنی از دیتابیس ی جستجوگر دیگه استفاده میکنه! (منظورم تو ی بازه زمانی اطلاعات رو ایمپورت کرده) + (شاید)
همونطور ک بالاتر هم اشاره کردم
 
Last edited:

aalirezaa1376

Registered User
تاریخ عضویت
12 سپتامبر 2014
نوشته‌ها
461
لایک‌ها
455
محل سکونت
خارج
حالا ی سوال بره من پیش اومد!
یوز ک 6 ماه پیش نبوده (البته استارت پروژه اش خورده بود، اما ب مرحله بهره برداری نرسیده بود هنوز)
پ یعنی از دیتابیس ی جستجوگر دیگه استفاده میکنه! (شاید)
همونطور ک بالاتر هم اشاره کردم

دقیق دقیقش رو که بخواید از 14 سپتامر بسته شده اون سایته
 

majids5

Registered User
تاریخ عضویت
1 آپریل 2009
نوشته‌ها
1,198
لایک‌ها
517
سلام سید.
خوش اومدین. و ممنون برای پاسخ ها.
یه بخش وب مستر هم بذارید براش بد نیست.

حال داشتید سایت منم بیارید صفحه اولش
http://www.clubmusic.ir
:D:D:D

البته شوخی بود، دیدم گفتید نمیشه.:)
 

ashk4n

Registered User
تاریخ عضویت
4 دسامبر 2012
نوشته‌ها
208
لایک‌ها
330
سن
34
این پروژه کار تیمی چند نفره بوده؟
 

MOHAMMAD026_1

مدیر بازنشسته
تاریخ عضویت
16 ژوئن 2014
نوشته‌ها
5,065
لایک‌ها
8,693
محل سکونت
ROOT

khunires

مدیربخش کاروسرمایه *فروشنده معتبر
تاریخ عضویت
20 آگوست 2013
نوشته‌ها
3,624
لایک‌ها
4,947
هنو این تاپیک در حال بحثه!؟ :eek: حیف نمیتونم کامل اظهار نظر کنم! حیف. :)

فقط یه چیز بگم و تمام: بینگ و یاهو دارن خودشونو تیکه تیکه میکنن به گرد گوگل هم نمیرسن! بعد چجوری چندتا ویرایشگر اسکریپت به خودشون اجازه میدن یه موتورجستجو بزنن که اسمشم حتی قشنگ نیست!

خود گوگل چندوقت دیگه این سایت رو اسپم میکنه! همینطور موتورجستجوهای دیگه :) به عنوان اسپمر شناخته میشه :)
 

rezatak6

کاربر فعال کسب درآمد از اینترنت
کاربر فعال
تاریخ عضویت
3 ژوئن 2014
نوشته‌ها
3,311
لایک‌ها
1,906
@sayyid
4 مورد رو حل کنی همه چی حله.
1-قالب صفحه اصلی رو خالی کن مثل گوگل یعنی سبک کن خیلی میگم خیلی خیلی اصن ببین خیلی خیلی خیلی افتاد؟
2-یه فکری به حال اسپمر ها بکنین یا اصن یه پشتیبانی بزارین بعد عنوانش رو بزارین گزارش مشکل هر کی اومد سایت اسپم گزارش کرد کلا از لیست ایندکس حا حذفش کنید یا مث گوگوگلی ببرید لیست سیاه.
3-آپارات رو از نتایج توی آی فریم یا یه همچین چچیزی نکنید هر چی فیلم مینویسی آپارات میاد این خیلی دیوثیه (جا داره بگم واسه این ابتکارتون دوست داشتم فحش ناموسی بدم البته حضوری).
4-نتیاج رو صفحه بندی کنید همه نتایج تو یه صفحه میاد فقط بینشون یه خط هست و وسطش شماره نوشته اینجوری اون صفحه سنگین میشه.
 

wolfmoon

Registered User
تاریخ عضویت
4 فوریه 2008
نوشته‌ها
484
لایک‌ها
197
محل سکونت
Teh
یوز ؟ آقا فقط برای بالا اومدنش بر ندارید ( مثل چین برای بالا آوردن Baidu ) گوگل رو مسدود کنید. البته همین الانشم نصفش مسدوده مثل جی پلاس و یوتیوب فقط دیگه کاملا مسدودش نکنید بذارید این جیمیل و گوگل سرچ باز باشه قول میدم روزی یه بار یوز باز کنم :D

این مصاحبه بازگشایی یوز با مدیر پروژه رو هم هر کسی نخونده میتونه بخونه : http://www.mehrnews.com/news/2495783/راه-اندازی-موتور-جستجوگر-ایرانی-جستجوی-یک-میلیارد-صفحه-با-یوز

این رو بگم هر کسی که اینجاست و نظری میذاره قطعا از موفق شدن یه پروژه ایرانی حمایت میکنه. فقط وقتی وزارت ارتباطات 7 میلیارد تومان خرج کرده تا حالا (http://www.khabaronline.ir/detail/400804/ict/ict) خوب انتظارها طبیعتا متفاوته با یه پروژه که چند نفر از جیب خودشون بزنن.
 
Last edited:

maysam.m

Registered User
تاریخ عضویت
29 نوامبر 2007
نوشته‌ها
2,122
لایک‌ها
1,371
محل سکونت
تهران
@sayyid
من که مطمئنم این پروژه شکست میخوره ولی در هرصورت برای بچه های گروه یوز آرزوی موفقیت میکنم امیدوارم که دیرتر شکست بخورید :دی
اما چند پیشنهاد:
1- اصلا سمت جستجوی انگلیسی نرید و بیخودی وقتتون رو روی بخش انگلیسی یا هر زبون دیگه ای غیر از فارسی تلف نکنید. تنها حالتی که یوز میتونه موفق بشه اینه که بتونه توی جستجوی فارسی برای کاربرای ایرانی موفق باشه.
2- بهتره خودتون مطالبی در مورد سئو سایتها برای موتور جستجوتون ایجاد کنید و تا سایتهایی که سئو میشند در موتور شما در نتایج بهتری قرار بگیرند و اینجوری وبمسترا تشویق به همکاری با موتور جستجوی خوشگل عسل یوز میشن :دی
3- روی بخش page authority و به خصوص domain authority کار کنید که بخش اعظمی از نحوه نمایش سایتهای بهتر از این طریق بدست بیاد.
4- بخش یوز وبمسترز رو حتما باید ایجاد کنید و اگه این بخش رو مثل گوگل وبسمترز نتونید داشته باشید قطعا شکست میخورید
5- رتبه بندی نتایجتون رو با گوگل مقایسه کنید.
و.....
 

tabarokk

کاربر تازه وارد
تاریخ عضویت
17 جولای 2014
نوشته‌ها
38
لایک‌ها
25
@sayyid
این چیه ؟ :
yoos.ir
چک کنید میبینید همون یوزره ولی مثل این که بستنش !
همچنین مواظب اسپم از طرف گوگل باشید داره یه کار هایی میکنه ... (تو نتایج یوزر خیلی بالاست !!)
 

افتک!!

Registered User
تاریخ عضویت
12 آپریل 2014
نوشته‌ها
1,193
لایک‌ها
8,853
محل سکونت
تهران
ما موتور رو برای کاربرا ساختیم نه برای دل خودمون! فکر هم نکنید چقدر پول گرفتیم و خوردیم! الان نزدیک ۲ ساله که شخص بنده از چند جای دیگه با حقوق نزدیک به دو برابر اینجا پیشنهاد کار دارم، اما نرفتم، چون معتقدم این پروژه می‌تونه کشور رو تکون بده. بقیه‌ی نیروهامون هم کم و بیش همینطوری هستن. بالاخره بچه‌ها فارغ‌التحصیلای دانشگاه‌های تراز اول کشورن و جاهای مختلفی می‌تونن کار بکنن. بگذریم!

سید جان:D با این شعارها دیگه کسی خ.ر نمیشه ....... همه می دونن که این پروژه و پروژه های مشابه هیچ ارزشی برای کشور و مردم نداره و یه سفره ای بازه و یه عده ای میان می خورن و میرن:p.... خواهشا این قسمت از کشور رو که ما توش هستیم تکون ندید :D

اصولا ورای تمام مسائل فنی، من به گروهی که آیدی سید انتخاب میکنه و شعار وطن پرستی میده، اعتماد نمیکنم، حتی برای سرچ ساده .... هموطن خودمون گوگل، قابل اعتماد تره:p

والا.... پس فردا معلوم نیست از اطلاعاتمون چه سوء استفاده ای بکنن:p
 
بالا