برگزیده های پرشین تولز

كالبدشكافي كارت گرافيك

saeed_violinist

Registered User
تاریخ عضویت
1 آپریل 2004
نوشته‌ها
1,275
لایک‌ها
3
سن
40
محل سکونت
Netherlands
به نقل از ARH :
از آخر ما نفهميديم كه 1.6 نانو ثانيه هست يا 2 ؟

خودمم نفهميدم تو فروم هاي خارجي كه ژست زدم يكي ميگه 2 يكي ميگه 1.6 . چيزي كه هست من تونستم با يك فن اضافه كه از بقل به كارت هوا رو ميدمه مارك 2005 رو بدون آرتيفكت با سرعت 440/1200 تست كنم . البته دماي كارت تا 87 درجه در آخر آزمايش بالا رفت !!!! :( تصححیح میکنم در تست آخر یعنی همون اژدها و کشتی ، چند تا نقطه سیاه کوچک در تصویر ظاهر شد.. احتمالا به خاطر گرم شدن چیپ های رم بوده..

الان هم بدون هيچ مشكلي و حتي افزايش دما 24 ساعته روي 420/1120 كار ميكنه . اميدوارم مشكلي براش پيش نياد ! دوستان دعا كنيد براي كارتم كه به اين زوديا منو تنها نذاره !

------
من جايي شنيدم كه تعداد ترانزيستور ها در اين 6800 جديد كاهش يافته بنابر اين لوله اضافي براي باز كردن نداره !!!
 

saeed_violinist

Registered User
تاریخ عضویت
1 آپریل 2004
نوشته‌ها
1,275
لایک‌ها
3
سن
40
محل سکونت
Netherlands
راستی به نظر شما افزایش باس pci-e از 100 به 105 یا بیشتر تاثیری رو کارایی داره ؟
 

ARH

Registered User
تاریخ عضویت
10 ژانویه 2005
نوشته‌ها
938
لایک‌ها
4
به نقل از saeed_violinist :
راستی به نظر شما افزایش باس pci-e از 100 به 105 یا بیشتر تاثیری رو کارایی داره ؟

ميشه بيشتر توضيح بدي ؟ منظورت از 100 فركانس باس PCI-E هست ؟ تا اونجا كه من اطلاعا دارم فركانس هر Lane اش 250 مگاهرتز بود .
 

Xradical

Registered User
تاریخ عضویت
18 می 2004
نوشته‌ها
1,030
لایک‌ها
4
من تا حدود 3 ساعت پيش نميتونستم بيام تو PT نميدونم ديگه چرا اينجا رو فيلتر كردن!

به نقل از ARH :
سلام
همونطور كه ميدونيد "پهناي باند حافظه" در كارت گرافيك يكي از فاكتورهايي هست كه به شدت بر عملكرد تاثير ميگذاره چرا كه عمليات پردازش و بافت گذاري هر پيكسل فقط در يك مرجله صورت نميگيره و شايد نياز باشه تا بارها و بارها پردازش شده و در حافظه محلي كارت ذخيره گردد و تا براي ارسال به صفحه نمايش آماده گردد. به همين خاطر كمپاني هاي ATI و NVIDIA خيلي روي بهينه سازي پهناي باند حافظه كار كردند . در صورتي كه بخواهيم نرخ حداكثر پهناي باند رو افزايش دهيم دو روش ساده وجود داره : عرض گذرگاه حافظه يا Memory Interface‌ در كارت گرافيك رو گسترش بديم يا اينكه فركانس كاري تراشه هاي DRAM‌ رو بالا ببريم . هر دوي اين روش ها روي كارت‌گرافيك هاي مدرن تا آنجا كه امكان داشت به كار گرفته شده اند اما هنوز هم "پهناي باند حافظه" در كارت گرافيك به عنوان يك گلوگاه ارتباطي به شمار مير‌فت . علاوه بر اين كنترلرهاي حافظه قبل از Geforce 3 دو تا مشكل عمده ديگه هم داشتند . تاخير بسيار زياد حافظه هاي كارت گرافيك موجب شده بود تا بخش عمده اي از سيكل كلاك هاي ارزشمند پهناي باند حافظه صرف تاخيرهاي بيهوده بشه در از "پهناي باند حافظه" به صورت موثر بهره برده نمي‌شد . دومين مشكل اينه كه كنترلرهاي حافظه DDR معمول ميتونند داده ها رو با حجم 256 بيت = 32 بايت جابجا كنند . اگر مثلثي كه قرار بافت گذاري بشه فقي سايز يك پيكسلي داشته باشد 8 بايت (32 بيت رنگ و 32 بيت عمق z ) از اين 32 بايت رو به خودش اختصاص ميده و 75 درصد بقيه پهناي باند در اون سيكل كلاك كاملا به هدر مي‌ره .

راه كاري كه NVIDIA براي بهينه سازي گذرگاه حافظه در Geforce 3 بود LMA نام داشت يا LightSpeed Memory Architector . در اين معماري نرخ حداكثر Fill Rate برابر 800 مگاپيكسل در ثانيه شده بود در حالي كه Geforce 2 GTS حداكثر Fill Rate ي برابر 1000 مگاپيكسل در ثانيه داشت . اما عملكرد كنترلر حافظه Geforce 3 با Geforce 2 اصلا قابل ملاحظه نبود . در واقع LMA از پهناي باند محدود خودش به صورت موثر تري بهره مي‌برد يعني نرخ پهناي باند واقعي رو تونسته بود به نرخ حداكثر پهناي باند نزديك كنه . يكي از راه كارهايي كه تو LMA ازش استفاده شده همين Crossbar Memory Controller هست .

همونطور كه ميبينيد كنترلر حافظه Crossbar از چهار تا زيركنترلر كاملا مستقل تشكيل شده كه هر كدومشون دسترسي كاملي برابر Memory Interface به تراشه هاي DRAM‌دارند . با اين تفكيك هنگامي كه نياز باشه فقط 32 بيت داده ارسال بشه يك زيركنترلر اين وظيفه رو بر عهده ميگيره و سه زير كنترلر ديگه آزاد مي‌مونند . علاوه بر اين ميزان تاخير نيز 4 برابر كاهش پيدا كرده است .
ATI هم از سري Radeon 9700 از كنترلر حافظه CrossBar رو كارت هاي گرون قيمتش اسفاده كرد اما كنترلر حافظه ATI به اندازه LMA كارايي نداره در حالي كه نرخ پهناي بايند خيلي بيشتري رو داره اما ساير تكنولوژي هاي همراه LMA رو به همراه ندارد .

با اين توضيحات كارت گرافيك هايي كه Memory Interface‌ اونها نصف شده ( مثل كارت گرافيك هاي 64 بيت) علاوه بر اين كه پهناي باند حافظه رو نصف كردند رسما تاخير دسترسي به حافظه رو هم دو برابر كرده اند . و اين كارت MX4000 كه مثالش رو زديم شاهكاريه كه تاخير رو 4 برابر ميكنه :D

InterLeaving رو من نشنيدم تو كارت گرافيك ها بكار ببرند اما روي بردهايي كه CrossBar تداشتند حتمي از Interleaving بايد استفاده كنند . در واقع CrossBar نوع پيشرفته تري از inteleaving به شمار ميره .

در interleaving حافظه ها به دو يا چهار بخش تقسيم مي‌شوند كه به هر كدومشون ميگند يك بانك حافظه (تعريف بانك حافظه يك كم گنگ تره تو وبلاگم در اين باره بحث شده ) وقتي كه يك بانك داره داده ها رو مي‌خونه بانك دوم خودش رو براي خوانده شدن آماده ميكنه . با اين كار تاخير در خواندن و نوشتن داده ها كاهش پيدا خواهد كرد .


آقا من از آخر فرق NV41 رو با NV42 نفهميدم . :(

اقا بابت توضيحات ممنونم استفاده كردم

LightSpeed Memory كه دربارش صحبت كردي يه اينترفيس حافظه "هوشمند" با چندين بهينه سازي بسيار موثر بود
كه تقويت عملكردي حافظه و استفاده موثر از پهناي باند حافظه رو فراهم ميكرد من خودم بعد از خوندن پست شما يه تحقيقي در مورد CrossBar انجام دادم و مجموع كلي رو اينطور فهميدم كه بنظر پيش از ظهورCrossbar كنترلر هاي سنتي حافظه ddr داده ها رو در بسته هاي با اندازه 256 بيت به كانالهاي حافظه ميفرستاد در حاليكه اگر زماني داده هايي در يه چند ضلعي تنها به 64 بيت عرض باند جهت ارسال به كانال حافظه نياز داشت كل 256 بيت از به صورت افراطي در انتقال تنها 64 بيت داده مصرف ميشد كه مشخصا بسياري از پهناي باند به صورت ناكارامدي هدر ميرفت
Crossbar با تقسيم شدن به مسيرهاي كنترلر مجزا اين امكان رو فراهم ميكنه كه هر كنترلر حافظه به صورت يكپارچه يا مستقل از هم عمل كنند در نتيجه Crossbar توانايي ارسال داده ها در فرضا بسته هاي 64 بيت،128 بيت يا 256 بيت رو با توجه به نياز محيا ميكنه و موافق با صحبت شما نسبت به قبل چيزي بين 2 تا 4 برابر عرض باند حافظه به طرز مطلوبي بكار گيري ميشه...nvidia اين قابليت در نسخه دوم LMA باز هم بهينه كرده و بنظر با اضافه كردن 4 بافر كش با سرعت بسيار بالا نواحي ذخيره سازي موقت رو براي داده هايي كه خوانده/نوشته ميشه به حافظه ، ايجاد كرده هر كدوم از اين كشها مستقلا" توانايي ذخيره اطلاعات مربوط به داده هاي راس،بافت يا داده هاي پيكسل رو دارن كه انگار در زمان دسترسيهاي لحظه اي به اين داده ها تاخير رو بسيار پايين مياره
LMA قابليتهايي ديگه اي هم داره كه غير از Crossbar حالت فشرده سازي بدون افت داده هاي عمق
(z-Compression) هم يه ويژگي جذاب بود كه ترافيك داده هاي مربوط به عمق يا نسبت ديد كاربر از يه پيكسل مشخص(z-buffer ) با يه نسبت فشرده سازي بدون از دست رفتن كيفيت براي ترقي عملكرد انجام ميشه

شايد بيش از همه چيز مقايسات عملكردي matrox parhelia بود كه نشون داد LMA II بكار رفته در geforce4 چطور ميتونه ضعف parhelia رو در نبود يه چنين كنترلر حافظه هوشمندي مشخص كنه جالبه بدونيد parhelia با وجود سود بردن از يه عرض باند حافظه " گنده اون زمان" 20 گيگابايت بر ثانيه در مقابل تنها 4/10 گيگابايت براي geforce4 ti در بيشتر مقايسات عملكردي تو بازايا با فصله نسبتا زيادي عقب ميموند و خيلي از مقالات اين ناتواني رو به نبود چيزي مشابه LMA II در parhelia ميدونستن هر چند كه Matrox طبق ادعاش از يه كنترلر حافظه هوشمند با چندي زير سيستم حافظه درش استفاده كرده در واقع اولين gpu 512 بيتي رو كاغذ يه معماري خفن پيچيده داشت اما در عمل
مشخص شد كه زمان تولد اين كارت با مرگش فاصله خيلي كمي داشت مسه geforce fx 5800

در مورد InterLeaving كه گفته بودي من تو برخي مقالات خونده بودم كه از InterLeaving به جاي Crossbar حتي در سري geforce6 يا x800 نام ميبردن به همين دليل ميخواستم ببينم اين دو اصلا يكين يا مثلا Crossbar نام جايگزين InterLeaving هست يا...؟ مطمئن نيستم اما انگار nvidia اونو(Crossbar) رو تو nforce1 هم براي athlon xp بكار گيري كرده با كاركردي به همون صورت گفته شده
تعريفي كه از InterLeaving هم من دارم دقيقا يه جور همپوشاني بانكهاي حافظه براي همديگس كه اگر يه بانك در حال پاسخگويي به درخواستهاي پردازنده باشه بانك ديگه در حال اماده شدن براي اين پاسخگوييهاس و زمانيكه بانك اول داره داده هارو به پردازنده ارسال ميكنه بانك دوم در حال انجام داده هاي اعمال شده از طرف پردازنده هس و وقتي بانك دوم در زمان ارسال داده ها به پردازنس بانك اول در حال انجام عمليات داده ها و وهمينطور اين روند ادامه داره اينكه به همين دليل بانكها بايد حتما بايد به صورت زوج با هم باشن يعني حتما بايد دو dimm در دسترس باشه تا اين تكنيك انجام بشه

ARH من تو دو پست قبلي فرق NV41 رو با NV42 گفته بودم! به هر حال شايد خوب توضيح ندادم ببين از اين دو ميتوني فرقشون رو مشخص كني:
NVIDIA NV41 Chip Details

NVIDIA NV42 Chip Details

NV42 بنظر بخاطر پر كردن پيكسلهاي بيشتر سرعتهاي كلاك بالاتري داره


از آخر ما نفهميديم كه 1.6 نانو ثانيه هست يا 2 ؟

تو همون لينك گفته 2 نانو ثانيه هس مشابه خيلي از GT 6800ها مسه كارت خودم شايد بشه تو بردهاي gainward با اون تنوع مدلش GT 6800 رو با چيپهاي 1.6 پيدا كرد من كارتم تا 1175/430 پايداره
 

ARH

Registered User
تاریخ عضویت
10 ژانویه 2005
نوشته‌ها
938
لایک‌ها
4
اقا بابت توضيحات ممنونم استفاده كردم

LightSpeed Memory كه دربارش صحبت كردي يه اينترفيس حافظه "هوشمند" با چندين بهينه سازي بسيار موثر بود
كه تقويت عملكردي حافظه و استفاده موثر از پهناي باند حافظه رو فراهم ميكرد من خودم بعد از خوندن پست شما يه تحقيقي در مورد CrossBar انجام دادم و مجموع كلي رو اينطور فهميدم كه بنظر پيش از ظهورCrossbar كنترلر هاي سنتي حافظه ddr داده ها رو در بسته هاي با اندازه 256 بيت به كانالهاي حافظه ميفرستاد در حاليكه اگر زماني داده هايي در يه چند ضلعي تنها به 64 بيت عرض باند جهت ارسال به كانال حافظه نياز داشت كل 256 بيت از به صورت افراطي در انتقال تنها 64 بيت داده مصرف ميشد كه مشخصا بسياري از پهناي باند به صورت ناكارامدي هدر ميرفت
Crossbar با تقسيم شدن به مسيرهاي كنترلر مجزا اين امكان رو فراهم ميكنه كه هر كنترلر حافظه به صورت يكپارچه يا مستقل از هم عمل كنند در نتيجه Crossbar توانايي ارسال داده ها در فرضا بسته هاي 64 بيت،128 بيت يا 256 بيت رو با توجه به نياز محيا ميكنه و موافق با صحبت شما نسبت به قبل چيزي بين 2 تا 4 برابر عرض باند حافظه به طرز مطلوبي بكار گيري ميشه...nvidia اين قابليت در نسخه دوم LMA باز هم بهينه كرده و بنظر با اضافه كردن 4 بافر كش با سرعت بسيار بالا نواحي ذخيره سازي موقت رو براي داده هايي كه خوانده/نوشته ميشه به حافظه ، ايجاد كرده هر كدوم از اين كشها مستقلا" توانايي ذخيره اطلاعات مربوط به داده هاي راس،بافت يا داده هاي پيكسل رو دارن كه انگار در زمان دسترسيهاي لحظه اي به اين داده ها تاخير رو بسيار پايين مياره
LMA قابليتهايي ديگه اي هم داره كه غير از Crossbar حالت فشرده سازي بدون افت داده هاي عمق
(z-Compression) هم يه ويژگي جذاب بود كه ترافيك داده هاي مربوط به عمق يا نسبت ديد كاربر از يه پيكسل مشخص(z-buffer ) با يه نسبت فشرده سازي بدون از دست رفتن كيفيت براي ترقي عملكرد انجام ميشه

شايد بيش از همه چيز مقايسات عملكردي matrox parhelia بود كه نشون داد LMA II بكار رفته در geforce4 چطور ميتونه ضعف parhelia رو در نبود يه چنين كنترلر حافظه هوشمندي مشخص كنه جالبه بدونيد parhelia با وجود سود بردن از يه عرض باند حافظه " گنده اون زمان" 20 گيگابايت بر ثانيه در مقابل تنها 4/10 گيگابايت براي geforce4 ti در بيشتر مقايسات عملكردي تو بازايا با فصله نسبتا زيادي عقب ميموند و خيلي از مقالات اين ناتواني رو به نبود چيزي مشابه LMA II در parhelia ميدونستن هر چند كه Matrox طبق ادعاش از يه كنترلر حافظه هوشمند با چندي زير سيستم حافظه درش استفاده كرده در واقع اولين gpu 512 بيتي رو كاغذ يه معماري خفن پيچيده داشت اما در عمل
مشخص شد كه زمان تولد اين كارت با مرگش فاصله خيلي كمي داشت مسه geforce fx 5800

در مورد InterLeaving كه گفته بودي من تو برخي مقالات خونده بودم كه از InterLeaving به جاي Crossbar حتي در سري geforce6 يا x800 نام ميبردن به همين دليل ميخواستم ببينم اين دو اصلا يكين يا مثلا Crossbar نام جايگزين InterLeaving هست يا...؟ مطمئن نيستم اما انگار nvidia اونو(Crossbar) رو تو nforce1 هم براي athlon xp بكار گيري كرده با كاركردي به همون صورت گفته شده
تعريفي كه از InterLeaving هم من دارم دقيقا يه جور همپوشاني بانكهاي حافظه براي همديگس كه اگر يه بانك در حال پاسخگويي به درخواستهاي پردازنده باشه بانك ديگه در حال اماده شدن براي اين پاسخگوييهاس و زمانيكه بانك اول داره داده هارو به پردازنده ارسال ميكنه بانك دوم در حال انجام داده هاي اعمال شده از طرف پردازنده هس و وقتي بانك دوم در زمان ارسال داده ها به پردازنس بانك اول در حال انجام عمليات داده ها و وهمينطور اين روند ادامه داره اينكه به همين دليل بانكها بايد حتما بايد به صورت زوج با هم باشن يعني حتما بايد دو dimm در دسترس باشه تا اين تكنيك انجام بشه

از توضيحات تكميلي شما ممنون . من هم استفاده كردم .
معماري كنتربر حافظه nforce در واقع Crossbar Based هست كه صد درصد توش از InterLeaving استفاده ميشه و من مطمئنم كه از اين تكنواوژي در كارت گرافيك ها هم بهره گرفته خواهد شد . همونطور كه اشاره شد CrossBar گذرگاه حافظه رو نصف كرده در حالي كه InterLeaving رو ميشه با گذگاه حافظه يك كاناله هم راه اندازي كرد حتي با يك DIMM . بنابر اين لزومي به حافظه دوكاناله يا DIMM‌هاي زوج نيست ! نميدونم حضور ذهن داري يا نه زماني كه گيگابايت اولين مادربردهاي چيپ nForce 2 خودش رو عرضه كرد همه چشماشون چهار تا شده بود چون اين مادربردها 4 تا DIMM داشتند در حالي كه مادربردهاي همرده مشابه 3 تا (1 دونه باسه يك كانال و دوتاي ديگه باسه اونيكي كانال) DIMM داشتند . حالا باسه اينكه توجيه كنيم گيگابايت چطوري تونسته NVIDIA‌ رو بپيچونه بايد تعريف بانك حافظه مشخص بشه (كه من تو وبلاگم هم سرش بحث و تبادل نظر كردم)
بانك حافظه عبارتست از بخشي از كل ماژول حافظه كه به صورت كاملا مستقل كنترل مي‌شود . به عنوان مثال كنترلر حافظه DDR‌ ي كه ما به صورت يكپارچه 64 بيتي ميبينيم در واقع دو كنترلر كاملا مستقل 32 بيتي داره كه هر كدوم از اين كنترلرهاي 32 بيتي يك بانك رو تحت سلطه دارند . اگه روي 3 تا DIMM مادربردي كه اين كنترلر حافظه رو داره 1 دونه از dimm ها رو پر كنيم نصف تراشه هاي DRAM اون ماژول ميشه يك بانك و نصف ديگه ميشه بانك دوم . اگه دو تا نصب كنيم نصف ماژول اول + نصف ماژول دوم ميشه يك بانك و بقيه بانك دوم رو تشكيل ميدهند . به همين ترتيب ماژول ها روي اين كنترلر حافظه به دو قسمت مساوي تقسيم شده و نصفي تحت كنترلر يك بانك و بقيه تحت كنترلر بانك دوم در مياد .

اين عكس شماتيكي از كنترلر حافظه DDR‌ تك كاناله هست (اين اطلاعات به صورت جامع تر به زودي در كتاب "حافظه اصلي در كامپيوترهاي شخصي" چاپ ميشه)

attachment.php
با اين توضيحات در توجيه ابتكار گيگابايت رو مادربردهاي nForce 2 :
كانال دوم nForce 2 مثل كانال اولش نيست و حداكثر ميتونه تا سقف 16 تا تراشه ( 8 تا براي هر بانك) رو آدرس دهي كنه به همين خاطر يك DIMM بهش اختصاص داده شده تا يك ماژول 16 چيپي روش سوار بشه . گيگابايت باسه خودش قانون درست كرده كه اگه ميخوايد از ماژول هاي دو طرفه (16 چيپ) استفاده كنيد حداكثر يك دونه از دوتا DIMM كانال دوم رو ميتونيد پر كنيد اما اگه از ماژول يك طرفه (8 چيپ) استفاده ميكنيد ميتونيد هر دو تا DIMM كانال دوم رو پر كنيد .

خوب با اين مثال ديگه بايد متوجه شده باشي كه بانك حافظه چيه و Interleaving نيازي به حافظه دوكاناله يا دو تا DIMM نداره .

ببين Pharhelia داراي Memory Interface ي 512 بيتي هست ؟ اينجوري كه خيلي خفن ميشه ! حساب كن 512 تا اتصال بين GPU‌و تراشه هاي DRAM بخواند بكشند !!!!! چه خر تو خريه :))
راستي به اون عكسي كه در مورد Crossbar گذاشتم دقت كردي ؟ گفته شده كه هركدوم از كنترلرهاي چهارگانه دسترسي كاملي به كليه تراشه ها دارند !!!!! تصوير هم بر اين مطلب صحه ميگذاره !! يعني هر كنترلر 256 تا اتصال به تراشه ها داره و در كل 256x4 تا اتصال ميان GPU‌و رم هست ؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟!!!!!!!!!!!! بعيد به نظر مياد !!!
 

فایل های ضمیمه

  • No28.png
    No28.png
    45.4 KB · نمایش ها: 89

rax

کاربر قدیمی پرشین تولز
کاربر قدیمی پرشین تولز
تاریخ عضویت
15 دسامبر 2004
نوشته‌ها
10,526
لایک‌ها
2,351
محل سکونت
تهران
عليرضا خان اين كتاب هنوز مگه زير چاپ نرفته...اگه حاضر شده يه ندايي بده ...

راجع به تنكنولوژي هاي منحصر به فرد كارتهاي VOODOO هم يكم بحث بشه بدك نيست...من خيلي مشتاقم بدونم..
كسي اطلاعاتي داره...
 
بالا