سلام
همونطور كه ميدونيد "پهناي باند حافظه" در كارت گرافيك يكي از فاكتورهايي هست كه به شدت بر عملكرد تاثير ميگذاره چرا كه عمليات پردازش و بافت گذاري هر پيكسل فقط در يك مرجله صورت نميگيره و شايد نياز باشه تا بارها و بارها پردازش شده و در حافظه محلي كارت ذخيره گردد و تا براي ارسال به صفحه نمايش آماده گردد. به همين خاطر كمپاني هاي ATI و NVIDIA خيلي روي بهينه سازي پهناي باند حافظه كار كردند . در صورتي كه بخواهيم نرخ حداكثر پهناي باند رو افزايش دهيم دو روش ساده وجود داره : عرض گذرگاه حافظه يا Memory Interface در كارت گرافيك رو گسترش بديم يا اينكه فركانس كاري تراشه هاي DRAM رو بالا ببريم . هر دوي اين روش ها روي كارتگرافيك هاي مدرن تا آنجا كه امكان داشت به كار گرفته شده اند اما هنوز هم "پهناي باند حافظه" در كارت گرافيك به عنوان يك گلوگاه ارتباطي به شمار ميرفت . علاوه بر اين كنترلرهاي حافظه قبل از Geforce 3 دو تا مشكل عمده ديگه هم داشتند . تاخير بسيار زياد حافظه هاي كارت گرافيك موجب شده بود تا بخش عمده اي از سيكل كلاك هاي ارزشمند پهناي باند حافظه صرف تاخيرهاي بيهوده بشه در از "پهناي باند حافظه" به صورت موثر بهره برده نميشد . دومين مشكل اينه كه كنترلرهاي حافظه DDR معمول ميتونند داده ها رو با حجم 256 بيت = 32 بايت جابجا كنند . اگر مثلثي كه قرار بافت گذاري بشه فقي سايز يك پيكسلي داشته باشد 8 بايت (32 بيت رنگ و 32 بيت عمق z ) از اين 32 بايت رو به خودش اختصاص ميده و 75 درصد بقيه پهناي باند در اون سيكل كلاك كاملا به هدر ميره .
راه كاري كه NVIDIA براي بهينه سازي گذرگاه حافظه در Geforce 3 بود LMA نام داشت يا LightSpeed Memory Architector . در اين معماري نرخ حداكثر Fill Rate برابر 800 مگاپيكسل در ثانيه شده بود در حالي كه Geforce 2 GTS حداكثر Fill Rate ي برابر 1000 مگاپيكسل در ثانيه داشت . اما عملكرد كنترلر حافظه Geforce 3 با Geforce 2 اصلا قابل ملاحظه نبود . در واقع LMA از پهناي باند محدود خودش به صورت موثر تري بهره ميبرد يعني نرخ پهناي باند واقعي رو تونسته بود به نرخ حداكثر پهناي باند نزديك كنه . يكي از راه كارهايي كه تو LMA ازش استفاده شده همين Crossbar Memory Controller هست .
همونطور كه ميبينيد كنترلر حافظه Crossbar از چهار تا زيركنترلر كاملا مستقل تشكيل شده كه هر كدومشون دسترسي كاملي برابر Memory Interface به تراشه هاي DRAMدارند . با اين تفكيك هنگامي كه نياز باشه فقط 32 بيت داده ارسال بشه يك زيركنترلر اين وظيفه رو بر عهده ميگيره و سه زير كنترلر ديگه آزاد ميمونند . علاوه بر اين ميزان تاخير نيز 4 برابر كاهش پيدا كرده است .
ATI هم از سري Radeon 9700 از كنترلر حافظه CrossBar رو كارت هاي گرون قيمتش اسفاده كرد اما كنترلر حافظه ATI به اندازه LMA كارايي نداره در حالي كه نرخ پهناي بايند خيلي بيشتري رو داره اما ساير تكنولوژي هاي همراه LMA رو به همراه ندارد .
با اين توضيحات كارت گرافيك هايي كه Memory Interface اونها نصف شده ( مثل كارت گرافيك هاي 64 بيت) علاوه بر اين كه پهناي باند حافظه رو نصف كردند رسما تاخير دسترسي به حافظه رو هم دو برابر كرده اند . و اين كارت MX4000 كه مثالش رو زديم شاهكاريه كه تاخير رو 4 برابر ميكنه
InterLeaving رو من نشنيدم تو كارت گرافيك ها بكار ببرند اما روي بردهايي كه CrossBar تداشتند حتمي از Interleaving بايد استفاده كنند . در واقع CrossBar نوع پيشرفته تري از inteleaving به شمار ميره .
در interleaving حافظه ها به دو يا چهار بخش تقسيم ميشوند كه به هر كدومشون ميگند يك بانك حافظه (تعريف بانك حافظه يك كم گنگ تره تو وبلاگم در اين باره بحث شده ) وقتي كه يك بانك داره داده ها رو ميخونه بانك دوم خودش رو براي خوانده شدن آماده ميكنه . با اين كار تاخير در خواندن و نوشتن داده ها كاهش پيدا خواهد كرد .
آقا من از آخر فرق NV41 رو با NV42 نفهميدم .