بسیاری از علاقمندان به دنیای سختافزار کامپیوتر بیصبرانه منتظر آغاز سال 2011 میلادی و عرضه پردازندههای مبتنی بر معماری جدید اینتل بودند. اکنون این انتظار به پایان رسیده و اینتل پردازندههای مبتنی بر معماری جدیدش را معرفی کردهاست. تصور میکنم امروز کمتر کسی است که نام Sandy Bridge را نشنیدهباشد. Sandy Bridge معماری جدید پردازندههای اینتل است که مطابق با وعدههای مدیران اینتل قرار است تحول بزرگ دیگری در صنعت پردازندههای خانگی و موبایل ایجاد کند. در شماره 23 این نشریه درباره سوکت و چیپست مورد پشتیبانی توسط این نسل جدید از پردازندهها مطالبی ارائه شد اما اکنون قصد داریم درباره ریزمعماری آن صحبت کنیم و به بررسی دلایلی بپردازیم که موجب افزایش کارایی در پردازندههای مبتنی بر این معماری جدید شدهاست.
چرا Sandy Bridge؟
اجازه
دهید قبل از اینکه به بررسی جزئیات کامل معماری پردازندههای مبتنی بر
Sandy Bridge بپردازیم، این موضوع را بررسی کنیم که چرا اینتل تصمیم به
تعویض معماری پردازندههایش گرفت. همانطور که میدانید، پردازندههای
مبتنی بر معماری Nehalem، هم از کارایی بالایی برخوردار هستند، هم اینکه
مورد استقبال بازار واقع شدهاند. علاوه بر این، رقیب اصلی اینتل یعنی AMD
نیز نتوانسته محصولی ارائه کند که رقیبی جدی برای پردازندههای اینتل به
شمار آید و بیشتر پردازندههای رایج این شرکت از پردازندههای مبتنی بر
معماری Nehalem ضعیفتر هستند. اما دلیلی که موجب شده تا اینتل معماری
جدیدی معرفی کند، نقایص معماری Nehalem است که مهندسان اینتل را مجبور کرده
تا با وجود تمام مشکلاتی که بر سر راه معرفی یک معماری جدید وجود دارد،
معماری جدیدی برای پردازندههای خود معرفی کنند. شاید از موارد زیر بتوان
بهعنوان ضعفهای معماری Nehalem نام برد.
اولین ضعفی که در این میان وجود دارد، این
است که آخرین نسل از پردازندههای مبتنی بر معماری Nehalem یعنی
پردازندههای مبتنی بر خانواده Westerme، فرآیند ساخت پیچیدهای داشتند.
آنها دارای دو هسته مجزا با دو فرآیند ساخت متفاوت بودند (هسته پردازنده
فرآیند ساخت 32 نانومتری داشت و پردازندهگرافیکی 45 نانومتری بود). دوم
اینکه، پردازندههای مبتنی بر معماری Nehalem به حداکثر میزان فرکانس
رسیدهبودند یا به عبارت دیگر، اینتل با این معماری دیگر قادر به افزایش
فرکانس پردازندههای خود نبود، بنابراین تنها روش برای افزایش کارایی
پردازنده، تغییر در ساختار معماری پردازنده بود.
مشخصات کلی
از دو سال
پیش تاکنون اینتل سعی کرده عملکردهای مربوط به چیپستها را به تدریج به
درون پردازنده انتقال دهد. در اولین پردازنده مبتنی بر معماری Nehalem
(یعنی Bloomfield) وظیفه کنترل حافظه از چیپست مادربورد به درون پردازنده
انتقال یافت. به عبارت دیگر، کنترلر حافظه به جای چیپست مادربورد در
پردازنده گنجانده شد. در خانواده بعدی پردازندههای اینتل یعنی Lynnfield،
علاوه بر کنترلر حافظه، کنترلر رابط PCI-Express نیز به درون پردازنده
منتقل شد. بعد از این موضوع، در پردازندههای Clarkdale، پردازندهگرافیکی
نیز در پردازندهمرکزی گنجانده شد. اگرچه این هسته بهطور مستقیم، داخل خود
هسته پردازنده گنجانده نشد اما به هرحال وظیفه پردازش گرافیکی سیستم، به
جای چیپستهای گرافیک مجتمع به پردازنده منتقل شد. اما اکنون در Sandy
Bridge همهچیز درون پردازنده گنجانده شدهاست. به عبارتی، در این معماری
هسته گرافیکی، کنترلر حافظه و کنترلر رابط PCI-Express درون هسته پردازنده
گنجانده شدهاند.
معماری Sandy Bridge از نظر مشخصات کلی
تفاوت چندانی با نسل قبل نداشتهاست. پردازندههای مبتنی بر این معماری 32
نانومتری هستند و مانند پردازندههای نسل قبل، دو یا چهارهستهای خواهند
بود که از فناوری Hyper Threading نیز پشتیبانی میکنند و دارای حداکثر هشت
مگابایت حافظه نهان سطح سه، کنترلر حافظه دوکاناله DDR3، کنترلر رابط
PCI-Express نسخه دو با پشتیبانی از شانزده مسیر و در نهایت، دارای یک واحد
پردازشگرافیکی با قابلیت پشتیبانی از رابط DirectX 10.1 هستند.
پیشرفتهای
انجامشده در معماری Sandy Bridge بیشتر در ریزمعماری و واحدهای اجرایی
درون هسته است. بهطوری که ریزمعماری هستههای محاسباتی تغییرات جدی داشته و
این موضوع موجب شده تا پردازندههای جدید بهطور قابل توجهی سریعتر از
پردازندههای نسل قبل در فرکانس یکسان عمل کنند. مهندسان اینتل همچنین برای
کاهش حرارت پردازنده، کارهای متعددی انجام دادهاند، بنابراین
پردازندههای مبتنی بر Sandy Bridge قادر خواهند بود به سادگی در ضریب
کلاکهای بالاتر عمل کنند. علاوه بر این، پردازندههای جدید از
دستورالعملهای AVX یا Advanced Vector Extension جدیدی نیز پشتیبانی
میکنند که برای تعدادی از الگوریتمهای چندرسانهای، مالی یا علمی
موردنیاز خواهدبود. AVX با مجموعه دستورالعملهای قبل SSE تفاوت دارد. این
دستورالعملها دارای عرض باند بالاتری هستند (265 بیت به جای 128 بیت) و
بنابراین اجازه خواهند داد، میزان دادههای وسیعتری پردازش شوند. در ادامه
مقاله، به بررسی جزئیات تحولات انجامشده در معماری جدید خواهیم پرداخت.
اینتل انتظار دارد، پردازندههای مبتنی بر Sandy Bridge به سرعت مورد استقبال بیشتر خریداران قرار گیرد. آنها قصد دارند، گستره وسیعی از پردازندههای Core i5 ،Core i3 و Core i7 مبتنی بر این معماری جدید را با قیمتی بین صد تا سیصد دلار در همین آغاز کار به بازار عرضه کنند و در انتهای سال 2011 نیز قصد دارند، پردازندههای گرانقیمتتر مبتنی بر این معماری عرضه کنند.
پردازندههای معرفیشده در تصویر بالا، برای کامپیوترهای خانگی هستند اما پردازندههای 65 و 45 واتی تصویر زیر برای کامپیوترهای همراه در نظر گرفته شدهاند.
این پردازندها در حقیقت جایگزین
پردازندهای مبتنی بر سوکت 1156 خواهندشد و اینتل قصد ندارد تا اواخر سال
2011 میلادی جایگزینی برای پردازندههای مبتنی بر سوکت 1366 معرفی کند.
اینتل در حقیقت قصد دارد پردازندههای حرفهای مبتنی بر معماری Sandy
Bridge را در اواخر سال 2011 میلادی معرفی کند. این پردازندهها مبتنی بر
سوکت 2011 خواهندبود و دارای هشت هسته پردازشی، شانزده مگابایت حافظه نهان
سطح سه، کنترلکننده حافظه چهارکاناله، 32 مسیر PCI Express نسخه سه و به
احتمال چند فناوری جذاب دیگر هستند.
پردازندههای مبتنی بر Sandy
Bridge با سوکت 1155 سازگار هستند و این سوکت با پردازندههای مبتنی بر
معماری Nehalem سوکت 1156 سازگاری ندارد. اینتل همچنین برای این نسل از
پردازندهای خود چیپستهای جدید معرفی کردهاست. با توجه به اینکه تمامی
وظایف مرتبط با پلشمالی به پردازنده محول شده، چیپستهای P67 و H67
بسیار ساده هستند. این چیپستها مانند نسل قبل تکچیپست هستند اما تفاوت
عمده آنها نسبت به چیپستهای نسل قبل پشتیبانی از دو پورت SATA نسخه سه و
عدم پشتیبانی از رابطهای PCI سنتی است. متأسفانه این چیپستهای جدید
مشابه نسل ماقبل خود فاقد قابلیت پشتیبانی از پورت USB 3.0 هستند.
افزایش کارایی از چه روشی؟
شرکت
اینتل در معماری Sandy Bridge چندین تغییر غیرمنتظره ایجاد کرده که به
موجب آن کارایی پردازنده افزایش و در مقابل مصرف توان و درجه حرارت آن کاهش
پیدا کردهاست. در حقیقت، Sandy Bridge معماری توسعهیافته Nehalem نیست،
بلکه این معماری ترکیبی از معماری Nehalem با پروژه به ظاهر شکستخورده
پنتیوم 4 است. بله؛ درست متوجه شدهاید، اگرچه معماری NetBurst شرکت اینتل
مدت زمان زیادی است که به دلیل مصرف توان ناکارآمد منسوخ شده اما اکنون از
برخی واحدهای پردازندههای پنتیوم 4 در پردازندههای Core i5 ،Core i3 و
Core i7 جدید استفاده شدهاست. شاید شنیدن این نکته جالب باشد که اینتل
عنوان کرده، اقتباس برخی از بخشها از پنتیوم 4 فقط برای افزایش کارایی
نبوده بلکه بیشتر برای کاهش مصرف توان بودهاست.
تغییرات انجامشده در
معماری Sandy Bridge را با بررسی خط لولهها آغاز میکنیم. در ابتدای خط
لولهها، رمزگشاها قرار دارند که همچون گذشته دستورالعملهای x86 را به
Micro-ops سادهتر رمزگشایی میکنند. رمزگشاها در معماری جدید مشابه با
Nehalem در هر سیکل چهار دستورالعمل پردازش میکنند و مانند گذشته از
فناوری Micro-Fusion و Macro Fusion نیز پشتیبانی میکنند. اما در معماری
جدید، دستورالعملهای رمزگشاییشده به Micro-Opsها به جای اینکه به مرحله
بعدی پردازش بروند، ذخیره میشوند. در حقیقت، Sandy Bridge یک حافظه سطح
صفر اضافی برای ذخیره نتایج رمزگشایی دارد. این حافظه نهان اولین بخشی است
که از معماری NetBurst برگرفته شدهاست. عملکرد کلی این حافظه نهان مشابه
Execution Trace Cache است که در پردازندههای پنیتوم 4 بهکار گرفته
شدهبود.
حافظه نهان Micro-Opsهای رمزگشاییشده
حدود شش کیلوبایت است که میتواند حداکثر یکهزار و پانصد Micro-Ops در خود
ذخیره کند. اکنون اگر رمزگشا دستورالعملی دریافت کند که قبلاً ترجمه کرده و
در حافظه نهان نیز ذخیره شده، دوباره آن دستورالعمل را رمزگشایی نمیکند و
از Micro-Ops مربوط به آن دستورالعمل که در حافظه نهان Micro-Ops ذخیره
شده، استفاده میکند. بنابراین حافظه نهان Micro Opsهای رمزگشاییشده به
حذف بار اضافی از رمزگشاها کمک میکند و همچنین موجب کاهش مصرف انرزی
پردازنده میشود. بنابر گفته مهندسان اینتل در هشتاد درصد مواقع دسترسی به
این حافظه نهان اضافی موردنیاز است. گذشته از این، زمانی که رمزگشاها در
معماری Sandy Bridge بیکار هستند، غیرفعال میشوند که این موضوع به کاهش
مصرف توان پردازنده کمک میکند.
دومین پیشرفت مهم در خط لولهها مربوط
به واحد پیشبینی انشعاب است. این واحد از اهمیت بسزایی در پردازندهها
برخوردار است زیرا هر پیشبینی انشعاب نادرست نیازمند توقف و تخلیه خط
لولهها بهطور کامل است. در نتیجه، یک پیشبینی اشتباه نه تنها روی کارایی
اثر منفی دارد، بلکه موجب افزایش توان مصرفی برای پر کردن دوباره خط لوله
میشود. اینتل به این واحد در پردازندههای جدید توجه ویژهای کرده تا
آنها بهطور موثرتری عمل کنند. این شرکت همه بافرهای Sandy Bridge را که
برای ذخیره آدرسهای انشعابها و تاریخچه پیشبینی بهکار گرفته شده، به
منظور افزایش حجم ذخیرهسازی در آنها اصلاح کردهاست. در نتیجه Sandy
Bridge اکنون قادر است تاریخچه پیشبینی انشعابهای طولانیتری ذخیره کند.
این موضوع تأثیر زیادی روی کارایی واحد پیشبینی انشعاب میگذارد. مطابق
برآوردهای اولیه، درستی پیشبینی انشعاب در Sandy Bridge به بیش از پنج
درصد در مقایسه با نسل قبل بهبود پیدا کردهاست.
همانطور که گفته شد، واحد پیشبینی انشعاب در پردازندههای غیرترتیبی از اهمیت بالایی برخوردار است و اغلب، سازندگان با معرفی یک معماری جدید تغییراتی در این واحد اعمال میکنند. این واحد در معماری Sandy Bridge از نظر ساختار شباهت بسیاری به معماری NetBrust دارد. مهندسان اینتل یکبار دیگر به عقب برگشته و از رجیستر فایل درون پردازنده جدید خود استفاده کردهاند (اگر به خاطر داشتهباشید، مهندسان اینتل این رجیستر فایلها را در پردازندههای Nehalem و Core بازنشسته کردند). در گذشته زمانیکه Micro-Opsها بازآرایی میشدند، کپی کاملی از رجیسترها برای هر عملیات در رجیستر فایلها ذخیره میشد. اما اکنون از مسیر (Link) به مقادیر رجیستری ذخیرهشده در یک رجیستر فایل استفاده میشود. این رویکرد علاوه بر اینکه موجب حذف انتقال دادههای مفرط میشود، از تکرار محتویات رجیستر نیز جلوگیری میکند و موجب ذخیره فضا در رجیستر فایل میشود.
خوشه (Cluster) غیرترتیبی در پردازندههای
Sandy Bridge میتواند در زمان یکسانی تا حداکثر 168 Micro-Ops نگه دارد،
در حالیکه پردازندههای Nehalem قادر به ذخیرهسازی تنها 128 Micro-Ops در
ROBهای خود (Reorder Buffer) بودند. این موضوع موجب کاهش مصرف انرژی
میشود. به هر حال، جایگزین کردن روش مسیردهی به رجیستر فایلها در عوض
دسترسی به مقادیر واقعی آنها اثرات منفی نیز به همراه دارد. این موضوع سبب
شده تا مرحله جدیدی به خط لولههای اجرایی پردازنده اضافه میشود.
پردازندههای
مبتنی بر Sandy Bridge از دستورالعملهای AVX جدید با رجیسترهای 256 بیتی
پشتیبانی میکنند. دستورالعملهای AVX در حقیقت جزئی از پیشرفت SSE به شمار
میآیند که در آن اندازه رجیسترهای SIMD رأس به 256 بیتی افزایش
یافتهاست. در نتیجه، مجموعه دستورالعملهای AVX، مشابه پیشرفت ریزمعماری،
میتواند موجب افزایش کارایی و کاهش توان مصرفی شود. زیرا اجرای این
دستورالعمل اجازه خواهد داد تا بسیاری از الگوریتمها ساده شده و از
دستورالعملهای کمتری برای تکمیل وظایف استفاده شود. دستورالعملهای AVX
برای محاسبات ممیز شناور سنگین در کاربردهای چندرسانهای، علمی و مالی
کاملاً مناسب است.
واحدهای اجرایی پردازنده برای اینکه بتوانند
دستورالعملهای 256 بیتی را بهطور مؤثرتری اجرا کنند، باید دوباره طراحی
میشدند. اینتل در طراحی جدید، دو واحد اجرایی 128 بیتی با یکدیگر جفت
کرده تا بتوانند بستههای اطلاعات 256 بیتی را بهطور مؤثری پردازش کنند.
از این رو، هر یک از سه پورت اجرایی در پردازندههای Sandy Bridge واحدهایی
برای کار همزمان با سه نوع داده (64 بیت، 128 بیت عدد صحیح و 128 بیت عدد
حقیقی) دارند. این موضوع موجب میشود، واحدهای SIMD با یکدیگر درون یک
پورت یکسان جفت شوند.
از آنجا که Sandy Bridge برای کار با دستورالعملهای رأسی 256 بیتی طراحی شدهاست، اینتل باید به کارایی واحدهای اجرایی مسئول برای بارگذاری و تخلیه توجه ویژهای میکرد. در پردازندههای Nehalem سه پورت برای این منظور طراحی شدهبود که اکنون نیز در Sandy Bridge این پورتها موجود هستند. اما به منظور افزایش بهرهوری این واحدها، مهندسان اینتل، دو واحد از این سه واحد را که برای ذخیرهسازی آدرسها و بارگذاری اطلاعات استفاده میشد با یکدیگر ادغام کردهاند. اکنون این دو واحد عملکرد یکسانی دارند و هر یک میتوانند آدرسها و دادهها را بارگذاری یا آدرسها را تخلیه کنند. از این رو، هر پورت میتواند به واسطه عملکرد حداکثر شانزده بایت در هر سیکل، کل توان عملیاتی حافظه نهان سطح یک داده در معماری جدید را به میزان پنجاه درصد افزایش دهد. به عبارت دیگر، پردازندههای مبتنی بر معماری Sandy Bridge میتواند در هر سیکل 32 بایت داده از حافظه نهان سطح یک داده بارگذاری و شانزده بایت داده در آن ذخیره کنند.
اگر همه نوآوریهای شرح داده شده در بالا را در کنار یکدیگر قرار دهیم، خواهیم دید، معماری هستههای محاسباتی در پردازندههای Sandy Bridge بهطور چشمگیری اصلاح شدهاست. این تحولات آنقدر جدی هستند که به سادگی بتوان گفت، پردازندههای جدید اینتل از یک معماری کاملاً متفاوت با پردازندههای Nehalem بهره میبرد.
رویکرد جدید به سمت یکپارچهسازی
اینتل
با معرفی معماری Nehalem شروع به گنجاندن اجزاء چیپست در پردازنده کرد.
در معماری Nehalem کنترلر حافظه، کنترلر رابط PCI Express و
پردازندهگرافیکی، درون پردازنده گنجاندهشد. به عبارت دیگر، با این
تحولات، پردازندهها دیگر تنها یک واحد اجرایی مرکزی نیستند، بلکه
مجموعهای از واحدهای پیچیده مختلف هستند.
گنجاندن این واحدها درون پردازنده، موجب
افزایش کارایی ناشی از کاهش زمان انتظار هنگام انتقال اطلاعات میشود. به
هر حال، گنجاندن واحدهای مختلف در پردازنده مشکلاتی را نیز به همراه دارد.
یکی از مهمترین موانع بر سر این راه، چگونگی اتصال این واحدها به یکدیگر
به خصوص از نظر الکتریکی است. در این بین، اتصال حافظه نهان سطح سه اشتراکی
با هستههای پردازندهها یکی از سختترین کارها برای سازندگان است، به
خصوص اینکه تعداد هستهها روز به روز افزایش پیدا میکند. به عبارت دیگر،
زمانی که مهندسان اینتل در حال کار روی معماری پردازندههای Sandy Bridge
بودند، باید برای اتصال مناسب بین همه واحدهای درون پردازنده فکر جدی
میکردند. در معماری Nehalem و معماریهای ماقبل، از اتصال Crossbar عمومی
استفاده شده اما این اتصال برای پردازندههایی با چندین واحد متفاوت مناسب
نیست.
مهندسان اینتل پیش از این در پردازندههای هشت هستهای سرور
Nehalem-EX برای متصل کردن هستههای محاسباتی به حافظه نهان سطح سه از
فناوری جدیدی استفاده کردهاند. این فناوری Ring Bus نام دارد و اینتل
اکنون در معماری Sandy Bridge نیز از آن استفاده کردهاست. همه هستههای
محاسباتی، حافظه نهان، پردازندهگرافیکی و عناصر پلجنوبی درون پردازنده
جدید به باس حلقه (Ring Bus) متصل شدهاند که اجازه میدهد تعداد اتصالات
درون هسته به میزان قابل توجهی کاهش پیدا کند.
مهندسان اینتل حافظه
نهان سطح سه پردازندههای Sandy Bridge را به چهار بانک یکسان تقسیم
کردهاند که هر بانک دو مگابایت ظرفیت دارد. به عبارتی، تعداد این بانکها
دقیقاً یکسان با تعداد هستههای پردازنده است. این استراتژی اینتل به نظر
میرسد بیشتر برای بازاریابی بود زیرا اینتل با جدا کردن این بانکها
میتواند پردازندههایی با حافظههای نهان متفاوت و قیمتهای مختلف تولید
کند. بهطور مثال، پردازندهای ارزانقیمت با شش مگابایت حافظه نهان سطح
سه به جای هشت مگابایت تولید کند. هر یک از بانکهای حافظه نهان توسط
«arbiter» خودشان اداره میشوند اما در زمان یکسان همه آنها مشابه با
یکدیگر کار میکنند و دادهها در آنها هرگز تکراری نخواهدبود. استفاده از
این بانکها، موجب تقسیم حافظه نهان سطح سه نمیشود، بلکه تنها پهنای باند
حافظه نهان سطح سه را افزایش میدهد. برای مثال، از آنجا که «Ring» عرض 32
بیتی دارد، حداکثر پهنای باند حافظه نهان سطح سه درون یک پردازنده
چهارهستهای که در فرکانس 3/4 گیگاهرتز عمل میکند، برابر با 435/2
گیگابایت در ثانیه است. اینتل با این روش، به سادگی میتواند با افزایش
تعداد هستههای پردازنده، تعداد بانکهای حافظه نهان سطح سه را نیز افزایش
دهد.
از دیگر مزایای حافظه نهان سطح سه جدید میتوان به کاهش زمان
تأخیر آن اشاره کرد. اکنون زمان تأخیر حافظه نهان سطح سه بین 26 تا 31 سیکل
است. این زمان در حافظه نهان سطح سه پردازندههای Nehalem بین 35 تا 40
سیکل بود. این توضیح لازم است که تمامی حافظههای نهان در پردازندههای
Sandy Bridge با فرکانس پردازنده کار میکنند. به هر حال، این موضوع نیز
سبب شده تا عملکرد حافظه نهان در این پردازندهها سریعتر شود.
برتری
دیگر باس حلقه این است که از آن برای انتقال اطلاعات دادههای مربوط به
پردازندهگرافیکی که درون پردازنده گنجانده شدهاست نیز استفاده میشود.
این یعنی، پردازندهگرافیکی درون پردازنده، بهطور مستقیم با حافظه در
ارتباط نیست. این واحد شبیه هسته پردازنده با حافظه نهان سطح سه در ارتباط
است. این موضوع سبب میشود، کارایی پردازندهگرافیکی بهطور چشمگیری افزایش
پیدا کند.
پردازندهگرافیکی و ویژگیهای جدید
گنجاندن
پردازندهگرافیکی درون پردازنده موضوع جدیدی نیست. در حال حاضر،
پردازندههای مبتنی بر هسته Clarkdale با پردازندهگرافیکی مجتمعشده Intel
HD در بازار رایج هستند. در پردازندههای Sandy Bridge پردازندهگرافیکی و
محاسباتی درون یک بستهبندی قرار گرفتهاند و به باس حلقه یکسانی که با
دیگر منابع پردازنده مشترک است، متصل شدهاند. بنابراین با توجه به اینکه
اکنون پردازندهگرافیکی به کنترلر حافظه نزدیک است و دسترسی مستقیمی به
حافظه نهان سطح سه دارد، کارایی گرافیکی پردازندههای مبتنی بر Sandy
Bridge افزایش پیدا کردهاست. علاوه بر این، پردازندهگرافیکی نیز مانند
هستههای محاسباتی پردازنده از بسیاری جهات پیشرفت کرده، بهطوری که برخی،
این هسته را نسل جدید پردازندهگرافیکی اینتل مینامند. پردازندهگرافیکی
اینتل هنوز شامل حداکثر دوازده واحد اجرایی (سایهزن) است و از رابط
DirectX 10.1 پشتیبانی میکند. برخی پیشبینی کردهاند، پردازندهگرافیکی
جدید اینتل تقریباً نسبت به گذشته دو برابر سریعتر عمل میکند.
از آنجا که فرآیند ساخت پردازندهگرافیکی
به 32 نانومتر کاهش یافته، بنابراین اینتل به سادگی توانسته فرکانس
پردازندهگرافیکی را افزایش دهد. فرکانس این هسته در پردازندههای Core i7
برابر با 1/35 گیگاهرتز است که برخی اعتقاد دارند، این فرکانس میتواند به
بیش از این مقدار نیز افزایش پیدا کند. اکنون کارایی پردازندهگرافیکی
مجتمع Sandy Bridge با کارتهای گرافیکی سطح پایین و ارزانقیمت قابل رقابت
است. اینتل حتی قصد دارد در آینده از ویژگی FSAA (ضدپلگی تمام صفحه) در
پردازندهگرافیکی خود پشتیبانی کند. با توجه به موارد ذکرشده، به نظر
میرسد Sandy Bridge این شانس را داشتهباشد که عنوان بهترین
پردازندهگرافیکی مجتمع را به دست آورد. این محصول حتی تهدید جدیدی برای
کارتهای گرافیک ارزانقیمت و سطح پایین نیز به شمار میآید. به هر حال، در
همین ابتدای کار، NVIDIA و AMD شروع به تبلیغ منفی علیه این محصول
کردهاند. آنها اظهار میکنند، پردازندهگرافیکی اینتل فاقد پشتیبانی از
DirectX نسخه 11 است. این موضوع سبب میشود، پردازندهگرافیکی اینتل قادر
به اجرای بازیهای مبتنی بر این نسخه از DirectX نباشد و همچنین در
برنامههای کاربردی که از DirectCompute استفاده میکنند، مانند مرورگرهای
اینترنت آینده عملکرد نامناسبی خواهدداشت.
به هر حال، بهبود معماری
پردازندهگرافیکی موجود، تنها چیزی نبوده که در این بخش انجام شدهاست.
پردازندهگرافیکی مجتمع در پردازندههای Sandy Bridge جدید به واحد جدید
ویژهای برای رمزگذاری و رمزگشایی ویدئویی در فرمتهای مشهور مانند MPEG2
،VC1 و AVC مجهز شدهاند.
اگرچه رمزگشایی سختافزاری فایلهای ویدئویی
این روزها موضوع جدیدی نیست و پردازندهگرافیکی Clarkdale نیز در سطح خوبی
قادر به انجام این عملیات است. مسئولیت این وظیفه در هستههای قبلی بر عهده
سایهزنها بوده، در حالی که در هسته جدید، واحد ویژهای این مسئولیت را
بر عهده دارد. این تغییرات برای پشتیبانی مناسب از ویدئویی سهبعدی
موردنیاز بود، بنابراین پردازندهگرافیکی جدید میتواند به آسانی از عهده
ویدئو سهبعدی به واسطه رمزگشایی سختافزاری جریانات MVC و Blu-ray سهبعدی
استریو برآید.
کدک (Codec) سختافزاری یکی دیگر از ویژگیهای قابل
توجه پردازندهگرافیکی Sandy Bridge است. این کدک میتواند ویدئوهای با
فرمت AVC را رمزگذاری کند. در عمل به این معنی است که، پردازندهگرافیکی
Sandy Bridge همه منابع موردنیاز برای رمزگشایی ویدئویی سریع را بدون نیاز
به منابع پردازنده در اختیار دارد.
همه میدانیم که عملکرد چندرسانهای پردازندههای Sandy Bridge جدید توسط برنامههای کاربردی مشهوری همچون
ArcSoftMediaConverter ،Corel DVD Factory ،CyberLinkMediaEspresso،Roxio
Creator و... پشتیبانی خواهدشد. در این روش، زمانیکه واحدهای چندرسانهای
درون پردازندهگرافیکی Sandy Bridge برای کدگذاری ویدئویی استفاده
میشوند، پردازندههای سایهزن آزاد باقی میمانند. بنابراین آنها
میتوانند پردازش ویدئویی دیگری را انجام دهند که این موضوع باعث بهبود
کارایی پردازندهگرافیکی میشود.
پردازندههای مبتنی بر معماری Sandy
Bridge یکی از پردازندههای گرافیکی Intel HD 2000 یا Intel HD 3000 را
خواهد داشت. این دو پردازندهگرافیکی از نظر تعداد واحدهای اجرایی
(سایهزنها) با یکدیگر اختلاف دارند. پردازندهگرافیکی HD 3000 دارای
دوازده واحد اجرایی و HD 2000 دارای شش واحد اجرایی است. همچنین فرکانس
پردازندهگرافیکی HD 2000 کمی پایینتر از HD 3000 است. با این وجود،
سختافزار رمزگذاری و رمزگشایی در هر دو پردازندهگرافیکی یکسان است.
پلشمالی جدید- System Agent
پردازندههای
Sandy Bridge جدید برای ارتباط با دیگر اجزای سیستم شامل همه کنترلرهای
خارجی مانند: رابط حافظه، صفحهنمایش، DMI و PCI Express از واحدی که به
اصطلاح System Agent نامیده میشود، استفاده میکنند. در حقیقت، System
Agent خیلی شبیه واحد Uncore در پردازندههای Nehalem است. اما عملکرد
System Agent دقیقاً مشابه با عملکرد Uncore نیست. اکنون System Agent شامل
حافظه نهان سطح سه نیست و این حافظه نهان یک واحد منحصر بهفرد است که با
فرکانس پردازنده عمل میکند، در حالیکه Uncore شامل حافظه نهان سطح سه
بود و با فرکانسی متمایز از فرکانس پردازنده عمل میکرد. خصوصیت دیگری که
System Agent را از Uncore متمایز میکند، استفاده آن از باس حلقه برای
تبادل اطلاعات بین پردازنده، پردازندهگرافیکی و حافظه نهان سطح سه است.
مهمترین پیشرفت در System Agent مربوط به کنترلر حافظه میشود. کنترلر حافظه در پردازندههای (Westerme (Clarkdale با پردازندهگرافیکی ترکیب شدهبود که این راهحل زیاد موفقیتآمیز نبود. اما سرانجام مهندسان اینتل این مسئله را در Sandy Bridge حل کردند. اکنون کنترلر حافظه در پردازندههای جدیدکارایی مشابه با کنترلر حافظه در پردازندههای Lynnfield دارد. توجه کنید که این کنترلر از حافظههای DDR3 1066 یا DDR3 1333 پشتیبانی میکند. تصویر زیر، کارایی کنترلر حافظه در پردازندههای جدید را نشان میدهد.
زمانهای تأخیر در معماری جدید دارای
کاهش چشمگیری بوده و پهنای باند زیر سیستم حافظه نیز ارتقاء خوبی
داشتهاست. کنترلر باس PCIE در Sandy Bridge شبیه پردازندههای LGA 1156
است. این کنترلر از شانزده مسیر PCI-Express نسخه دو پشتیبانی میکند که
این مسیرها میتوانند به صورت یک رابط x16 یا دو رابط x8 پیکرهبندی شوند.
واحد کنترلر توان
گذشته
از کنترلرهای خارجی، بخش مهم دیگر System Agent واحد کنترلر توان (PCU)
است. شبیه پردازندههای Nehalem این واحد یک میکروکنترلر قابل برنامهریزی
است که اطلاعات مربوط به جریان و درجه حرارت بخشهای مختلف پردازنده را
جمعآوری میکند و میتواند ولتاژها و فرکانسهای آنها را کنترل کند. PCU
خصوصیات مربوط به ذخیرهسازی توان و ویژگی Turbo Mode را بر عهده دارد.
بهطور
کلی، واحدهای مختلف در معماری Sandy Bridge به سه بخش تقسیم شدهاند که
هر بخش از الگوریتم فرکانس و توان مخصوص به خود استفاده میکند. اولین بخش،
شامل هستههای پردازنده و حافظه نهان سطح سه میشود که در ولتاژ و فرکانس
یکسانی کار میکنند. دومین بخش، پردازندهگرافیکی است که با فرکانس مربوط
به خودش عمل میکند و سومین بخش نیز، System Agent است.
این ساختار به
مهندسان اینتل اجازه داده تا از فناوری Enhanced Intel SpeedStep و Turbo
Boost برای پردازندههای گرافیکی و هستههای پردازنده بهطور جداگانه
استفاده کنند. Sandy Bridge بهطور سختافزاری فرکانس هسته پردازشی و
گرافیک را با توجه به مصرف توانشان کنترل میکند. این سختافزار موجب
میشود، فرکانس هستههای پردازندهها بهطور مؤثرتری در وضعیت Turbo Mode و
زمانی که پردازندهگرافیکی بیکار است، اورکلاک شود و برعکس
پردازندهگرافیکی در زمانی که هستههای پردازشی پردازنده بهطور کامل
استفاده نمیشوند، به میزان قابل توجهتری اورکلاک میشود.
فناوری Turbo Boost شامل تغییرات زیادی
نشده تنها پیشرفتی که در این بخش ایجاد شده، مربوط به PCU است. این واحد
اکنون میتواند فرکانس را بهطور هوشمندتری کنترل کند و علاوه بر مدیریت
توان مصرفی واحدهای پردازنده، حرارت هر هسته را تحتنظر داشتهباشد. با
این ویژگی، اینتل به پردازندههای خود اجازه داده تا هنگامی که در شرایط
حرارتی مطلوبی قرار دارند، مصرف توانشان از حداکثر TDP مجاز تجاوز کند.
بار
پردازنده در طی روز خیلی نامتقارن است، بهطوری که در بیشتر مواقع
پردازنده در وضعیت ذخیرهسازی توان قرار دارد و بندرت به کار خیلی سریع
نیاز دارد. واحد PCU در پردازندههای Sandy Bridge که فرکانسها را کنترل
میکند، طوری طراحی شده که در چنین مواقعی فرکانس پردازنده را به میزان
قابل توجهی افزایش دهد و هنگامی که درجه حرارت پردازنده به آستانه بحرانی
رسید، فرکانس را به سطح معقول کاهش دهد.
با توجه به این ویژگی پیشنهاد میشود، کاربران از سیستم خنککنندگی مناسبی برای پردازندههای مبتنی بر Sandy Bridge استفاده کنند تا بتوانند حداکثر کارایی را از چنین پردازندههایی به دست آورند. البته این توضیح لازم است که اینتل محدودیتی نیز برای چنین وضعیتی در نظر گرفتهاست و پردازندههای مبتنی بر Sandy Bridge تنها به مدت 25 ثانیه میتوانند در این وضعیت عمل کنند.
نتیجهگیری
همانطور
که اشاره شد، معماری جدید اینتل شامل تعدادی نوآوری همچون پشتیبانی از
دستورالعملهای 256 بیتی AVX، افزایش کارایی پردازندهگرافیکی، ماژول
سختافزاری برای رمزگذاری و رمزگشایی ویدئویی، حافظه نهان سطح سه جدید، باس
حلقه، System Agent هوشمند، فناوری Turbo Boost پیشرفتهتر و فرکانس
بالاتر شدهاست. برخی از این نوآوریها تأثیر بسزایی روی کارایی
خواهندداشت، بهطوری که پردازندههای مبتنی بر Sandy Bridge نسبت به
پردازندههای نسل قبل سریعتر عمل میکنند.
یک پردازنده Sandy Bridge
در قیمتی یکسان با یک پردازنده Clarkdale یا Lynnfield میتواند کارایی
حداقل 25 درصد بالاتر در کاربردهای وابسته به پردازنده ارائه کند. بهطور
کلی، Sandy Bridge قادر است در برخی از کاربردها به واسطه ساختمان واحدهای
جدیدش کارایی حتی تا ده برابر بالاتر نسبت به پردازندههای نسل قبل خود
ارائه کند. این افزایش کارایی به خصوص در برنامههای رمزگذاری/رمزگشایی
ویدئویی به واسطه رمزگذار/رمزگشا سختافزاری ویژه در پردازنده قابل مشاهده
است. همچنین الگوریتمهای مالی، علمی و چندرسانهای روی پردازندههای جدید
به واسطه دستورالعملهای AVX و AES-IN سریعتر اجرا خواهندشد. البته لازم
است اشاره کنم، استفاده از این نوآوریها منوط به پشتیبانی توسعهدهندگان
نرمافزارها از این ویژگیهای جدید پردازندههای اینتل در محصولاتشان است.
این موضوع نیز زیاد جای نگرانی ندارد، با توجه به تدابیری که مهندسان اینتل
در نظر گرفتهاند، بهطور قطع، محصولات نرمافزاری متعددی مبتنی بر این
ویژگی عرضه خواهدشد. پردازندهگرافیکی گنجاندهشده در پردازندههای جدید
نیز نسبت به نسل قبل بسیار سریعتر شدهاست که این موضوع نیز برای کاربرانی
که قصد استفاده از گرافیک مجتمع دارند و همچنین کاربران کامپیوترهای همراه
بسیار خوشایند خواهدبود.