سفیر رایانه

همه چیز درباره کامپیوتر

سفیر رایانه

همه چیز درباره کامپیوتر

همه‌ چیز درباره سندی بریج

بسیاری از علاقمندان به دنیای سخت‌افزار کامپیوتر بی‌صبرانه منتظر آغاز سال 2011 میلادی و عرضه پردازنده‌های مبتنی بر معماری جدید اینتل بودند. اکنون این انتظار به پایان رسیده و اینتل پردازنده‌های مبتنی بر معماری جدیدش را معرفی کرده‌است. تصور می‌کنم امروز کمتر کسی است که نام Sandy Bridge را نشنیده‌باشد. Sandy Bridge معماری جدید پردازنده‌های اینتل است که مطابق با وعده‌های مدیران اینتل قرار است تحول بزرگ دیگری در صنعت پردازنده‌های خانگی و موبایل ایجاد کند. در شماره 23 این نشریه درباره سوکت و چیپ‌ست مورد پشتیبانی توسط این نسل جدید از پردازنده‌ها مطالبی ارائه شد اما اکنون قصد داریم درباره ریزمعماری آن صحبت کنیم و  به بررسی دلایلی بپردازیم که موجب افزایش کارایی در پردازنده‌های مبتنی بر این معماری جدید شده‌است.


چرا Sandy Bridge؟
اجازه دهید قبل از این‌که به بررسی جزئیات کامل معماری پردازنده‌های مبتنی بر Sandy Bridge بپردازیم، این موضوع را بررسی کنیم که چرا اینتل تصمیم به تعویض معماری پردازنده‌هایش گرفت. همان‌طور که می‌دانید، پردازنده‌های مبتنی بر معماری Nehalem، هم از کارایی بالایی برخوردار هستند، هم این‌که مورد استقبال بازار واقع شده‌اند. علاوه بر این، رقیب اصلی اینتل یعنی AMD نیز نتوانسته محصولی ارائه کند که رقیبی جدی برای پردازنده‌های اینتل به شمار آید و بیشتر پردازنده‌های رایج این شرکت از پردازنده‌های مبتنی بر معماری Nehalem ضعیف‌تر هستند. اما دلیلی که موجب شده تا اینتل معماری جدیدی معرفی کند، نقایص معماری Nehalem است که مهندسان اینتل را مجبور کرده تا با وجود تمام مشکلاتی که بر سر راه معرفی یک معماری جدید وجود دارد، معماری جدیدی برای پردازنده‌های خود معرفی کنند. شاید از موارد زیر بتوان به‌عنوان ضعف‌های معماری Nehalem نام برد.

 

تصویر 1

 

اولین ضعفی که در این میان وجود دارد، این است که آخرین نسل از پردازنده‌های مبتنی بر معماری Nehalem یعنی پردازنده‌‌های مبتنی بر خانواده Westerme، فرآیند ساخت پیچیده‌ا‌‌ی داشتند. آن‌ها دارای دو هسته مجزا با دو فرآیند ساخت متفاوت بودند (هسته پردازنده فرآیند ساخت 32 نانومتری داشت و پردازنده‌گرافیکی 45 نانومتری بود). دوم این‌که، پردازنده‌های مبتنی بر معماری Nehalem به حداکثر میزان فرکانس رسیده‌بودند یا به عبارت دیگر، اینتل با این معماری دیگر قادر به افزایش فرکانس پردازنده‌های خود نبود، بنابراین تنها روش برای افزایش کارایی پردازنده، تغییر در ساختار معماری پردازنده بود.

مشخصات کلی
از دو سال پیش تاکنون اینتل سعی کرده عملکردهای مربوط به چیپ‌ست‌ها را به تدریج به درون پردازنده انتقال دهد. در اولین پردازنده مبتنی بر معماری Nehalem (یعنی Bloomfield) وظیفه کنترل حافظه از چیپ‌ست مادربورد به درون پردازنده انتقال یافت. به عبارت دیگر، کنترلر حافظه به جای چیپ‌ست مادربورد در پردازنده گنجانده شد. در خانواده بعدی پردازنده‌های اینتل یعنی Lynnfield، علاوه بر کنترلر حافظه، کنترلر رابط PCI-Express نیز به درون پردازنده منتقل شد. بعد از این موضوع، در پردازنده‌های Clarkdale، پردازنده‌گرافیکی نیز در پردازنده‌مرکزی گنجانده شد. اگرچه این هسته به‌طور مستقیم، داخل خود هسته پردازنده گنجانده نشد اما به هرحال وظیفه پردازش گرافیکی سیستم، به جای چیپ‌ست‌های گرافیک مجتمع به پردازنده منتقل شد. اما اکنون در Sandy Bridge همه‌چیز درون پردازنده گنجانده شده‌است. به عبارتی، در این معماری هسته گرافیکی، کنترلر حافظه و کنترلر رابط PCI-Express درون هسته پردازنده گنجانده شده‌اند.

تصویر 2

معماری Sandy Bridge از نظر مشخصات کلی تفاوت چندانی با نسل قبل نداشته‌است. پردازنده‌های مبتنی بر این معماری 32 نانومتری هستند و  مانند پردازنده‌های نسل قبل، دو یا چهارهسته‌ا‌ی خواهند بود که از فناوری Hyper Threading نیز پشتیبانی می‌کنند و دارای حداکثر هشت مگابایت حافظه نهان سطح سه، کنترلر حافظه دوکاناله DDR3، کنترلر رابط PCI-Express نسخه دو با پشتیبانی از شانزده مسیر و در نهایت، دارای یک واحد پردازش‌گرافیکی با قابلیت پشتیبانی از رابط DirectX 10.1 هستند.
پیشرفت‌های انجام‌شده در معماری Sandy Bridge بیشتر در ریزمعماری و واحد‌های اجرایی درون هسته است. به‌طوری که ریزمعماری هسته‌های محاسباتی تغییرات جدی داشته و این موضوع موجب شده تا پردازنده‌های جدید به‌طور قابل توجهی سریع‌تر از پردازنده‌های نسل قبل در فرکانس یکسان عمل کنند. مهندسان اینتل همچنین برای کاهش حرارت پردازنده، کارهای متعددی انجام داد‌ه‌اند، بنابراین پردازنده‌های مبتنی بر Sandy Bridge قادر خواهند بود به سادگی در ضریب کلاک‌های بالاتر عمل کنند. علاوه بر این، پردازنده‌های جدید از دستور‌العمل‌های AVX یا Advanced Vector Extension جدیدی نیز پشتیبانی می‌کنند که برای تعدادی از الگوریتم‌های چندرسانه‌ای، مالی یا علمی موردنیاز خواهد‌بود. AVX با مجموعه دستورالعمل‌های قبل SSE تفاوت دارد. این دستورالعمل‌ها دارای عرض باند بالاتری هستند (265 بیت به جای 128 بیت) و بنابراین اجازه خواهند داد، میزان داده‌های وسیع‌تری پردازش شوند. در ادامه مقاله، به بررسی جزئیات تحولات انجام‌شده در معماری جدید خواهیم پرداخت.

تصویر 3

اینتل انتظار دارد، پردازند‌ه‌های مبتنی بر Sandy Bridge به سرعت مورد استقبال بیشتر خریداران قرار گیرد. آن‌ها قصد دارند، گستره وسیعی از پردازنده‌های Core i5 ،Core i3 و Core i7 مبتنی بر این معماری جدید را با قیمتی بین صد تا سیصد دلار در همین آغاز کار به بازار عرضه کنند و در انتهای سال 2011 نیز قصد دارند، پردازنده‌های گران‌قیمت‌تر مبتنی بر این معماری عرضه کنند.

تصویر 4

پردازنده‌های معرفی‌شده در تصویر بالا، برای کامپیوترهای خانگی هستند اما پردازنده‌های 65 و 45 واتی تصویر زیر برای کامپیوترهای همراه در نظر گرفته شده‌اند.

تصویر 5


این پردازند‌ها در حقیقت جایگزین پردازند‌های مبتنی بر سوکت 1156 خواهندشد و اینتل قصد ندارد تا اواخر سال 2011 میلادی جایگزینی برای پردازند‌ه‌های مبتنی بر سوکت 1366 معرفی کند. اینتل در حقیقت قصد دارد پردازنده‌های حرفه‌ا‌ی مبتنی بر معماری Sandy Bridge را در اواخر سال 2011 میلادی معرفی کند. این پردازنده‌ها مبتنی بر سوکت 2011 خواهندبود و دارای هشت هسته پردازشی، شانزده مگابایت حافظه نهان سطح سه، کنترل‌کننده حافظه چهارکاناله، 32 مسیر PCI Express نسخه سه و به احتمال چند فناوری جذاب دیگر هستند.
پردازند‌ه‌های مبتنی بر Sandy Bridge با سوکت 1155 سازگار هستند و این سوکت با پردازنده‌های مبتنی بر معماری Nehalem سوکت 1156 سازگاری ندارد. اینتل همچنین برای این نسل از پردازند‌های خود چیپ‌ست‌های جدید معرفی کرده‌است. با توجه به این‌که تمامی وظایف مرتبط با پل‌شمالی به پردازنده محول شده، چیپ‌ست‌های ‌P67 و H67 بسیار ساده هستند. این چیپ‌ست‌ها مانند نسل قبل تک‌چیپ‌ست هستند اما تفاوت عمده آن‌ها نسبت به چیپ‌ست‌های نسل قبل پشتیبانی از دو پورت SATA نسخه سه و عدم  پشتیبانی از رابط‌‌های PCI سنتی است. متأسفانه این چیپ‌ست‌های جدید مشابه نسل ماقبل خود فاقد قابلیت پشتیبانی از پورت USB 3.0 هستند.

تصویر 6

 

 


 

افزایش کارایی از چه روشی؟
شرکت اینتل در معماری Sandy Bridge چندین تغییر غیرمنتظره ایجاد کرده که به موجب آن کارایی پردازنده افزایش و در مقابل مصرف توان و درجه حرارت آن کاهش پیدا کرده‌است. در حقیقت، Sandy Bridge معماری توسعه‌یافته Nehalem نیست، بلکه این معماری ترکیبی از معماری Nehalem با پروژه به ظاهر شکست‌خورده پنتیوم 4 است. بله؛ درست متوجه شده‌اید، اگرچه معماری NetBurst شرکت اینتل مدت زمان زیادی است که به دلیل مصرف توان ناکارآمد منسوخ شده اما اکنون از برخی واحد‌های پردازنده‌های پنتیوم 4 در پردازنده‌های Core i5 ،Core i3 و Core i7 جدید استفاده شده‌است. شاید شنیدن این نکته جالب باشد که اینتل عنوان کرده، اقتباس برخی از بخش‌ها از پنتیوم 4 فقط برای افزایش کارایی نبوده بلکه بیشتر برای کاهش مصرف توان بوده‌است.
تغییرات انجام‌شده در معماری Sandy Bridge را با بررسی خط لوله‌ها آغاز می‌کنیم. در ابتدای خط لوله‌ها، رمزگشاها قرار دارند که  همچون گذشته دستورالعمل‌های x86 را به Micro-ops ساده‌تر رمزگشایی می‌کنند. رمزگشاها در معماری جدید مشابه با Nehalem در هر سیکل چهار دستورالعمل پردازش می‌کنند و مانند گذشته از فناوری Micro-Fusion و Macro Fusion نیز پشتیبانی می‌کنند. اما در معماری جدید، دستورالعمل‌های رمزگشایی‌شده به Micro-Opsها به جای این‌که به مرحله بعدی پردازش بروند، ذخیره می‌شوند. در حقیقت، Sandy Bridge یک حافظه سطح صفر اضافی برای ذخیره نتایج رمزگشایی دارد. این حافظه نهان اولین بخشی است که از معماری NetBurst برگرفته شده‌است. عملکرد کلی این حافظه نهان مشابه Execution Trace Cache است که در پردازنده‌های پنیتوم 4 به‌کار گرفته شده‌بود.

 

تصویر 7

حافظه نهان Micro-Opsهای رمزگشایی‌شده حدود شش کیلوبایت است که می‌تواند حداکثر یک‌هزار و پانصد Micro-Ops در خود ذخیره کند. اکنون اگر رمزگشا دستورالعملی دریافت کند که قبلاً ترجمه کرده و در حافظه نهان نیز ذخیره شده، دوباره آن دستورالعمل را رمزگشایی نمی‌کند و از Micro-Ops مربوط به آن دستورالعمل که در حافظه نهان Micro-Ops ذخیره شده، استفاده می‌کند. بنابراین حافظه نهان Micro Opsهای رمزگشایی‌شده به حذف بار اضافی از رمزگشاها کمک می‌کند و همچنین موجب کاهش مصرف انرزی پردازنده می‌شود. بنابر گفته مهندسان اینتل در هشتاد درصد مواقع دسترسی به این حافظه نهان اضافی موردنیاز است. گذشته از این، زمانی که رمزگشا‌ها در معماری Sandy Bridge بیکار هستند، غیر‌فعال می‌شوند که این موضوع به کاهش مصرف توان پردازنده کمک می‌کند.
دومین پیشرفت مهم در خط لوله‌ها مربوط به واحد پیش‌بینی انشعاب است. این واحد از اهمیت بسزایی در پردازنده‌ها برخوردار است زیرا هر پیش‌بینی انشعاب نادرست نیازمند توقف و تخلیه خط لوله‌ها به‌طور کامل است. در نتیجه، یک پیش‌بینی اشتباه نه تنها روی کارایی اثر منفی دارد، بلکه موجب افزایش توان مصرفی برای پر کردن دوباره خط لوله می‌شود. اینتل به این واحد در پردازنده‌های جدید توجه ویژه‌‌ای کرده تا آن‌ها به‌طور موثرتری عمل کنند. این شرکت همه بافرهای Sandy Bridge را که برای ذخیره آدرس‌های انشعاب‌ها و تاریخچه پیش‌بینی به‌کار گرفته شده، به منظور افزایش حجم ذخیره‌سازی در آن‌ها اصلاح کرده‌است. در نتیجه Sandy Bridge اکنون قادر است تاریخچه پیش‌بینی انشعاب‌های طولانی‌تری ذخیره کند. این موضوع تأثیر زیادی روی کارایی واحد پیش‌بینی انشعاب می‌گذارد. مطابق برآوردهای اولیه، درستی پیش‌بینی انشعاب در Sandy Bridge به بیش از پنج درصد در مقایسه با نسل قبل بهبود پیدا کرده‌است.

تصویر 8

همان‌طور که گفته شد، واحد پیش‌بینی انشعاب در پردازنده‌های غیرترتیبی از اهمیت بالایی برخوردار است و اغلب، سازندگان با معرفی یک معماری جدید تغییراتی در این واحد اعمال می‌‌کنند. این واحد در معماری Sandy Bridge از نظر ساختار شباهت بسیاری به معماری NetBrust دارد. مهندسان اینتل یک‌بار دیگر به عقب برگشته و از رجیستر فایل درون پردازنده جدید خود استفاده کرده‌اند (اگر به خاطر داشته‌باشید، مهندسان اینتل این رجیستر فایل‌ها را در پردازنده‌های Nehalem و Core بازنشسته کردند). در گذشته زمانی‌که Micro-Opsها بازآرایی می‌شدند، کپی کاملی از رجیسترها برای هر عملیات در رجیستر فایل‌ها ذخیره می‌‌شد. اما اکنون از مسیر (Link) به مقادیر رجیستری ذخیره‌شده در یک رجیستر فایل استفاده می‌‌شود. این رویکرد علاوه بر این‌که موجب حذف انتقال داده‌های مفرط می‌شود، از تکرار محتویات رجیستر نیز جلوگیری می‌کند و موجب ذخیره فضا در رجیستر فایل می‌شود.

تصویر 9

خوشه (Cluster) غیرترتیبی در پردازنده‌های Sandy Bridge می‌تواند در زمان یکسانی تا حداکثر 168 Micro-Ops نگه دارد، در حالی‌که پردازنده‌های Nehalem قادر به ذخیره‌سازی تنها 128 Micro-Ops در ROBهای خود (Reorder Buffer)  بودند. این موضوع موجب کاهش مصرف انرژی می‌شود. به هر حال، جایگزین کردن روش مسیردهی به رجیستر فایل‌ها در عوض دسترسی به مقادیر واقعی آن‌ها اثرات منفی نیز به همراه دارد. این موضوع سبب شده تا مرحله جدیدی به خط لوله‌های اجرایی پردازنده اضافه می‌شود.
پردازنده‌های مبتنی بر Sandy Bridge از دستورالعمل‌های AVX جدید با رجیسترهای 256 بیتی پشتیبانی می‌کنند. دستورالعمل‌های AVX در حقیقت جزئی از پیشرفت SSE به شمار می‌آیند که در آن اندازه رجیسترهای SIMD رأس به 256 بیتی افزایش یافته‌است. در نتیجه، مجموعه دستورالعمل‌های AVX، مشابه پیشرفت ریزمعماری، می‌تواند موجب افزایش کارایی و کاهش توان مصرفی شود. زیرا اجرای این دستورالعمل اجازه خواهد داد تا بسیاری از الگوریتم‌ها ساده شده و از دستورالعمل‌های کمتری برای تکمیل وظایف استفاده شود. دستورالعمل‌های AVX برای محاسبات ممیز شناور سنگین در کاربردهای چندرسانه‌ا‌ی، علمی و مالی کاملاً مناسب است.
واحدهای اجرایی پردازنده برای این‌که بتوانند دستورالعمل‌های 256 بیتی را به‌طور مؤثرتری اجرا کنند، باید دوباره طراحی ‌می‌شدند. اینتل در طراحی جدید، دو واحد اجرایی 128 بیتی با یکدیگر جفت کرده تا بتوانند بسته‌های اطلاعات 256 بیتی را به‌طور مؤثری پردازش کنند. از این رو، هر یک از سه پورت اجرایی در پردازنده‌های Sandy Bridge واحدهایی برای کار همزمان با سه نوع داده (64 بیت، 128 بیت عدد صحیح و 128 بیت عدد حقیقی) دارند. این موضوع موجب می‌شود، واحد‌های SIMD با یکدیگر درون یک پورت یکسان جفت شوند.

تصویر 10

از آنجا که Sandy Bridge برای کار با دستورالعمل‌های رأسی 256 بیتی طراحی شده‌است، اینتل باید به کارایی واحدهای اجرایی مسئول برای بارگذاری و تخلیه توجه ویژه‌ا‌ی می‌کرد. در پردازنده‌های Nehalem سه پورت برای این منظور طراحی شده‌بود که اکنون نیز در Sandy Bridge این پورت‌ها موجود هستند. اما به منظور افزایش بهره‌وری این واحد‌ها، مهندسان اینتل، دو واحد از این سه واحد را که برای ذخیره‌سازی آدرس‌ها و بارگذاری اطلاعات استفاده می‌شد با یکدیگر ادغام کرد‌ه‌اند. اکنون این دو واحد عملکرد یکسانی دارند و هر یک می‌توانند آدرس‌ها و داده‌ها را بارگذاری یا آدرس‌ها را تخلیه کنند. از این رو، هر پورت می‌تواند به واسطه عملکرد حداکثر شانزده بایت در هر سیکل، کل توان عملیاتی حافظه نهان سطح یک داده در معماری جدید را به میزان پنجاه درصد افزایش دهد. به عبارت دیگر، پردازنده‌های مبتنی بر معماری Sandy Bridge می‌تواند در هر سیکل 32 بایت داده از حافظه نهان سطح یک داده بارگذاری و شانزده بایت داده در آن ذخیره کنند.

تصویر 11

اگر همه نوآوری‌های شرح داده شده در بالا را در کنار یکدیگر قرار دهیم، خواهیم دید، معماری هسته‌های محاسباتی در پردازنده‌های Sandy Bridge به‌طور چشمگیری اصلاح شده‌است. این تحولات آنقدر جدی هستند که به سادگی بتوان گفت، پردازنده‌های جدید اینتل از یک معماری کاملاً متفاوت با پردازنده‌های Nehalem بهره می‌برد.

تصویر 12


رویکرد جدید به سمت یکپارچه‌سازی
اینتل با معرفی معماری Nehalem شروع به گنجاندن اجزاء چیپ‌ست در  پردازنده کرد. در معماری Nehalem کنترلر حافظه، کنترلر رابط PCI Express و پردازنده‌گرافیکی، درون پردازنده گنجانده‌شد. به عبارت دیگر، با این تحولات، پردازنده‌ها دیگر تنها یک واحد اجرایی مرکزی نیستند، بلکه مجموعه‌ا‌ی از واحد‌های پیچیده مختلف هستند.

تصویر 13

گنجاندن این واحد‌ها درون پردازنده، موجب افزایش کارایی ناشی از کاهش زمان انتظار هنگام انتقال اطلاعات می‌شود. به هر حال، گنجاندن واحد‌های مختلف در پردازنده مشکلاتی را نیز به همراه دارد. یکی از مهم‌ترین موانع بر سر این راه، چگونگی اتصال این واحدها به یکدیگر به خصوص از نظر الکتریکی است. در این بین، اتصال حافظه نهان سطح سه اشتراکی با هسته‌های پردازنده‌ها یکی از سخت‌ترین کارها برای سازندگان است، به خصوص این‌که تعداد هسته‌ها روز به روز افزایش پیدا می‌کند. به عبارت دیگر، زمانی که مهندسان اینتل در حال کار روی معماری پردازنده‌های Sandy Bridge بودند، باید برای اتصال مناسب بین همه واحد‌های درون پردازنده فکر جدی می‌کردند. در معماری Nehalem و معماری‌های ماقبل، از اتصال Crossbar عمومی استفاده شده اما این اتصال برای پردازنده‌هایی با چندین واحد ‌متفاوت مناسب نیست.
مهندسان اینتل پیش از این در پردازنده‌های هشت هسته‌ا‌ی سرور Nehalem-EX برای متصل کردن هسته‌های محاسباتی به حافظه نهان سطح سه از فناوری جدیدی استفاده کرده‌اند. این فناوری Ring Bus نام دارد و اینتل اکنون در معماری Sandy Bridge نیز از آن استفاده کرده‌است. همه هسته‌‌های محاسباتی، حافظه نهان، پردازنده‌گرافیکی و عناصر پل‌جنوبی درون پردازنده جدید به باس حلقه (Ring Bus) متصل شده‌اند که اجازه می‌دهد تعداد اتصالات درون هسته به میزان قابل توجهی کاهش پیدا کند.
مهندسان اینتل حافظه نهان سطح سه پردازنده‌های Sandy Bridge را به چهار بانک یکسان تقسیم کرده‌اند که هر بانک دو مگابایت ظرفیت دارد. به عبارتی، تعداد این بانک‌ها دقیقاً یکسان با تعداد هسته‌های پردازنده است. این استراتژی اینتل به نظر می‌رسد بیشتر برای بازاریابی بود زیرا اینتل با جدا کردن این بانک‌ها می‌تواند پردازنده‌هایی با حافظه‌های نهان متفاوت و قیمت‌های مختلف تولید کند. به‌طور مثال، پردازنده‌‌ای ارزان‌قیمت با شش مگابایت حافظه نهان سطح سه به جای هشت مگابایت تولید کند. هر یک از بانک‌های حافظه نهان توسط «arbiter» خودشان اداره می‌شوند اما در زمان یکسان همه آن‌ها مشابه با یکدیگر کار می‌کنند و داده‌ها در آن‌ها هرگز تکراری نخواهدبود. استفاده از این بانک‌ها، موجب تقسیم حافظه نهان سطح سه نمی‌شود، بلکه تنها پهنای باند حافظه نهان سطح سه را افزایش می‌دهد. برای مثال، از آنجا که «Ring» عرض 32 بیتی دارد، حداکثر پهنای باند حافظه نهان سطح سه درون یک پردازنده چهارهسته‌ا‌ی که در فرکانس 3/4 گیگاهرتز عمل می‌کند، برابر با 435/2 گیگابایت در ثانیه است. اینتل با این روش، به سادگی می‌تواند با افزایش تعداد هسته‌های پردازنده، تعداد بانک‌ها‌ی حافظه نهان سطح سه را نیز افزایش دهد.
از دیگر مزایای حافظه نهان سطح سه جدید می‌توان به کاهش زمان تأخیر آن اشاره کرد. اکنون زمان تأخیر حافظه نهان سطح سه بین 26 تا 31 سیکل است. این زمان در حافظه نهان سطح سه پردازنده‌های Nehalem بین 35 تا 40 سیکل بود. این توضیح لازم است که تمامی حافظه‌های نهان در پردازنده‌های Sandy Bridge با فرکانس پردازنده کار می‌کنند. به هر حال، این موضوع نیز سبب شده تا عملکرد حافظه نهان در این پردازنده‌‌ها سریع‌تر شود.
برتری دیگر باس حلقه این است که از آن برای انتقال اطلاعات داده‌های مربوط به پردازنده‌گرافیکی که درون پردازنده گنجانده شده‌است نیز استفاده می‌شود. این یعنی، پردازنده‌گرافیکی درون پردازنده، به‌طور مستقیم با حافظه در ارتباط نیست. این واحد شبیه هسته پردازنده با حافظه نهان سطح سه در ارتباط است. این موضوع سبب می‌شود، کارایی پردازنده‌گرافیکی به‌طور چشمگیری افزایش پیدا کند.

 

 



پردازنده‌گرافیکی و ویژگی‌های جدید
گنجاندن پردازنده‌‌گرافیکی درون پردازنده موضوع جدیدی نیست. در حال حاضر، پردازنده‌های مبتنی بر هسته Clarkdale با پردازنده‌گرافیکی مجتمع‌شده Intel HD در بازار رایج هستند. در پردازنده‌های Sandy Bridge پردازنده‌گرافیکی و محاسباتی درون یک بسته‌بندی قرار گرفته‌اند و به باس حلقه یکسانی که با دیگر منابع پردازنده مشترک است، متصل شده‌اند. بنابراین با توجه به این‌که اکنون پردازنده‌گرافیکی به کنترلر حافظه نزدیک است و دسترسی مستقیمی به حافظه نهان سطح سه دارد، کارایی گرافیکی پردازنده‌های مبتنی بر Sandy Bridge افزایش پیدا کرده‌است. علاوه بر این، پردازنده‌گرافیکی نیز مانند هسته‌های محاسباتی پردازنده از بسیاری جهات پیشرفت کرده، به‌طوری که برخی، این هسته را نسل جدید پردازنده‌‌گرافیکی اینتل می‌نامند. پردازنده‌گرافیکی اینتل هنوز شامل حداکثر دوازده واحد اجرایی (سایه‌زن) است و از رابط DirectX 10.1 پشتیبانی می‌کند. برخی پیش‌بینی کرده‌اند، پردازنده‌گرافیکی جدید اینتل تقریباً نسبت به گذشته دو برابر سریع‌تر عمل می‌کند.

 

تصویر 14

از آنجا که فرآیند ساخت پردازنده‌گرافیکی به 32 نانومتر کاهش یافته، بنابراین اینتل به سادگی توانسته فرکانس پردازنده‌گرافیکی را افزایش دهد. فرکانس این هسته در پردازنده‌های Core i7 برابر با 1/35 گیگاهرتز است که برخی اعتقاد دارند، این فرکانس می‌تواند به بیش از این مقدار نیز افزایش پیدا کند. اکنون کارایی پردازنده‌گرافیکی مجتمع Sandy Bridge با کارت‌های گرافیکی سطح پایین و ارزان‌قیمت قابل رقابت است. اینتل حتی قصد دارد در آینده از ویژگی FSAA (ضدپلگی تمام صفحه) در پردازنده‌‌گرافیکی خود پشتیبانی کند. با توجه به موارد ذکرشده، به نظر می‌رسد Sandy Bridge این شانس را داشته‌باشد که عنوان بهترین پردازنده‌گرافیکی مجتمع را به دست آورد. این محصول حتی تهدید جدیدی برای کارت‌های گرافیک ارزان‌قیمت و سطح پایین نیز به شمار می‌آید. به هر حال، در همین ابتدای کار، NVIDIA و AMD شروع به تبلیغ منفی علیه این محصول کرده‌اند. آن‌ها اظهار می‌کنند، پردازنده‌گرافیکی اینتل فاقد پشتیبانی از DirectX نسخه 11 است. این موضوع سبب می‌شود، پردازنده‌گرافیکی اینتل قادر به اجرای بازی‌های مبتنی بر این نسخه از DirectX نباشد و همچنین در برنامه‌های کاربردی که از DirectCompute استفاده می‌کنند، مانند مرورگرهای اینترنت آینده عملکرد نامناسبی خواهدداشت.
به هر حال، بهبود معماری پردازنده‌گرافیکی موجود، تنها چیزی نبوده که در این بخش انجام شده‌است. پردازنده‌‌گرافیکی مجتمع در پردازنده‌های Sandy Bridge جدید به واحد جدید ویژه‌‌ای برای رمزگذاری و رمزگشایی ویدئویی در فرمت‌های مشهور مانند MPEG2 ،VC1 و AVC مجهز شده‌اند.
اگرچه رمزگشایی سخت‌افزاری فایل‌های ویدئویی این روزها موضوع جدیدی نیست و پردازنده‌گرافیکی Clarkdale نیز در سطح خوبی قادر به انجام این عملیات است. مسئولیت این وظیفه در هسته‌های قبلی بر عهده سایه‌زن‌ها بوده، در حالی که در هسته جدید، واحد ویژه‌‌ای این مسئولیت را بر عهده دارد. این تغییرات برای پشتیبانی مناسب از ویدئویی سه‌بعدی موردنیاز بود، بنابراین پردازنده‌‌گرافیکی جدید می‌تواند به آسانی از عهده ویدئو سه‌بعدی به واسطه رمزگشایی سخت‌افزاری جریانات MVC و Blu-ray سه‌بعدی استریو برآید.
کدک (Codec) سخت‌افزاری یکی دیگر از ویژگی‌های قابل توجه پردازنده‌‌گرافیکی Sandy Bridge است. این کدک می‌تواند ویدئو‌های با  فرمت AVC را رمزگذاری کند. در عمل به این معنی است که، پردازنده‌گرافیکی Sandy Bridge همه منابع موردنیاز برای رمزگشایی ویدئویی سریع را بدون نیاز به منابع پردازنده در اختیار دارد.

تصویر 15

همه می‌دانیم که عملکرد چندرسانه‌ای پردازنده‌های Sandy Bridge جدید توسط برنامه‌های کاربردی مشهوری همچون
ArcSoftMediaConverter ،Corel DVD Factory ،CyberLinkMediaEspresso،Roxio Creator و... پشتیبانی خواهدشد. در این روش، زمانی‌که واحد‌های چندرسانه‌ای درون پردازنده‌گرافیکی Sandy Bridge برای کدگذاری ویدئویی استفاده می‌شوند، پردازنده‌های سایه‌زن آزاد باقی می‌مانند. بنابراین آن‌ها می‌توانند پردازش ویدئویی دیگری را انجام دهند که این موضوع باعث بهبود کارایی پردازنده‌گرافیکی می‌شود.
پردازنده‌های مبتنی بر معماری Sandy Bridge یکی از پردازنده‌‌های گرافیکی Intel HD 2000 یا Intel HD 3000 را خواهد داشت. این دو پردازنده‌گرافیکی از نظر تعداد واحد‌های اجرایی (سایه‌زن‌ها) با یکدیگر اختلاف دارند. پردازنده‌‌گرافیکی HD 3000 دارای دوازده واحد اجرایی و HD 2000 دارای شش واحد اجرایی است. همچنین فرکانس پردازنده‌گرافیکی HD 2000 کمی پایین‌تر از HD 3000 است. با این وجود، سخت‌افزار رمزگذاری و رمزگشایی در هر دو پردازنده‌گرافیکی یکسان است.


پل‌شمالی جدید- System Agent
پردازنده‌های Sandy Bridge جدید برای ارتباط با دیگر اجزای سیستم شامل همه کنترلر‌های خارجی مانند: رابط حافظه، صفحه‌نمایش، DMI و PCI Express از واحدی که به اصطلاح System Agent نامیده می‌شود، استفاده می‌کنند. در حقیقت، System Agent خیلی شبیه واحد Uncore در پردازنده‌های Nehalem است. اما عملکرد System Agent دقیقاً مشابه با عملکرد Uncore نیست. اکنون System Agent شامل حافظه نهان سطح سه نیست و این حافظه ‌نهان یک واحد منحصر به‌فرد است که با فرکانس پردازنده عمل می‌کند، در حالی‌که Uncore شامل حافظه نهان سطح سه بود و با فرکانسی متمایز از فرکانس پردازنده عمل می‌کرد. خصوصیت دیگری که System Agent را از Uncore متمایز می‌کند، استفاده آن از باس حلقه برای تبادل اطلاعات بین پردازنده، پردازنده‌گرافیکی و حافظه نهان سطح سه است.

تصویر 16

مهم‌ترین پیشرفت در System Agent مربوط به کنترلر حافظه می‌شود. کنترلر حافظه در پردازنده‌های (Westerme (Clarkdale با پردازنده‌گرافیکی ترکیب شده‌بود که این راه‌حل زیاد موفقیت‌آمیز نبود. اما سرانجام مهندسان اینتل این مسئله را در Sandy Bridge حل کردند. اکنون کنترلر حافظه در پردازنده‌های جدیدکارایی مشابه با کنترلر حافظه در پردازنده‌های Lynnfield دارد. توجه کنید که این کنترلر از حافظه‌های DDR3 1066 یا DDR3 1333 پشتیبانی می‌کند. تصویر زیر، کارایی کنترلر حافظه در پردازنده‌های جدید را نشان می‌دهد.

تصویر 17


زمان‌های تأخیر در معماری جدید دارای کاهش چشمگیری بوده و پهنای باند زیر سیستم حافظه نیز ارتقاء خوبی داشته‌است. کنترلر باس PCIE در Sandy Bridge شبیه پردازنده‌های LGA 1156 است. این کنترلر از شانزده مسیر PCI-Express نسخه دو پشتیبانی می‌کند که این مسیرها می‌توانند به صورت یک رابط x16 یا دو رابط x8 پیکره‌بندی شوند.


واحد کنترلر توان
گذشته از کنترلرهای خارجی، بخش مهم دیگر System Agent واحد کنترلر توان (PCU) است. شبیه پردازنده‌های Nehalem این واحد یک میکروکنترلر قابل برنامه‌ریزی است که اطلاعات مربوط به جریان و درجه حرارت بخش‌های مختلف پردازنده را جمع‌آوری می‌کند و می‌تواند ولتاژ‌ها و فرکانس‌های آن‌ها را کنترل کند. PCU خصوصیات مربوط به ذخیره‌سازی توان و ویژگی Turbo Mode را بر عهده دارد.
به‌طور کلی، واحد‌های مختلف در معماری Sandy Bridge به سه بخش تقسیم شده‌اند که هر بخش از الگوریتم فرکانس و توان مخصوص به خود استفاده می‌کند. اولین بخش، شامل هسته‌های پردازنده و حافظه نهان سطح سه می‌شود که در ولتاژ و فرکانس یکسانی کار می‌کنند. دومین بخش، پردازنده‌گرافیکی است که با فرکانس مربوط به خودش عمل می‌کند و سومین بخش نیز، System Agent است.
این ساختار به مهندسان اینتل اجازه داده تا از فناوری ‌Enhanced Intel SpeedStep و Turbo Boost برای پردازنده‌‌های گرافیکی و هسته‌های پردازنده به‌طور جداگانه استفاده کنند. Sandy Bridge به‌طور سخت‌افزاری فرکانس هسته پردازشی و گرافیک را با توجه به مصرف توانشان کنترل می‌کند. این سخت‌افزار موجب می‌شود، فرکانس هسته‌های پردازنده‌ها به‌طور مؤثرتری در وضعیت Turbo Mode و زمانی که پردازنده‌گرافیکی بیکار است، اورکلاک شود و برعکس پردازنده‌گرافیکی در زمانی که هسته‌های پردازشی پردازنده به‌طور کامل استفاده نمی‌شوند، به میزان قابل توجه‌تری اورکلاک می‌شود.

تصویر 18

فناوری Turbo Boost شامل تغییرات زیادی نشده تنها پیشرفتی که در این بخش ایجاد شده، مربوط به PCU است. این واحد اکنون می‌تواند فرکانس را به‌طور هوشمند‌تری کنترل کند و علاوه بر مدیریت توان مصرفی واحد‌های پردازنده، حرارت هر هسته را تحت‌نظر داشته‌باشد. با این ویژگی، اینتل به پردازنده‌های خود اجازه داده تا هنگامی که در شرایط حرارتی مطلوبی قرار دارند، مصرف توانشان از حداکثر TDP مجاز تجاوز کند.
بار پردازنده در طی روز خیلی نامتقارن است، به‌طوری که در بیشتر مواقع پردازنده در وضعیت ذخیره‌سازی توان قرار دارد و بندرت به کار خیلی سریع نیاز دارد. واحد PCU در پردازنده‌های Sandy Bridge که فرکانس‌ها را کنترل می‌کند، طوری طراحی شده که در چنین مواقعی فرکانس پردازنده را به میزان قابل توجهی افزایش ‌دهد و هنگامی که درجه حرارت پردازنده به آستانه بحرانی رسید، فرکانس را به سطح معقول کاهش دهد.

تصویر 19

تصویر 20

با توجه به این ویژگی پیشنهاد می‌شود، کاربران از سیستم خنک‌کنند‌گی مناسبی برای پردازنده‌های مبتنی بر Sandy Bridge استفاده کنند تا بتوانند حداکثر کارایی را از چنین پردازنده‌هایی به دست آورند. البته این توضیح لازم است که اینتل محدودیتی نیز برای چنین وضعیتی در نظر گرفته‌است و  پردازنده‌های مبتنی بر Sandy Bridge تنها به مدت 25 ثانیه می‌توانند در این وضعیت عمل کنند.


نتیجه‌گیری
همان‌طور که اشاره شد، معماری جدید اینتل شامل تعدادی نوآوری همچون پشتیبانی از دستورالعمل‌های 256 بیتی AVX، افزایش کارایی پردازنده‌گرافیکی، ماژول سخت‌افزاری برای رمزگذاری و رمزگشایی ویدئویی، حافظه نهان سطح سه جدید، باس حلقه، System Agent هوشمند، فناوری Turbo Boost پیشرفته‌تر و فرکانس بالاتر شده‌است. برخی از این نو‌آوری‌ها تأثیر بسزایی روی کارایی خواهندداشت، به‌طوری که پردازنده‌های مبتنی بر Sandy Bridge نسبت به پردازنده‌های نسل قبل سریع‌تر عمل می‌کنند.
یک پردازنده Sandy Bridge در قیمتی یکسان با یک پردازنده Clarkdale یا Lynnfield می‌تواند کارایی حداقل 25 درصد بالاتر در کاربردهای وابسته به پردازنده ارائه کند. به‌طور کلی، Sandy Bridge قادر است در برخی از کاربردها به واسطه ساختمان واحد‌های جدیدش کارایی حتی تا ده برابر بالاتر نسبت به پردازنده‌های نسل قبل خود ارائه کند. این افزایش کارایی به خصوص در برنامه‌های رمزگذاری/رمزگشایی ویدئویی به واسطه رمزگذار/رمزگشا سخت‌افزاری ویژه در پردازنده قابل مشاهده است. همچنین الگوریتم‌های مالی، علمی و چندرسانه‌ای روی پردازنده‌های جدید به واسطه دستورالعمل‌های AVX و AES-IN سریع‌تر اجرا خواهندشد. البته لازم است اشاره کنم، استفاده از این نو‌آوری‌ها منوط به پشتیبانی توسعه‌دهندگان نرم‌افزارها از این ویژگی‌های جدید پردازنده‌های اینتل در محصولاتشان است. این موضوع نیز زیاد جای نگرانی ندارد، با توجه به تدابیری که مهندسان اینتل در نظر گرفته‌اند، به‌طور قطع، محصولات نرم‌افزاری متعددی مبتنی بر این ویژگی عرضه خواهدشد. پردازنده‌گرافیکی گنجانده‌شده در پردازنده‌های جدید نیز نسبت به نسل قبل بسیار سریع‌تر شده‌است که این موضوع نیز برای کاربرانی که قصد استفاده از گرافیک مجتمع دارند و همچنین کاربران کامپیوترهای همراه بسیار خوشایند خواهدبود.

نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد