چرا سرعت ساعت CPU در چند سال گذشته افزایش نیافته است؟
اولین کامپیوتری که من استفاده کردم یک هیولای عملکرد واقعی بود. این دستگاه مجهز به 486 اینتل با فرکانس 66 مگاهرتز، آماده مقابله با هر چالشی بود که آینده برای ما به ارمغان می آورد. یا اینطور فکر می کردم. سرعت کلاک CPU افزایش یافت و به زودی از 500 مگاهرتز، 1 گیگاهرتز گذشت و به سمت بالا ادامه یافت. در حدود سال 2005، حداکثر سرعت پردازنده های سطح بالا در حدود 4 گیگاهرتز قرار گرفت و از آن زمان تا کنون افزایش چندانی نداشته است. چرا اینطور است؟ من توضیح می دهم.
چرا از سرعت ساعت صحبت می کنیم؟
اگرچه سرعت کلاک همه چیز را در مورد یک پردازنده به ما نمی گوید، اکثر ما به طور خودکار سرعت های کلاک بالاتر را با پردازنده های سریعتر متصل می کنیم. چطور؟ این عدد در مورد عملکرد یک پردازنده به ما چه می گوید؟ برای درک این موضوع، اجازه دهید به طور خلاصه به نحوه ساخت یک پردازنده نگاه کنیم.
سرعت پردازنده و ساعت
مهم ترین قطعات در یک پردازنده ترانزیستورها هستند ، وسایل الکترونیکی که به عنوان سوئیچ برای ساخت گیت های منطقی عمل می کنند . این گیت های منطقی اجزای سخت کوش پردازنده های ما هستند. در ترکیب های مختلف کنار هم قرار می گیرند و واحدهایی را تشکیل می دهند که قادر به انجام عملیات های حسابی و پیچیده منطقی هستند.
سرعتی که میتوان چنین عملیاتی را انجام داد، به زبان ساده، محدود به فرکانسی است که ترانزیستور میتواند از حالت روشن به خاموش سوئیچ کند و همچنان بدون شکست انجام شود. از آنجایی که ترانزیستورها بلوک های سازنده گیت های منطقی هستند، این فرکانس سوئیچینگ سرعت عملکرد پردازنده ما را نیز محدود می کند.
بنابراین، اگر پردازنده خود را با یک سیگنال ورودی در ثانیه تغذیه کنیم و پردازنده عملیات ما را بدون خطا انجام دهد، می گوییم که پردازنده در 1 هرتز کلاک شده است. به عبارت دیگر، سرعت ساعت (گاهی اوقات به عنوان فرکانس ساعت یا نرخ کلاک نیز از آن یاد میشود) نوعی گواهی است که به ما میگوید هر چند وقت یکبار میتوانیم دستورالعملها را به آن بدهیم و همچنان عملیات بدون خرابی داشته باشیم. با نگاهی برعکس، یک پردازنده با سرعت کلاک 3 گیگاهرتز به ما این امکان را می دهد که با 3 میلیارد عملیات در ثانیه آن را تغذیه کنیم و همچنان می توانیم انتظار داشته باشیم که طبق پیش بینی ها عمل کند.
یک پردازنده ویژه باز شده نسل چهارم Intel® Core™ با کد Devil’s Canyon . در سال 2014 منتشر شد و در مقایسه با نسخه های قبلی شامل رابط حرارتی و بسته بندی CPU بهبود یافته است. اعتبار تصویر: اینتل Corp.
اکنون به راحتی می توان فهمید که چرا ما به سرعت ساعت بالاتر علاقه مندیم . عملیات بیشتر در ثانیه به این معنی است که ما می توانیم در واحد زمان کار بیشتری انجام دهیم. برای کاربر، این بدان معناست که برنامههای روی رایانه سریعتر اجرا میشوند – و این بدون انجام تغییرات زیادی در کد. جای تعجب نیست که چرا همه تولیدکنندگان پردازنده برای فرکانس های سوئیچینگ بالاتر و بالاتر فشار می آورند.
چرا رکود در سرعت ساعت CPU؟
چرا تعداد کمی از پردازنده های Intel® بالای 3.7 گیگاهرتز را می بینیم؟ و چرا به نظر می رسد که بالاترین سرعت ساعت – که نیاز به خنک شدن از طریق نیتروژن مایع دارد – بین 8.5 تا 9 گیگاهرتز گیر کرده است؟
برای درک این موضوع، باید به جنبه دیگری از پردازنده ها یعنی تعداد ترانزیستورها نگاه کنیم. تعداد ترانزیستورهای یک پردازنده تعداد ترانزیستورهایی است که پردازنده به آنها مجهز شده است. از آنجایی که CPU ها تقریباً در یک اندازه باقی می مانند، تعداد ترانزیستورها به طور مستقیم با اندازه ترانزیستورها مرتبط است.
بنابراین، با رفتن از 170 میلیون ترانزیستور که یک پردازنده Intel® Pentium® 4 از سال 2004 به 4.3 میلیارد ترانزیستور یک پردازنده 15 هسته ای Intel® Xeon® Ivy Bridge در سال 2013 مجهز شده بود، می بینیم که اندازه ترانزیستورها به شدت کوچک شده اند. این افزایش توسط مور مشاهده شد و توسط قانون او توصیف شد که بیان می کند چگالی یکپارچه سازی ترانزیستورها هر 18 تا 24 ماه دو برابر می شود (” نسل بعدی قانون مور “).
مشاهدات مهم دیگر به اصطلاح مقیاس بندی Dennard است که می گوید مقدار توان مورد نیاز برای راه اندازی ترانزیستورها در یک واحد حجم مشخص با وجود افزایش تعداد آنها ثابت می ماند، به طوری که ولتاژ و جریان با طول مقیاس می شوند. با این حال، این مشاهدات دیگر معتبر نمی شود زیرا ترانزیستورها در حال رشد بسیار کوچک هستند. از آنجایی که گیت های ترانزیستور بسیار نازک شده اند و یکپارچگی ساختاری آنها را تحت تاثیر قرار می دهد و جریان ها شروع به نشت می کنند، مقیاس بندی ولتاژ و جریان با طول در حال رسیدن به مرزهای خود است .
علاوه بر این، تلفات حرارتی زمانی رخ می دهد که چندین میلیارد ترانزیستور را در یک منطقه کوچک کنار هم قرار دهید و چندین میلیارد بار در ثانیه آنها را دوباره روشن و خاموش کنید. هر چه سریعتر ترانزیستورها را روشن و خاموش کنیم، گرمای بیشتری تولید می شود. بدون خنک کننده مناسب، ممکن است از کار بیفتند و از بین بروند. یکی از پیامدهای این موضوع این است که سرعت کلاک پایینتر باعث تولید گرمای کمتر و تضمین طول عمر پردازنده میشود. یکی دیگر از اشکالات شدید این است که افزایش سرعت کلاک به معنای افزایش ولتاژ است و یک وابستگی مکعبی بین این و مصرف برق وجود دارد. هزینه برق عامل مهمی است که باید در هنگام راه اندازی مراکز محاسباتی در نظر گرفته شود.
این ویفر حاوی مدارهای کارآمد شبکه روی تراشه است که تا 100 گره محاسباتی مقیاس پذیر است. مدارها اولین شبکه روی تراشه 256 گره صنعت را در 22 نانومتر Tri-Gate CMOS فعال می کنند که در ولتاژ نزدیک آستانه و ولتاژ فوق العاده پایین کار می کند و توان را 9 برابر به 363 میکرووات در 340 میلی ولت کاهش می دهد. اعتبار تصویر: اینتل Corp.
اما چگونه میتوانیم بدون افزایش سرعت کلاک، قدرت محاسباتی بیشتری را از ترانزیستورهای بیشتر بدست آوریم؟ از طریق استفاده از محاسبات چند هسته ای. مزیت فوقالعاده چند هستهها را میتوان از استدلال زیر به دست آورد: هنگام کاهش سرعت ساعت تا 30 درصد، به دلیل وابستگی به مکعب (0.7*0.7*0.7 ~ 0.35) توان به 35 درصد از مصرف اولیه کاهش مییابد.
با این حال، عملکرد محاسباتی نیز 30٪ کاهش می یابد. اما هنگامی که دو هسته محاسباتی را با 70 درصد سرعت کلاک اصلی کار می کنیم، 140 درصد توان محاسباتی اصلی را با استفاده از 70 درصد توان مصرفی اصلی (2×35 درصد) داریم. البته، برای رسیدن به این نوع کارایی، باید موازی سازی کد فرآیند را طوری برنامه ریزی کنید که به طور کامل از هر دو هسته که همزمان کار می کنند، بهره برداری کند.
راه حل و راه رو به جلو
بدیهی است که این افزایش سرعت ساعت، مهندسان اینتل و مانند آن را متوقف نکرده است که برای دستیابی به عملکرد بیشتر، پاکت را فشار دهند. قبلاً دیدهایم که آنها میتوانند تعداد بیشتری از آنها را روی یک تراشه قرار دهند، از طریق ایجاد مرحله از ترانزیستورهای دو بعدی یا مسطح به ترانزیستورهای سه بعدی یا سه گیت :
این مرحله نه تنها توان مورد نیاز پردازندهها را با کاهش جریان عبوری از ترانزیستور تقریباً به صفر در حالت خاموش، کاهش میدهد، بلکه در حالت «روشن»، حداکثر جریان ممکن را میدهد. بنابراین باعث افزایش عملکرد خواهد شد.
با این حال، این استفاده از محاسبات چند هستهای است که به افزایش عملکرد رایانه کمک کرده و ادامه خواهد داد – زیرا این بدان معناست که تمرکز اصلی اکنون بر موازیسازی و نحوه بهترین تقسیم محاسبات بر روی چندین هسته متمرکز است.
ما قبلاً یک مجموعه وبلاگ کامل را به این موضوع اختصاص دادهایم که چگونه میتوانید از این روند برای استفاده حداکثری از پردازندههای چند هستهای خود هنگام حل مدلهای نرمافزار COMSOL Multiphysics® استفاده کنید. چند هسته ای تنها جایگزین برای افزایش عملکرد بیشتر و مصرف انرژی کمتر است، اما به قیمت موازی سازی در نرم افزار تمام می شود.
پردازنده Intel® Pentium® 4 در سال 2004 فقط یک پردازنده تک هسته ای بود، اما امروز ما در مورد 8، 10، 12 یا حتی 15 هسته در یک ایستگاه کاری صحبت می کنیم و این هسته ها می توانند دستورالعمل ها را مستقل از یکدیگر اجرا کنند. این یکی از دلایلی است که چرا یک پردازنده 8 هسته ای با سرعت ساعت کمتر 2.6 گیگاهرتز می تواند بسیاری از مدل های COMSOL Multiphysics شما را بسیار سریعتر از یک پردازنده دو هسته ای با سرعت کلاک بالاتر 3.5 گیگاهرتز حل کند.
فشار برای عملکرد آینده – فراتر از سرعت ساعت CPU
راه رسیدن به عملکرد محاسباتی بیشتر به دلیل عدم افزایش سرعت ساعت قطع نشد. از آنجایی که نمیتوانستیم به افزایش توان خام تکیه کنیم، مجبور شدیم راهحلهای بهتر و مؤثرتری پیدا کنیم. این منجر به افزایش سرمایهگذاری در موازیسازی – هم برای سختافزار و هم برای نرمافزار – و یافتن راههایی برای کارآمدتر کردن پردازندهها در مصرف انرژی شد.
و مهم نیست که سد بعدی چه خواهد بود، ما می توانیم مطمئن باشیم که مهندسان باهوشی در جهان وجود خواهند داشت که بر آن غلبه خواهند کرد و توسعه و عملکرد را به جلو خواهند برد.
اینتل، آرم اینتل، Intel Core، Pentium و Xeon علائم تجاری Intel Corporation در ایالات متحده و/یا سایر کشورها هستند.
- لینک دانلود به صورت پارت های 1 گیگابایتی در فایل های ZIP ارائه شده است.
- در صورتی که به هر دلیل موفق به دانلود فایل مورد نظر نشدید به ما اطلاع دهید.
برای مشاهده لینک دانلود لطفا وارد حساب کاربری خود شوید!
وارد شویدپسورد فایل : پسورد ندارد گزارش خرابی لینک
دیدگاهتان را بنویسید