اولیــن پـردازنـده گرافیــکی مــرکـز داده ابــررایانـه هـــوش مصنـوعـی جـــهان؛ با تـــوان محـاسبــاتی نـامتنــاهی بـــرای مـراکــز داده مـــدرن؛ مراکز داده امروزی، به بسیاری از گرههای محاسباتی کالایی به هم پیوسته(interconnected commodity compute nodes) متکی هستند که؛ محاسبات با کارایی بالا (HPC) و حجم کاری فرامقیاس (Hyperscale Workloads) را محدود میکند. پردازنده گرافیکی NVIDIA® Tesla® P100 از معماری پاسکال (NVIDIA Pascal™ GPU) بهره میبرد تا؛ یک پلتفرم یکپارچه برای سرعت بخشیدن به HPC و AI (هوش مصنوعی) ارائه دهد، و به طور چشمگیری توان عملیاتی را افزایش دهد و در عین حال هزینهها را نیز کاهش دهد.
محصولات مرتبط
NVIDIA Tesla P100 16GB GPU
کارت گرافیک انویدیا تسلا P100
کارت گرافیک NVIDIA Tesla P100 16GB GPU ، یک کارت دو اسلات(2U) بوده، که به جز مشخصات حافظه، دارای همان ویژگیهای همتای خود، NVIDIA Tesla P100 12GB GPU می باشد. پردازنده گرافیکی P100 بر اساس یک فرآیند 16 نانومتری با معماری پاسکال ساخته شده است تا هزاران برنامه محاسباتی با عملکرد بالا (HPC) را در شیمی کوانتومی، علوم پزشکی، مدلسازی مالی و بسیاری از زمینههای دیگر تامین کند.
سایر پردازنده های گرافیکی خانواده تسلا P100:
- پردازنده گرافیکی NVIDIA Tesla P100 12GB
- پردازنده گرافیکی NVIDIA Tesla P100 SXM2
پــردازنـده گـرافیـــکی NVIDIA Tesla P100 16GB ، دارای سه نسخه موجود در خانواده Tesla P100 بوده؛ که همگی عملکرد محاسباتی استثنایی را برای برنامه های پیچیده ارائه می دهند. با 3584 هسته کـودا انـویدیــا (NVIDIA CUDA Cores)، از حافظه با پهنای باند بالا (HBM2) با کد تصحیح خطا (ECC) اضافه شده پشتیبانی می کند. این کارت گرافیک با معمـاری پـاســکـال انویدیا (Nvidia Pascal Architecture) هدایت می شود و از متخصصان در صنایع مختلف پشتیبانی می کند.
کارایی این پردازنده گرافیکی
این کارت گرافیک 16 گیگابایتی PCIe ، که با 15300 میلیون ترانزیستور، مجهز به معماری پاسکال است، از همان ویژگی های مکمل خود نیز پشتیبانی می کند.با 4.7 ترافلاپس (TFLOPS) عملکرد با دقت دوگانه، و با 9.3 ترافلاپس (TFLOPS) عملکرد تک دقیق(single-precision) و با 18.7 ترافلاپس (TFLOPS) عملکرد نیمه دقیق(half-precision) ارائه می دهد. همچنین از 3584 هسته کودا(CUDA Cores)، و 224 واحد نگاشت بافت(texture mapping units) و 96 واحد ROPs ، به منظور ارائه عملکرد سریع و رعدآسا در طیف گسترده ای از برنامه ها مانند شناسایی اشیا(Object Identification)، تشخیص گفتار(Speech Recognition) و بهبود نتایج جستجو(Search Result Enhancement) پشتیبانی می کند.
حــافظـه
این پردازنده گرافیکی اولین پردازنده گرافیکی NVIDIA است که از نسل دوم HBM2 با حفاظت کد تصحیح خطا (ECC) پشتیبانی می کند. حافظه 16 گیگابایتی نیز مانند کارت 12 گیگابایتی دارای فناوری Chip-on-Wafer-on-Substrate است. تنها تفاوت بین دو پردازنده گرافیکی مبتنی بر PCIe در مشخصات حافظه است. حافظه 16 گیگابایتی CoWoS HBM2 با فرکانس 715 مگاهرتز کار می کند و به یک رابط حافظه 4096 بیتی با پهنای باند 732 گیگابایت بر ثانیه متصل است. این پردازنده گرافیکی همچنین با فرکانس 1190 مگاهرتز کار می کند که می تواند تا 1329 مگاهرتز افزایش یابد.
امـکانــات
این اولین پردازنده گرافیکی پاسکال NVIDIA است که از Page Migration Engine پشتیبانی میکند که قدرت مقابله با فشردهترین برنامههای AI و HPC را فراهم میکند. این به توسعه دهندگان اجازه می دهد تا؛ روی تنظیم با کارایی بالا، و کمتر روی مدیریت حرکت داده تمرکز کنند؛ و به برنامه ها اجازه می دهد تا با پشتیبانی از صفحه بندی حافظه مجازی، فراتر از اندازه حافظه فیزیکی GPU مقیاس شوند. با اجازه به توسعه دهندگان برای دیدن یک فضای حافظه واحد برای کل گره، فناوری حافظه یکپارچه، به طور قابل توجهی کارایی را افزایش می دهد. این کارت دو اسلات، 250 وات برق را از یک کانکتور برق 8 پین می گیرد، اما اتصال صفحه نمایشی برای این واحد وجود ندارد، زیرا قرار نیست مانیتورهایی به آن وصل شوند.
بیان قابلیت کارت گرافیکهای شرکت انویدیا در یک کلام؛
استفاده از قابلیتهای محاسباتی پردازنده گرافیکی (GPU) ، برای حل وظایف غیر گرافیکی.
نظیر: انجام محاسبات و پردازش های بسیار پیچیده و سنگین ریاضی ومهندسی، علمی، و برنامه های سازمانی با کارآیی بسیار بالا.
در کلیه شاخه های علم داده(Data Science) نظیر؛ هوش مصنوعی(AI)، یادگیری عمیق(DL)، یادگیری ماشین(ML)، کلان داده(Big Data)، ..
و همچنین در زمینه هایی از جمله؛ پردازش لرزه ای؛ زیست شناسی محاسباتی و شیمی؛ مدل سازی آب و هوا و آب و هوا تصویر، ویدئو و پردازش سیگنال؛ مالی محاسباتی، فیزیک محاسباتی; CAE و CFD؛ و تجزیه و تحلیل داده ها(Data Analysis)، و شبیه سازی های در علوم و مهندسی مواد، مهندسی مکانیک، مهندسی برق، .. در نرم افزارهایی نظیر؛MATLAB, ABAQUS, ANSYS, MAPLE..
خـلاصـــه اینکه؛
به عنوان یکی از سه نسخه موجود در خانواده NVIDIA Tesla P100، پردازنده گرافیکی 16 گیگابایتی Nvidia Tesla P100 میتواند با معماری پاسکال و فناوری پیشرفته خود، هر حجم کاری پیچیده را انجام دهد. این کارت با 16 گیگابایت حافظه، 3584 هسته CUDA،موتور انتقال صفحه NVIDIA و حافظه HBM2 برای حداکثر انعطاف پذیری، اعتبار قابل توجهی را برای تعدادی از بارهای کاری با کارایی بالا ارائه می دهد.
1- توان محاسباتی نامتناهی برای مرکز داده مدرن
مراکز داده امروزی به بسیاری از گرههای محاسباتی کالایی به هم پیوسته متکی هستند که محاسبات با کارایی بالا (HPC) و حجم کاری فرامقیاس را محدود میکند. NVIDIA® Tesla® P100 از معماری GPU NVIDIA Pascal™ بهره میبرد تا یک پلتفرم یکپارچه برای تسریع (محسبات با کارایی بالا) HPC و AI (هوش مصنوعی) ارائه کند، و به طور چشمگیری توان عملیاتی را افزایش داده و هزینهها را کاهش دهد.
2- سطح جدیدی از عملکرد برنامه ها
با بیش از 700 برنامه HPC تسریع شده - از جمله 15 مورد از 15 مورد برتر - و تمام چارچوب های یادگیری عمیق، تسلا P100 با NVIDIA NVLink تا 50 برابر افزایش عملکرد را ارائه می دهد.
3- ویژگی ها و مزایایش
Tesla P100 از سیلیکون به نرمافزار تغییر یافته و با نوآوری در هر سطح ساخته شده است. هر فناوری پیشگامانه یک جهش چشمگیر در عملکرد ایجاد می کند تا الهام بخش ایجاد سریع ترین گره محاسباتی جهان باشد.
4- جهش عملکرد نمایی با معماری پاسکال
معماری پاسکال انویدیا تسلا پی 100 را قادر میسازد تا عملکردی عالی برای بارهای کاری HPC و مقیاس فوقالعاده ارائه دهد. پاسکال با عملکرد بیش از 21 ترافلاپس (teraFLOPS) 16بیتی ممیز شناور (FP16) ،بهینه شده است تا؛ امکانات جدید هیجان انگیزی را در برنامه های یادگیری
عمیق (Deep Learning applications) ارائه دهد. پاسکال همچنین بیش از 5 و 10 ترافلاپس (teraFLOPS)، عملکرد دوگانه و تک دقیق (double- and single-precision performance) را برای بارهای کاری HPC ارائه می دهد.
5- کارایی بی سابقه با CoWoS با HBM2
Tesla P100 محاسبات و دادهها را روی یک بسته با افزودن تراشه CoWoS با فناوری HBM2 بهخوبی ادغام میکند تا عملکرد حافظه 3 برابری بیشتری نسبت به معماری مکسول NVIDIA Maxwell™ ارائه دهد. این ادغام، جهش نسلی در زمان، برای راه حل های برنامه های کاربردی فشرده سازی داده (data-intensive applications) را فراهم می کند.
6- برنامه های کاربردی در مقیاس عظیم با NVIDIA NVLink
عملکردها، اغلب توسط اتصال متقابل کاهش می یابند. اتصال دوطرفه و پرسرعت NVIDIA NVLink ،انقلابی برای مقیاسبندی برنامهها در چندین GPU ،با ارائه عملکرد 5 برابر بالاتر در مقایسه با بهترین فناوری امروزی طراحی شده است.
توجه: این فناوری در تسلا P100 برای PCIe موجود نیست.
6- برنامه نویسی ساده تر با Page Migration Engine
Page Migration Engine ،توسعه دهندگان را آزاد می کند تا؛ بیشتر روی تنظیم عملکرد محاسباتی تمرکز کنند و کمتر روی مدیریت حرکت داده ها تمرکز کنند. اکنون برنامههای کاربردی میتوانند؛ فراتر از اندازه حافظه فیزیکی GPU ،به مقادیر تقریباً نامحدودی از حافظه، تبدیل شوند.
NVIDIA Tesla P100 برای HPC در مقیاس قوی
تسلا P100 با فناوری NVIDIA NVLink گرههای رعدآسا را، قادر میسازد تا؛ زمان رسیدن به راهحل را برای برنامههای کاربردی در مقیاس قوی به میزان قابل توجهی تسریع کنند. یک گره سرور با NVLink میتواند تا هشت تسلا P100 را با پهنای باند 5 برابر PCIe به هم متصل کند. این برای کمک به حل مهم ترین چالش های جهان که نیازهای محاسباتی بی نهایت در HPC و یادگیری عمیق دارند، طراحی شده است.
NVIDIA Tesla P100 برای HPC با بار کاری مخلوط
Tesla P100 برای PCIe به مراکز داده HPC با حجم کاری مختلط، امکان می دهد تا ضمن صرفه جویی در هزینه، جهش چشمگیری در توان عملیاتی داشته باشند. به عنوان مثال، یک گره واحد با شتاب GPU که توسط چهار تسلا P100 به هم پیوسته با PCIe تغذیه می شود، تا 32 گره CPU کالا را برای برنامه های مختلف جایگزین می کند. تکمیل همه کارها با گره های قدرتمند بسیار کمتر به این معنی است که؛ مشتریان می توانند تا 70 درصد در هزینه های کلی مرکز داده صرفه جویی کنند.
دیدگاه خود را بنویسید