بطاقات رسوميةمراجعاتهاردوير

مراجعة بطاقة GeForce RTX 2060 Founders edition

Turing GPU

عند النظر إلى رقاقة المعالجة الرسومية Turing، ستجد الكثير من المزايا والأمور التي يمكنك أن تتعرف عليها من الإصدارات السابقة، وبنفس الوقت يوجد عدة تعديلات جوهرية أيضاً، حيث تم فصل عناقيد أو تجمعات المعالجات المتعددة SM، وتم فصل أيضاً الأنوية، بطريقة مماثلة لحد ما تصميم Volta GPU، مع العلم أن القاعدة الرئيسية والأفضل لرقاقات Turing GPUs ستكون TU102 وهي الرقاقة الرائدة التي يتم استخدامها في GeForce RTX 2080 Ti، أما بطاقة RTX 2080 فتستخدم رقاقة TU104، وبطاقتي RTX 2060 و 2070 يستخدمان TU106، وفي الجوهر الداخلي تلك الأخيرة، يمكن القول أنها إصدار أكثر بساطة من TU102، ولكن كل منهما يشترك في التصميم نفسه.

مواصفات Turing TU106 GPU

تمتلك هذه رقاقة RTX 2070 تحديداً 10.8 مليار ترانزستور على حُجرة 455mm2، وبالمقارنة Pascal امتلكت قرابة 12 مليار ترانزستور على حجرة حجمها 471mm2، وبالنسبة لمحبين ألعاب الفيديو سوف يهتمون مباشرة بمعالجات shader، بطاقة Quadro RTX 8000 تمتلك 4608 منهم، أما البطاقة RTX 2070، وبعد أن ذكرنا أن تصميمها الداخلي قام بفصل كتل المعالجات هذه، تبين من الصور أنها تمتلك 36 معالجات SM وكل منها يمتلك 64 نواة، مما يعني أننا بالإجمال لدينا هن 2304 معالج Shader، ومن الجدير بالذكر أن هذه الرقاقة تم صنعها على 12nm TSMC FinFET+ معدلة ويمكن استغلال كامل إمكانية رقاقة المعالجة الرسومية.

الرقاقة نفسها الموجودة في RTX 2060 قللت من هذا الأداء، حيث لدينا هنا 30 معالج SM كل واحد منه يوجد عليه 64 نواة، أي بالمجمل لدينا هنا 1920 معالج Shader، وفي الجدول أدناه تجدون تفاصيل أوضح عن الموضوع.

GeForce RTX 2080 Ti FE RTX 2080 Ti RTX 2080 FE RTX 2080 RTX 2070 FE RTX 2060 FE
رقاقة المعالجة TU102 TU102 TU104 TU104 TU106 TU106
تصميم Node الرئيسي TSMC 12 nm FFN
حجم حجرة الرقاقة بقياسات mm² 754 545 445
أنوية Shader 4352 4352 2944 2944 2304 1920
عدد الترانزستور 18.6 مليار 18.6 مليار 13.6 مليار 13.6 مليار 10.8 مليار 10.8 مليار
سرعة التردد الرئيسية 1350 MHz 1350 MHz 1515 MHz 1515 MHz 1410 MHz 1365 MHz
السرعة المضاعفة 1635 MHz 1545 MHz 1800 MHz 1710 MHz 1710 MHz 1680 MHz
الذاكرة 11GB GDDR6 11GB GDDR6 8GB GDDR6 8GB GDDR6 8GB GDDR6 6GB GDDR6
تردد الذاكرة 14 Gbps 14 Gbps 14 Gbps 14 Gbps 14 Gbps 14 Gbps
معدل الذاكرة 352-bit 352-bit 256-bit 256-bit 256-bit 192-bit
نطاق الذاكرة 616 GB/s 616 GB/s 448 GB/s 448 GB/s 448 GB/s 336 GB/s
مقدار الذاكرة المخبئية L2 5632 KB 5632 KB 4096 KB 4096 KB 4096 KB 4096 KB
أنوية RT 68 68 46 46 36 30
أ،وية Tensor 544 544 368 368 288 240
الوحدات الرسومية 272 272 184 184 144 120
ROPs 96 96 64 64 64 48
استهلاك الطاقة 260W 250W 225W 215W 185W 160W
Power connector 2x 8-pin 2x 8-pin 8+6-pin 8+6-pin 8-pin 8-pin
وجود منافذ اتصال NVLink نعم نعم نعم نعم
أقصى درجة حرارة للبطاقة بالدرجة المئوية 89 89 89
السعر $ 1199 $ 999 $ 799 $ 699 $ 599 $ 349

تصميم Turing

سنحاول أن نختصر هنا، ولكن تصميم المعالجة الرسومية هذا يعتبر جديد بالكامل وحصل على تصميم SM جديد، نجد فيه جوانب من كافة التصاميم الأخرى، إلا أنه يميل إلى Volta أكثر من غيره، حيث نجد اثنين من SM متواجدين في كتلة معالجة أو وحدة رسومية واحدة TPC، وكل SM يوجد فيه 64 نواة FP32 و 64 نواة INT32، وبالطبع هذا مختلف عن تصميم Pascal الذي يوجد فيه SM واحدة في كتلة معالجة أو وحدة رسومية و 128 نواة FP32 في كل معالج SM ، ويدعم التصميم الجديد إمكانية التنفيذ المتواززي لعمليات الأنوية FP32 و INT32 بالإضافة إلى عمليات خيوط معالجة مستقلة مثل الموجودة في Volta GV100 GPU، وهو ما يمكن وصفه بالتنفيذ المتزامن لعمليات الأنوية FP32 و INT32، ومن الجدير بالذكر أن كل معالج SM ثمان أنوية Turing Tensor. الصورة أدناه توضح شجرة التصميم هذه.

كل معالج Turing SM مقسم إلى أربع حجرات معالجات، كل واحد منه فيه 16 FP32 و 16 INT32 واثنين من أنوية Tensor ودورة عمل واحدة ووحدة إيفاد أو نشر Dispatch واحدة، وفي كل حجرة يوجد ذاكرة مخبئية L0 وملف تسجيل أوامر بحجم 64 كيلوبايت، والحجرات الأربعة تتشارك جميعها بذاكرة L1 بمقدار 96 كيلوبايت، وأثناء العمل الطبيعي للبطاقة يتم تقسيم هذه  الذاكرة إلى 64 كيلوبايت لمعالجة رسومية shader و 32 كيلوبايت لملف تسجيل الأوامر والذاكرة المخبئية الخاصة بالرسوم، ويمكن لحمولة العمل المختلفة على الحاسب أن تقوم بتقسيم 96 كيلوبايت إلى 32 كيلوبايت كذاكرة مشتركة و 64 كيلوابايت ذاكرة مخبئية L1، أو بالعكس.

التنفيذ المتزامن لعمليات الأنوية FP32 و INT32

جاءت SM بتصميم جديد للذاكرة المشتركة و L1 والذاكرة المخبئية الخاصة بالرسوم، هذا التصميم الموحد يتيح لذاكرة L1 أن تستغل المصادر، مما يتيح إمكانية زيادة نطاقها إلى الضعف عند كل TPC بالمقارنة مع Pascal، كما ويسمح لها أن تتعدل لتصبح أضخم عندما لا يتم استغلال كافة المصادر المتاحة والمخصصة للذاكرة المشاركة.

ذاكرة Turing L1 بإمكانها أن تصل إلى ضخامة بحجم 64 كيلوبايت، ممزوجة مع 32 كيلوبايت لكل معالج SM في الذاكرة المشتركة، أو يمكن تخفيضها إلى 32 كيلوبايت، مما يسمح للذاكرة المشتركة أن تصل إلى 64 كيلوبايت، أما ذاكرة L2 فقد تم زيادتها أيضاً هي الأخرى، فمزج ذاكرة L1 مع الذاكرة المشتركة يقلل من تأخر الاستجابة ويمنح معدل نطاق أعلى من الذي كان يتواجد في Pascal GPU، وشركة NVIDIA تقول أن هذه التعديلات على تقنيات المعالجة SM سمحت لتقنيات Turing بجلب أداء أفضل بنسبة 50% لكل نواة CUDA، ومن الجدير بالذكر أن رقاقات Turing GPU تُضيف ذواكر L2 أضخم وأسرع بالإضافة إلى الذاكرة الجديدة GDDR6، حيث تأتي رقاقة TU102 GPU مع ذاكرة مخبئية L2 بحجم 6 ميجابايت، أي ضعف الرقم الذي تقدم رقاقة الجيل السابق GP102 GPU والتي تم بناء البطاقة القوية TITAN Xp عليها، كما وتتيح رقاقة TU102 معدل نطاق أعلى أيضاً للذاكرة المخبئية L2، كل تقسيم ROP في Turing يحتوي على ثمان وحدات ROP وكل وحدة قادرة على معالجة نموذج لون أحادي، ولوحة TU102 الكاملة تمتلك 12 تقسيمات ROP لتقديم نحو 96 وحدة ROP ، بطاقتي RTX 2080 و 2070 يمتلكان 64 وحدة منها.

ذاكرة الرسوم GDDR6

لابد من التوضيح أيضاً وجود اختلاف أخر كبير بين  Volta و Turing وهو ما يخص الذاكرة، بعد أن أصبحت تقنيات النطاق العالي للذاكرة HBM2 ميزة أساسية في المنتجات المعاصرة، ويبدو أن السوق تفضل حالياُ تقنيات GDDR6، كونه من الأسهل إضافتها للمنتجات وتكلفة إنتاجها أقل، وربما قد تتمكن من تجاوز إمكانيات HBM2، حيث كاد بإمكان بطاقة GeForce GTX 1080 السابقة مع ذاكرة GDDR5X أن تعمل بمعدل 11 جيجابايت في الثانية، وأحياناً يمكن تعديلها لتصل إلى 12 جيجابايت، أما ذاكرة GDDR6 فهي أسرع وأكثر فعالية في استهاك الطاقة، وهي تبني تقدمها على أساسات GDDR5X وتقدم نطاق أعلى للذاكرة بحدودد 14 جيجابايت في الثانية، ويمكن القول أن أدائها يضاعف أداء GDDR5 (لا نقصد GDDR5X)، ومن المتوقع أن تصل إمكانيات هذه الذاكرة في المستقبل القريب إلى معدل نقل البيانات 16 جيجابايت في الثانية، وسبب كلامنا عن إمكانيات هذه الذاكرة المستقبلية والحالية، هو أن بطاقة GeForce RTX 2060 تمتلكها بحجم 6 جيجابايت وبمعدل 192-bit .

الصفحة السابقة 1 2 3 4 5 6 7 8 9الصفحة التالية
الوسوم
زر الذهاب إلى الأعلى
إغلاق
%d مدونون معجبون بهذه: