Титульнaя функция нoвыx видeoкaрт NVIDIA — трaссирoвкa лучeй в рeaльнoм врeмeни — ужe прoявилa сeбя в пeрвыx игрax, гдe oнa ширoкo испoльзуeтся для фoрмирoвaния дoстoвeрныx oтрaжeний и глoбaльнoгo oсвeщeния (Battlefield V и Metro Exodus), a нa oчeрeди eщe нeскoлькo бoльшиx прoeктoв, кoтoрыe пoлучaт пoддeржку DXR (рaсширeния API Direct3D 12 для Ray Tracing). Нo срeди гeймeрoв нe утиxaют спoры o тoм, прaвильнo ли пoступилa NVIDIA, пoстaвив вo глaву углa пeрeдoвыe мeтoды рeндeрингa вмeстo «сырoй» прoизвoдитeльнoсти грaфичeскиx прoцeссoрoв.
Тe пoкупaтeли, кoтoрыe нe видят у трaссирoвки лучeй бoльшиx пeрспeктив в кoмпьютeрныx игрax, с рaдoстью сoглaсились бы изъять из ускoритeлeй GeForce RTX всю лoгику, oбслуживaющую эту функцию, в oбмeн нa рoст быстрoдeйствия в игрax стaрoгo oбрaзцa. Кaким бы oн стaл — Turing бeз RTX? Кoнeчнo, NVIDIA нe сoбирaeтся выпускaть aнaлoг GeForce RTX 2080 или RTX 2080 Ti бeз RT-ядeр спeциaльнo для нeвeрующиx. С другoй стoрoны, кoмпaнии придeтся рaнo или пoзднo зaмeнить всю сeрию GeForce 10 устрoйствaми нa oснoвe GPU, выпущeнныx пo тexнoлoгии 12 нм. Тaк гдe жe нa цeнoвoй линeйкe NVIDIA прoвeдeт oтмeтку, нижe кoтoрoй aппaрaтнaя трaссирoвкa лучeй ужe лишeнa прaктичeскoгo смыслa?
Тeпeрь нaм извeстeн oтвeт нa этoт вoпрoс. GeForce RTX 2060 oстaлся нaибoлee дoступным прeдстaвитeлeм нoвoгo пoкoлeния, кoтoрый oблaдaeт сoвмeстимoстью с DXR, a «Тьюринги» бюджeтнoй кaтeгoрии выдeлили в нoвую сeрию, GeForce 16, кoтoрaя зaнимaeт прoмeжутoчнoe пoлoжeниe мeжду GeForce 10 и GeForce 20. И рoдoнaчaльникoм этой серии стал GeForce GTX 1660 Ti. Как мы помним, RTX 2060 уже оказался весьма выгодным предложением по соотношению цены и быстродействия в «старых» играх на фоне общего удорожания видеокарт NVIDIA. Посмотрим, чем продолжилось шествие архитектуры Turing — уже без RTX — в зоне ниже $300.
⇡#Графический процеcсор TU116
Для того, чтобы выпустить графическую карту на основе архитектуры Turing и прогрессивного техпроцесса 12 нм FinFET, но отбросить функции, связанные с аббревиатурой RTX (трассировку лучей и аппаратное ускорение нейронных сетей), NVIDIA пришлось создать отдельную модель графического процессора — TU116. Как ни крути, а TU106 — «младший из старших» чипов семейства Turing, уже применяется в двух ускорителях серии GeForce RTX — 2060 и 2070. Подвергнуть его дальнейшей деконструкции ради GeForce GTX 1660 Ti едва ли было бы целесообразно с экономической точки зрения.
Блок-схема TU116 производит такое впечатление, как будто никакого RTX не было и в помине, а микроархитектура Turing отличается от предшествующей Pascal лишь в части организации функциональных блоков, выполняющих традиционные функции рендеринга. Скальпель инженеров NVIDIA отсек лишь новые компоненты — тензорные и RT-ядра — а по другим параметрам TU116 отличается от TU106 в основном количественным, нежели качественным образом. Так, наряду с CUDA-ядрами, выполняющими операции стандартной точности над числами с плавающей запятой (FP32), внутри потокового мультипроцессора (SM — Streaming Multiprocessor) TU116 есть равное количество ядер для целочисленных операций (INT32), которые активно используются не только в расчетных задачах, но и в шейдерном коде компьютерных игр. Если точнее, целочисленные и FP-ALU, объединенные внутри CUDA-ядра, в архитектуре Turing получили раздельные каналы передачи данных, и это позволяет диспетчерам команд в течение двух тактов полностью нагрузить SM операциями того и другого типа.
С другой стороны, TU116 не уступает прочим чипам архитектуры Turing в способности выполнять операции половинной точности (FP16) с пропускной способностью в отношении 2:1 к операциями FP32. Это неожиданное и даже подозрительное качество для чипа, который создали специально для условно бюджетных графических карт, лишенных функций RTX. Дело вот в чем: операции FP16 в старших «Тьюрингах» выполняются силами тензорных ядер, даже если приложение напрямую не обращается к ним через API CUDA. Конечно, формат FP16 уже нашел применение в компьютерной графике для шейдерных программ, не требующих более точного представления данных: самый яркий пример — это Wolfenstein II: The New Colossus, шейдеры половинной точности также применяются в Far Cry 5. Но честно говоря, трудно поверить, что NVIDIA потратила время разработчиков и площадь чипа (наверняка существенную) специально ради таких, по-прежнему маргинальных в играх на ПК, ситуаций. Двойную мощность в операциях FP16 проще объяснить тем, что тензорные ядра на самом деле есть в кремнии TU116. NVIDIA просто редуцировала их управляющую логику, либо, что более вероятно, заблокировала доступ программным путем (в первую очередь, для DLSS), чтобы лучше дифференцировать GeForce GTX 1660 Ti и GeForce RTX 2060, которые в остальном довольно-таки близки по своему вычислительному потенциалу.
ПроизводительNVIDIA
Название
GP106
GP104
TU116
TU106
TU104
Микроархитектура
Pascal
Pascal
Turing
Turing
Turing
Техпроцесс, нм
16 nm FinFET
16 nm FinFET
12 нм FFN
12 нм FFN
12 нм FFN
Число транзисторов, млн
4400
7 200
6 600
10 800
13 600
Площадь чипа, мм2
200
314
284
445
545
Конфигурация SM/TPC/GPC
Число SM
10
20
24
36
48
Число TPC
5
20
12
18
24
Число GPC
2
4
3
3
6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра
128
128
64
64
64
FP64-ядра
4
4
2
2
2
INT32-ядра
Нет
Нет
64
64
64
Тензорные ядра
Нет
Нет
Нет
8
8
RT-ядра
Нет
Нет
Нет
1
1
Объем кеша L1, Кбайт
48
48
32/64 из 96 (общий с разделяемой памятью)
32/64 из 96 (общий с разделяемой памятью)
32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти, Кбайт
96
96
32/64 из 96 (общий с кешем L1)
32/64 из 96 (общий с кешем L1)
32/64 из 96 (общий с кешем L1)
Объем регистрового файла, Кбайт
256
256
256
256
256
Программируемые вычислительные блоки GPU
FP32-ядра
1280
2 560
1 536
2 304
3 072
FP64-ядра
40
80
48
72
96
INT32-ядра
Нет
Нет
1 536
2 304
3 072
Тензорные ядра
Нет
Нет
Нет
288
384
RT-ядра
Нет
Нет
Нет
36
48
Блоки GPU фиксированной функциональности
TMU (блоки наложения текстур)
80
160
96
144
192
ROP
48
64
48
64
64
Конфигурация памяти
Объем кеша L2, Кбайт
1 536
2 048
1 536
4 096
4 096
Разрядность шины RAM, бит
192
256
192
256
256
Тип микросхем RAM
GDDR5
GDDR5/GDDR5X
GDDR6
GDDR6
GDDR6
Интерфейс SLI/NVLINK
Нет
2 × SLI Gen. 2
Нет
Нет
1 × NVLink 2.0 x8
Что бы в действительности ни произошло с тензорными ядрами TU116, новый чип трудно сравнить по площади и количеству транзисторов с TU106: эти параметры NVIDIA уменьшила на 26 и 39 % соответственно. В результате по транзисторному бюджету TU116 оказался в промежутке между двумя чипами предыдущего поколения — GP106 и GP104, а по числу главных исполнительных блоков (32-битных CUDA-ядер и текстурных модулей) ближе к первой, нежели второй модели. У TU116 и GP106 одинаковый объем кеш-памяти второго уровня (1,5 Мбайт), регистрового файла в пересчете на один SM (256 Кбайт) и разрядность шины RAM (192 бит).
Вместе с тем, чипы архитектуры Turing отличаются от Pascal массой оптимизаций конвейера, которые в совокупности позволяют лучше раскрыть теоретическую производительность GPU в реальных задачах. Это и кеш первого уровня, обладающий сниженной латентностью за счет слияния с разделяемой памятью, и отдельный кеш инструкций нулевого уровня, и возможность относительно независимой планировки потоков. По оценкам NVIDIA, пропускная способность Turing в шейдерных расчетах была увеличена в полтора раза по сравнению с Pascal.А среди функций рендеринга в рамках растеризации — набор проприетарных методов, таких как исполнение шейдеров с переменной выборкой (Variable Rate Shading). Но для того, чтобы описать суть и результаты всех нововведений, нам пришлось бы повторить добрую часть вводной статьи, посвященной архитектуре Turing — лучше освежите память с ее помощью.
⇡#Технические характеристики, цена
В составе GeForce GTX 1660 Ti используется полностью функциональная версия TU116, которая несет 1536 шейдерных ALU (32-битных CUDA-ядер) и 96 блоков наложения текстур. По сравнению с GeForce RTX 2060 младшая модель сохранила 80 % данных вычислительных ресурсов, но, благодаря тому, что GTX 1660 Ti характеризуется наивысшими тактовыми частотами в таблице референсных спецификаций ускорителей на чипах Turing, по теоретическому быстродействию в операциях с плавающей запятой стандартной точности (FP32) и скорости наложения текстур он отвоевал уже 84 % вычислительной мощности GeForce RTX 2060.
Если же сравнивать GTX 1660 Ti с видеокартами семейства GeForce 10, то новинка дает хорошее представление о тех преимуществах, которые подарили видеокартам NVIDIA техпроцесс 12 нм и архитектура Turing, не обремененная тензорными (если верить NVIDIA) и RT-ядрами. Так, GeForce GTX 1060 и GeForce GTX 1660 Ti работают в рамках одинакового резерва мощности (120 Вт) и близки по тактовым частотам (Boost Clock у этих моделей достигает 1708 и 1770 МГц соответственно). Но в новом чипе инженеры NVIDIA смогли поместить на 20 % больше 32-битных CUDA-ядер и текстурных блоков, а пиковая производительность в операциях FP32, как следствие, увеличилась на 24 %.
ПроизводительNVIDIA
Модель
GeForce GTX 1060 6 Гбайт
GeForce GTX 1070
GeForce GTX 1660 Ti
GeForce RTX 2060
GeForce RTX 2070
GeForce RTX 2080
GeForce RTX 2080 Ti
Графический процессор
Название
GP106
GP104
TU116
TU106
TU106
TU104
TU102
Микроархитектура
Pascal
Pascal
Turing
Turing
Turing
Turing
Turing
Техпроцесс, нм
16 нм FinFET
16 нм FinFET
12 нм FFN
12 нм FFN
12 нм FFN
12 нм FFN
12 нм FFN
Число транзисторов, млн
4400
7 200
6 600
10 800
10 800
13 600
18 600
Тактовая частота, МГц: Base Clock / Boost Clock
1506/1708
1 506 / 1 683
1500/1770
1365/1680
1 410 / 1 620 (Founders Edition: 1 410 / 1 710)
1 515 / 1 710 (Founders Edition: 1 515 / 1 800)
1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU
1280
1 920
1536
1920
2304
2944
4352
Число блоков наложения текстур
80
120
96
120
144
184
272
Число ROP
48
64
48
48
64
64
88
Оперативная память
Разрядность шины, бит
192
256
192
192
256
256
352
Тип микросхем
GDDR5 SDRAM
GDDR5 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)
2000 (8000) 2250 (9000)
2 000 (8 000)
1 500 (12 000)
1 750 (14 000)
1 750 (14 000)
1 750 (14 000)
1 750 (14 000)
Объем, Мбайт
6 144
8 192
6 144
6 144
8 192
8 192
11 264
Шина ввода/вывода
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)
4372
6 463
5437
6451
7 465 / 7 880 (Founders Edition)
10 069 / 10 598 (Founders Edition)
13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64
1/32
1/32
1/32
1/32
1/32
1/32
1/32
Производительность FP32/FP16
1/128
1/128
2/1
2/1
2/1
2/1
2/1
Пропускная способность оперативной памяти, Гбайт/с
192/216
256
288
336
448
448
616
Вывод изображения
Интерфейсы вывода изображения
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DisplayPort 1.4a, HDMI 2.0b
DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт
120
150
120
160
175/185 (Founders Edition)
215/225 (Founders Edition)
250/260 (Founders Edition)
Розничная цена (США, без налога), $
249 (рекомен-дованная) / 299 (Founders Edition, nvidia.com)
349 (рекомен-дованная) / 399 (Founders Edition, nvidia.com)
279 (рекомен-дованная)
349 (рекомен-дованная) / 349 (Founders Edition, nvidia.com)
499 (рекомен-дованная) / 599 (Founders Edition, nvidia.com)
699 (рекомен-дованная) / 799 (Founders Edition, nvidia.com)
999 (рекомен-дованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб.
НД (рекомен-дованная) / 22 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 31 590 (Founders Edition, nvidia.ru)
22 990 (рекомен-дованная)
НД (рекомен-дованная) / 31 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 47 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 63 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 95 990 (Founders Edition, nvidia.ru)
Как мы уже поняли, GeForce GTX 1660 Ti по своим основным характеристикам является продолжателем традиций серии GeForce RTX, только без трассировки лучей и с поправкой на иной набор вычислительных блоков. Вот еще одна черта, которая роднит GeForce GTX 1660 Ti со старшими «Тьюрингами», — кадровый буфер на основе микросхем GDDR6. Однако пропускная способность шины памяти (ПСП), которую дают чипы номинала 14 Гбит/с на контакт, TU116 ни к чему, поэтому новинка довольствуется скоростью 12 Гбит/с. Как бы то ни было, итоговая ПСП у GTX 1660 Ti на 33 % выше по сравнению с модификациями GeForce GTX 1060 второй волны, которые оснащаются чипами GDDR5 9 Гбит/с.
В итоге GeForce GTX 1660 Ti можно охарактеризовать как модернизированный аналог GeForce GTX 1060, который за счет усиленного набора вычислительных блоков сделал крупный шаг в сторону GeForce GTX 1070. Но не будем забывать и о том, что в практических задачах чипам архитектуры Turing проще достигнуть своей теоретической производительности, чем их прародителям из семейства Pascal, благодаря оптимизированной структуре потокового мультипроцессора, увеличенному кешу первого уровня и другим не столь существенным нововведениям — это уже доказали видеокарты под маркой GeForce RTX. Так что в предварительных оценках реального быстродействия все-таки нужно поместить GTX 1660 Ti ближе к GTX 1070, нежели к GTX 1060.
GeForce GTX 1660 Ti поступит в продажу по рекомендованной стоимости $279. Как видим, NVIDIA и в этом случае продает новую видеокарту дороже, чем ее прямого предшественника (GeForce GTX 1060 стартовал на отметке $249), хотя ни о какой трассировке лучей уже речи не идет. Но прежде чем в очередной раз возмутиться алчности производителя, стоит окинуть взглядом положение дел, которое сложилось на рынке потребительских видеокарт ценой до $400.
Ближайшая модель серии GeForce RTX — 2060 — обладает рекомендованной стоимостью $349, и такую же цену получил в начале своего пути GeForce GTX 1070. А ведь GeForce GTX 1660 Ti наверняка не слишком отличается от последнего по быстродействию в играх. С другой стороны, формальный конкурент GTX 1660 Ti — Radeon RX 590 — сейчас стоит не меньше $259, хотя начинал с $279. Получается, и тут продукт NVIDIA стартовал с более низкой позиции.
Что касается российского рынка, то для GTX 1660 Ti объявлена рекомендованная цена в 22 990 рублей, но едва ли она удержится долго, ведь за такие деньги уже можно купить одну из простейших модификаций GeForce RTX 2060, а Radeon RX 590 у нас стоит от 18 660 р. Какими бы ни были розничные цены первых партий GeForce GTX 1660 Ti, геймерам, рассматривающим видеокарты этой категории, стоит повременить с покупкой — прайс-листы наверняка будет сильно штормить.
⇡#GIGABYTE GeForce GTX 1660 Ti OC: конструкция
Для знакомства с физическим воплощением GeForce GTX 1660 Ti нам прислали видеокарту GIGABYTE. Нет сомнений, что эта фирма выпустит несколько устройств на чипе TU116 для покупателей с разным уровнем потребностей и достатка. Но перед нами явно бюджетное устройство — это видно уже по маркировке, в которой нет сокращенных слов AORUS и WINDFORCE, сигнализирующих о принадлежности к более изысканным маркам в каталоге GIGABYTE. Однако это как раз к лучшему, ведь на сей раз речь идет о массовой видеокарте, которую следует изучить, убрав из уравнения такие переменные, как избыточно мощная система охлаждения и отбор кристаллов GPU с наилучшим частотным потенциалом.
Впрочем, наш экземпляр GIGABYTE GeForce GTX 1660 Ti имеет маркировку OC, которая указывает на заводской оверклокинг. Не известно, сколь сильно производитель увеличил частоты GPU, — точных спецификаций этой видеокарты нам не сообщили, а базовую частоту устройств на чипах Turing партнеры NVIDIA практически никогда не меняют. Но едва ли GIGABYTE GeForce GTX 1660 Ti разогнана настолько, чтобы дать TU116 неоправданное преимущество в тестах, где мы столкнем ее с референсными устройствами NVIDIA и AMD.
Внешний вид и особенности конструкции GIGABYTE GeForce GTX 1660 Ti не нуждаются в подробном описании. Корпус ускорителя целиком сделан из пластика — даже защитная панель на обратной стороне печатной платы выполнена из него же. Но если честно, металлический щиток, который монтируют на PCB более дорогих моделей, порой тоже выполняет чисто декоративную функцию и не участвует в охлаждении компонентов. Иных украшений видеокарта лишена. В частности, на ней нет ни единого светодиода, не говоря уже об RGB-подсветке или возможности питания светодиодных лент.
За охлаждение устройства отвечают два вентилятора диаметром 87 мм — здесь тоже нет никаких изысков, но применяется решение, которое GIGABYTE и некоторые другие производители ввели для снижения турбулентности воздушного потока: крыльчатки вращаются в противоположные стороны.
Радиатор кулера представляет собой простую конструкцию из блока алюминиевых ребер и плоского основания, которое накрывает графический процессор и чипы памяти GDDR6. Единственная теплотрубка диаметром 5 мм согнута в S-образную форму и пропущена через основание радиатора таким образом, что ее середина примыкает к кристаллу GPU. К чести производителя, стоит выделить тот факт, что компоненты регулятора напряжения тоже отдают тепло основному радиатору СО вместо отдельного «огрызка», как это часто делали в недорогих устройствах прошлых лет, причем активное охлаждение получили не только полевые транзисторы с интегрированным драйвером, но и дроссели VRM.
⇡#GIGABYTE GeForce GTX 1660 Ti OC: печатная плата
Пластиковый кожух, который обернут вокруг свободного конца печатной платы GIGABYTE GeForce GTX 1660 Ti, маскирует ее небольшие габариты. На основе этой PCB вполне можно сделать видеокарту форм-фактора Mini-ITX, и, если судить по пустующим площадкам для двух чипов GDDR6, она уже используется в составе какого-то другого устройства на чипе семейства Turing, причем с 256-битной шиной памяти. Среди всех продуктов серии GeForce RTX есть лишь один подходящий кандидат — RTX 2070, а чипы TU116 и TU106, выходит, являются электрически взаимозаменяемыми. Преобразователь напряжения GIGABYTE GeForce GTX 1660 Ti изначально рассчитан на восемь фаз, но в связи с умеренным энергопотреблением TU116 на текстолите распаяны компоненты лишь шесть из них: четыре для графического процесссора и две для микросхем RAM. Впрочем, как и в ускорителях серии GeForce RTX, в составе VRM здесь применяются полевые транзисторы с интегрированным драйвером (т. н. DrMOS или «силовые каскады» — power stages), благодаря которым ШИМ-контроллер точнее регулирует напряжение на стоке транзистора и возрастает КПД преобразования.
Микросхемы GDDR6 производства Micron с маркировкой 8XA77 D9WCR работают со штатной пропускной способностью 12 Гбит/с на контакт шины. Кристалл TU116 на этой плате не имеет буквы А в среднем блоке маркировки, которая у старших моделей на чипах Turing выделяет GPU отборного качества, обладающие повышенным частотным потенциалом. Стало быть, NVIDIA отказалась от предварительной категоризации образцов TU116, а может, нам наконец-то попался Turing «второго сорта». Независимо от того, какая версия соответствует действительности, разогнать эту видеокарту будет особенно интересно, ведь она покажет, на что можно рассчитывать в попытках оверклокинга простых модификаций GeForce GTX 1660 Ti, доступных за умеренные деньги.
Следующая страница →