Метод трассировки лучей против растеризации: новое поколение качества графики?

Введение

За последние немного лет метод трассировки лучей (ray tracing), похоже, стал "мечтой номер один" мира 3D-графики в реальном времени. Заинтересованность к этой технологии рендеринга вырос до максимума, когда юный исследователь Дэниел Похл (Daniel Pohl) объявил о своём проекте в области этой технологии ещё в 2004 году.

Причина интереса широких масс публики к работе заключалась, по большей мере, в том, что Похл сфокусировался на знаменитых играх id Software Quake III, Quake IV и шутере-франшизе Quake Wars 3D. Исследователь привлёк полно внимания со стороны прессы, а геймеры приступили предаваться мечтам о светлом будущем, когда их любимые игры будут просчитываться по методу трассировки лучей и избавятся от растеризации.

Трассировка лучей

Intel достаточно стремительно обратила участливость на замысел, и компании он показался идеальным способом для оправдания увеличения числа ядер в процессорах. Фирма одним духом запустила собственную исследовательскую программу, и сегодня Intel ни в жизнь не упускает возможность подчеркнуть, что трассировка лучей является будущим 3D-игр в реальном времени. Но так ли это на самом деле? Какие технологические действительности скрываются за маркетинговой шумихой? Каковы реальные преимущества способа трассировки лучей? Можем ли мы дожидаться, что трассировка лучей заменит растеризацию? Мы попытаемся откликнуться на эти вопросы.

Трассировка лучей

Основные принципы

Основная мысль приема трассировки лучей очень проста: для каждого пикселя на дисплее двигатель рендеринга проводит прямой луч от глаза наблюдателя (камеры) до элемента выводимой сцены. Первое пересечение употребляется для определения цвета пикселя как функции пересекаемой поверхности элемента.

Но одного сего недостаточно для вывода реалистичной сцены. Надобно определить освещение пикселя, что требует проведения вторичных лучей (в отличие от первичных лучей, которые определяют видимость разных объектов, составляющих сцену). Чтобы дать расчет эффекты освещения сцены, проводятся вторичные лучи от точек пересечения к разным источникам света. Ежели эти лучи блокируются объектом, то данная точка находится в тени, которую отбрасывает рассматриваемый источник света. По-другому источник света влияет на освещение. Совокупность всех вторичных лучей, которые достигают источника света, определяет свойство освещения, которое попадает на наш компонент сцены.

Но и это ещё не всё. Чтобы заработать наиболее реалистичный рендеринг, нужно учесть характеристики отражения и преломления материала. Другими словами, надо ведать, какое количество света отражается в точке пересечения первичного луча, а кроме того количество света, которое проходит сквозь материал в этой точке. Опять же, для расчёта финального цвета пикселя нужно проводить лучи отражения и преломления.

В итоге мы получаем несколько типов лучей. Первичные лучи используются для определения видимости объекта и напоминают своего рода Z-буфер, используемый в растеризации. А вторичные лучи разделяются на следующие:

  • лучи тени/освещения;
  • лучи отражения;
  • лучи преломления.

Трассировка лучей

Строгий приём трассировки лучей.

Данный метод трассировки лучей является результатом работы Тёрнера Виттеда (Turner Whitted), исследователя, тот, что изобрёл способ 30 лет обратно. До того времени приём трассировки лучей трудился только с первичными лучами. И улучшения, внесённые Виттедом, оказались гигантским шагом в сторону реализма рендеринга сцены.

Ежели вы знакомы с физикой, то наверняка обратили участливость на то, что приём трассировки лучей работает "в обратную сторону" от явлений, протекающих в реальном мире. В различие от распространённого в Средние века мнения, наши глаза не излучают лучи света, наоборот, они получают лучи света от источников света, которые отражаются на различных объектах, окружающих нас. В принципе, так и работали самые в первый раз алгоритмы трассировки лучей.

Но главным недостатком первых алгоритмов было то, что они налагали огромную вычислительную нагрузку. Для каждого источника освещения вам необходимо обмануть тысячи лучей, многие из которых вообще не будут влиять на выводимую сцену (потому что они не пересекают плоскость построения изображения). Современные алгоритмы трассировки лучей являются оптимизацией базовых алгоритмов, при этом они используют так называемую обратную трассировку луча, ибо лучи проводятся в обратном направлении по сравнению с реальностью.

Трассировка лучей

Своеобычный приём трассировки лучей приводил к большому количеству ненужных расчётов.

Преимущества трассировки лучей

Как вы уже видели, основным преимуществом алгоритма трассировки лучей является его простота и элегантность. Способ использует исключительно единственный предмет-примитив для отображения эффектов, которые нередко требуют нетривиального подхода и сложных технологий стимуляции при использовании стандартного приема растеризации.

Трассировка лучей

Карта окружения (environment map) даёт хорошее приближение к симуляции отражений окружающей среды, при всем при том способ трассировки лучей смочь симулировать более того отражения глаз машины Луиджи на капоте.

Отражения - это одна из областей, в которых способ трассировки лучей отлично показывает себя. Ныне в 3D-движках современных игр отражения рассчитываются с помощью карт окружений (environment map). Эта методика даёт хорошее приближение к отражениям объектов, расположенных "в бесконечности" или в окружающей среде (как разрешено лицезреть по названию), но для близко расположенных объектов подход показывает свои ограничения.

Разработчики игр-гонок, в частности, создали свои трюки для симуляции отражений близких объектов с помощью так называемых динамических кубических карт (dynamic cube maps). Камера располагается на уровне машины геймера, позже чего проводится рендеринг в основных направлениях. Потом результаты рендеринга сохраняются в кубических картах, которые и используются для вывода отражений.

Трассировка лучей

Динамические кубические карты могут симулировать отражения близких объектов, в частности, самолёта на чайнике. Но они не справляются с отражениями частей объекта неожиданно на друге, к примеру, носика чайника на его корпусе.

Вестимо, у динамических кубических карт также кушать свои недостатки. Достаточно накладно по вычислительной мощности просчитывать немного результатов рендеринга, и, чтобы производительность не падала уж очень жутко, кубические карты не пересчитываются столь раз, сколько основная картинка. Это мочь привести к небольшой задержке отражений. Чтобы снизить нагрузку на прыть заполнения (fill rate), рендеринг выполняется с меньшим разрешением, что смочь привести к появлению пикселизации в отражениях. В конце концов, эта технология часто ограничивается машиной геймера, а все другие объекты используют больше простые (сферические) карты окружения.

При методе трассировки лучей отражения отображаются совершенно, причём без сложных алгоритмов, потому что всё просчитывается основным алгоритмом рендеринга. Ещё одним преимуществом разрешено считать вывод отражений частей объекта нежданно-негаданно на друге, в частности, отражение зеркала бокового вида на теле машины, что очень сложно получить с помощью приема растеризации - а здесь это отражение получается так же, как и другие.

Трассировка лучей

Метод трассировки лучей позволяет симулировать отражения частей объектов как черт из табакерки на друге, в частности, отражение зеркала бокового вида на корпусе машины.

Другие преимущества алгоритма трассировки лучей

Другим бесспорным преимуществом способа трассировки лучей является качественная обработка эффектов прозрачности. С помощью метода растеризации отчаянно сложно выводить эффекты прозрачности, поскольку расчёт прозрачности напрямую зависит от порядка рендеринга. Чтобы заработать хорошие результаты, надо отсортировать прозрачные полигоны в порядке самых дальних от камеры к самым близким, а уже впоследствии осуществлять рендеринг.

Но на практике эта задача слишком тяжёлая с точки зрения вычислений, да и ошибки прозрачности также возможны, так как выполняется сортировка полигонов, а не пикселей. Существует несколько технологий, позволяющий объехать сортировку полигонов сцены (таких как depth peeling и A-буферы), но на данный час ни одну из них нельзя назвать спасительной. Вкупе с тем алгоритм трассировки лучей позволяет элегантно справиться с эффектами прозрачности.

Трассировка лучей

Правильная обработка эффектов прозрачности с помощью растеризатора требует использования сложных алгоритмов, в частности, A-буферов.

Другим важным преимуществом является расчёт теней. В мире растеризации стандартом стала метод карт теней (shadow mapping). Но у неё несть немного проблем, такие как "лесенки" на контурах и объём используемой памяти. Способ трассировки лучей позволяет постановить проблему теней сильно элегантно, не прибегая к сложным алгоритмам, используя тот же предмет-примитив и не требуя дополнительную память.

В конце концов, ещё одним сильным преимуществом алгоритма трассировки лучей является "родная" вероятность работы с искривлёнными поверхностями. Уже немного лет у современных GPU есть поддержка искривлённых поверхностей (она то появляется, то исчезает по мере выхода новых драйверов и новых архитектур). Но ежели растеризаторам приходится исполнять изначальный доступ тесселяции, чтобы создавать треугольники (это единственный примитив, с которым мочь работать движок растеризации), то движок методом трассировки лучей мочь просто работать с пересечением лучей, без точного математического определения поверхности.

Другие преимущества метода трассировки лучей

Мифы о трассировке лучей

Но способ трассировки лучей всё же не стоит идеализировать, потому настало время сокрушить некоторые мифы, окружающие этот алгоритм.

Начнём с того, что многие геймеры считают способ трассировки лучей принципиально лучше, чем растеризации, поскольку его используют в фильмах. Это не так. Большинство фильмов с синтезированной/рисованной картинкой (к примеру, все фильмы студии Pixar) используют способ под названием REYES, тот, что опирается на растеризации. Pixar добавила трассировку лучей к своему движку рендеринга RenderMan исключительно позднее, во время производства мультфильма "Тачки/Cars". Но даже для сего фильма метод трассировки лучей использовался избирательно, чтобы не перегрузить существующие вычислительные мощности. До сего проекта Pixar использовала внешний модуль для ограниченного использования приема трассировки лучей, например, для эффектов затенения ambient occlusion (AO).

Трассировка лучей

Второй распространённый миф посреди защитников приема трассировки лучей касается сложности сцен, которые позволительно выводить с помощью приема трассировки лучей и с помощью растеризации. Чтобы разобраться, нам надобно внимательнее рассмотреть каждый алгоритм.

Ниже показано, как алгоритм растеризации работает с каждым треугольником сцены.

  • Определяется комплект пикселей, который покрывает любой треугольник;
  • для каждого задействованного пикселя его глубина сравнивается с глубиной соседнего пикселя.

Основное ограничение алгоритма растеризации касается числа треугольников. Метод имеет сложность O(n), где n - численность треугольников. Способ в данном случае имеет линейную сложность в зависимости от числа треугольников, потому как для каждого кадра составляется список треугольников, которые надо обработать, один за другим.

Напротив, алгоритм трассировки лучей работает следующим образом.

Для каждого пикселя кадра:

  • проводится луч, определяющий, какой треугольник является самым близким;
  • для каждого треугольника рассчитывается пространство от треугольника до плоскости вывода изображения.

Как видим, последовательность обработки стала обратной. В первом случае мы хватали любой полигон и смотрели, какие пиксели он покрывает. А во втором случае мы хватали любой пиксель и смотрели, какой полигон ему соответствует. Оттого разрешено пошевелить мозгами, что метод трассировки лучей меньше зависит от числа полигонов, чем метод растеризации, поскольку численность полигонов не влияет на стержневой цикл. Но на практике это не так. Фактически, чтобы определить, какой треугольник будет пересекаться с лучом, нам надобно обработать все треугольники сцены. В этом месте, конечно, защитники метода трассировки лучей скажут, что не нужно обрабатывать все треугольники сцены с каждым лучом. Ежели применять соответствующий тип структуры данных, то очень легко организовать треугольники таким образом, чтобы исключительно небольшой их процент тестировался с каждым лучом, то есть мы получаем, что способ трассировки лучей имеет сложность O(log n), где n - количество полигонов.

Да, доводы можно признать верными. Но защитники метода трассировки лучей малость лукавят в том, что то же самое верно и для растеризации. Игровые движки уже многие годы используют BSP-лесной массив (binary space partitioning) и другие методы, ограничивающие численность полигонов, которые нужно рассчитать для каждого кадра. Ещё единственный спорный момент - такие структуры больше всего эффективны для статических данных. Всё, что нам нужно: рассчитать данные единственный раз, после чего просто обеспечивать к ним доступ, и это даёт очень хорошие результаты. Но что делать с динамическими данными? В данном случае данные придётся пересчитывать для каждого изображения, а для сего нет никаких чудесных формул. Всё одинаково придётся заниматься изучением каждый полигон.

Простой приём?

Последний миф касается естественной простоты и элегантности алгоритма трассировки лучей. Вестимо, алгоритм трассировки лучей можно черкнуть несколькими строчками кода (некоторые алгоритмы умещаются на родной стороне "визитки"), но высокопроизводительный алгоритм трассировки лучей - совсем иное дело.

Дэвид Любке (David Luebke), инженер nVidia, сделал последующий комментарий, прекрасно отражающий реальность: "Растеризация выполняется быстро, но нужно тщательно продумывать то, как выполнять сложные визуальные эффекты. Метод трассировки лучей поддерживает сложные визуальные эффекты, но надобно скрупулезно продумывать то, как сделать его быстрым".

Трассировка лучей

Код минимального способа трассировки лучей, написанный Полем Хекбертом (Paul Heckbert), чтобы уместить его на "визитке".

Всё, что вам надо - прочесть несколько статей про оптимизации, которые необходимо вписать в алгоритм трассировки лучей, чтобы оценить слова Любке. В частности, самые мощные алгоритмы трассировки лучей не обрабатывают лучи независимо, они используют так называемые наборы лучей, что позволяет оптимизировать производительность с лучами, которые имеют одинаковое происхождение и одинаковое назначение. Подобная оптимизация пригоже годится для функциональных блоков "одна памятка много данных" (SIMD) внутри CPU и GPU, а также весьма эффективна для основных лучей с некоторой степенью когерентности (сонаправленности) или для теневых лучей. Но, с прочий стороны, оптимизация уже не годится для лучей преломления или отражения.

Больше того, как указывает Даниэль Похл в своей статье по поводу Quake Wars RT, употребление наборов лучей может стать проблематичным с прозрачными текстурами (знаменитые альфа-текстуры, используемые для деревьев), оттого что если все лучи в наборе не будут новости себя одинаково (некоторые затрагивают поверхность, другие проходят сквозь неё), то возникающие дополнительные издержки могут стать намного более, чем преимущества от оптимизаций, которые даёт применение наборов лучей.

Трассировка лучей

Визуализация "стоимости" рендеринга каждого пикселя, где красные пиксели являются самыми "дорогими". Как разрешается видеть, рендеринг деревьев стоит крайне дорого в версии Quake Wars с методом трассировки лучей.

В конце концов, как мы уже упоминали, метод трассировки лучей требует подходящей структуры данных, чтобы оберегать разные элементы сцены, и как раз эта архитектура будет игрывать определяющую роль в итоговой производительности. Но отбор и затем работа с такой структурой данных не такие простые, как кажется на первый точка зрения. Некоторые структуры обладают лучшими характеристиками для статических данных, а другие не возбраняется быстрее обновлять в случае с динамическими данными, или они занимают меньше памяти. Как типично, всё сводится к поиску приемлемого компромисса. Чудес не бывает.

Оттого, как мы видим, приём трассировки лучей не всегда можно назвать идеалом простоты и элегантности, как считают некоторые. Чтобы заработать хорошую производительность от алгоритма трассировки лучей надобно найти ничуть не меньше нетривиальных решений программирования, чем в случае получения сложных визуальных эффектов в методе растеризации.

Ограничения трассировки лучей

Нынче, когда мы рассеяли некоторые мифы, связанные с трассировкой лучей, давайте обратимся на реальные проблемы, которые связаны с этой технологией.

И начнём мы с первейший проблемы, связанной с данным алгоритмом рендеринга: его медлительностью. Естественно, некоторые энтузиасты скажут, что это уже не задача, потому что способ трассировки лучей славно распараллеливается, а количество ядер процессора увеличивается каждый год, поэтому мы должны углядеть линейный рост производительности трассировки лучей. Кроме того, исследования по поводу оптимизаций, которые позволительно применить к трассировке лучей, всё ещё находятся в младенческом состоянии. Ежели посмотреть первые 3D-ускорители и сравнить их с тем, что доступно ныне, то для оптимизма действительно кушать поводы.

Однако такая точка зрения не учитывает существенный момент: самое интересное в методе трассировки лучей содержится во вторичных лучах. На практике расчёт картинки только с первичными лучами не даст особого улучшения качества изображения по сравнению с классическим алгоритмом с Z-буфером. Но задача со вторичными лучами содержится в том, что у них стопроцентно отсутствует когерентность (сонаправленность). При переходе от одного пикселя к другому необходимо рассчитывать абсолютно разные данные, что сводит на нет все обычные техники кэширования, сильно важные для хорошей производительности. Это означает, что расчёт вторичных лучей жутко сильно зависит от подсистемы памяти, в частности, от её задержек. Это наиболее худший сценарий из возможных, потому что из всех характеристик памяти как раз задержки менее всего улучшились за последние годы, и нет никаких поводов размышлять, что ситуация исправится в обозримом будущем. Достаточно легко увеличить пропускную способность памяти, используя немного чипов параллельно, но задержки всё равно останутся прежними.

Ограничения трассировки лучей

У видеокарт задержки памяти (latency) уменьшаются намного медленнее, чем увеличивается пропускная способность (bandwidth). Ежели последняя улучшается в 10 раз, то задержки улучшаются исключительно в два фраза.

Причина популярности GPU кроется в том, что формирование "железа", специализирующегося на растеризации, оказалось очень эффективным решением. При растеризации проход к памяти выполняется когерентно (параллельно), самостоятельно от того, работаем мы с пикселями, текселями или вершинами. Потому небольшие кэши, дополненные серьёзной пропускной способностью памяти, будут идеальным решением для получения великолепной производительности. Вестимо, подъем пропускной способности влетает весьма накладно, но такое решение совершенно подходит при условии окупаемости. Напротив, сегодня нет каких-либо решений для ускорения доступа к памяти при расчёте нескольких лучей. Аккурат по этой причине способ трассировки лучей никогда не будет таким эффективным, как растеризация.

Ещё одна характерная задача способа трассировки лучей касается сглаживания (AA). Лучи проводятся в виде типичный математической абстракции, и реального размера они не учитывают. Проверка на пересечение с треугольником является обычный логической функцией, которая даёт ответ "да" или "нет", но не даёт таких деталей, как "луч на 40% пересекает треугольник". Прямым следствием такого эффекта будет явление "лесенок".

Чтобы постановить эту проблему, было предложено немного технологий, таких как трассировка пучков (beam tracing) и трассировка конусов (cone tracing), которые учитывают толщину лучей, но их сложность не позволяет заработать эффективную реализацию. И единственной технологией, которая мочь вручить хорошие результаты, является расчёт большего числа лучей, чем кушать пикселей, то есть суперсэмплинг (рендеринг при большем разрешении). Вряд ли стоит избыточный раз упоминать, что эта способ намного более накладна по вычислительной мощности, чем мультисэмплинг, использующийся в современных GPU.

Гибридный двигатель рендеринга?

Если вы прочитали всю статью до сего места, то наверняка уже подумываете о том, что метод трассировки лучей покуда что не может заместить растеризацию, но, возможно, стоит смешать две технологии вместе? И на первый точка зрения кажется, что две технологии дополняют друг друга. Легко явить растеризацию треугольников для определения видимой картинки, получая превосходство от великолепной производительности данной технологии, после этого чего будет применяться трассировка лучей исключительно для некоторых поверхностей, добавляя реализм там, где это надобно, например, для добавления теней или получения хороших отражений и прозрачности. Собственно, такой подход Pixar и использовала для мультфильма "Тачки/Cars". Геометрические модели создаются с помощью REYES, а трассировка лучей употребляется "по требованию" там, где надо симулировать определённые эффекты.

Трассировка лучей

Для мультфильма "Тачки/Cars" Pixar использовала гибридный двигатель рендеринга, сочетающий REYES для визуализации и трассировку лучей "по требованию" для отражений и ambient occlusion.

К сожалению, несмотря на то, что таковой способ звучит обещающе, гибридные решения не так без труда претворить в жизнь. Как мы уже видели, одним из важных недостатков приема трассировки лучей является необходимость организации структуры данных таким образом, чтобы ограничить число проверок пересечения лучей и объектов. И применение гибридной модели вместо чистой трассировки лучей это не меняет. Надобно организовывать структуру данных вкупе со всеми недостатками, которые с этим связаны. В частности, предположим, что метод трассировки лучей основан на статических данных, а рендеринг динамических данных производится сквозь растеризацию. Но в данном случае мы теряем все преимущества трассировки лучей. Потому что для способа трассировки лучей динамических данных не существует, то нереально будет заставить объекты отбросить тень или посмотреть отражения.

Больше того, что касается производительности, то самой здоровенный проблемой является доступ к памяти, связанный со вторичными лучами, а эти лучи как раз и необходимы в нашем гибридном движке рендеринга. Так что прирост производительности не будет таким большим, как не возбраняется было бы дожидаться изначально. Потому как большая часть времени рендеринга будет отправляться на вторичные лучи, то выигрыш от отсутствия просчёта основных лучей будет мизерным.

Другими словами, пытаясь скомбинировать преимущества обоих методов, мы неизбежно комбинируем и их недостатки, теряя элегантность алгоритма трассировки лучей и высокую производительность растеризации.

Решение

Как мы уже неоднократно упомянули в нашей статье, предстоит разрешить непочатый край проблем, раньше чем метод трассировки лучей станет достойной альтернативой растеризации в сфере рендеринга в реальном времени. И ежели вдуматься, то станет ли сей метод панацеей от всех бед? Преимущества способа трассировки лучей не такие революционные, чтобы оправдать существенное понижение производительности. Сильные моменты приема связаны с отражениями и прозрачностью, ибо два этих эффекта сложнее всего вывести на существующих алгоритмах растеризации. Но, снова же, такой ли это серьёзный недостаток? Мир около нас не состоит целиком из очень прозрачных или сияющих объектов, потому наше зрение вполне может удовлетвориться грубым приближением.

Ежели посмотреть на последние автосимуляторы, например, Gran Turismo и Forza, то там достаточно недурственно заметно вполне удовлетворительное качество рендеринга, пусть даже отражения на корпусе всецело лживые. И точное отражение зеркала заднего вида на краске вряд ли позволительно считать достаточным, чтобы признать ещё единственный шаг в сторону фотореализма.

Трассировка лучей

На самом деле отражений нет. Например, зеркало бокового вида на корпусе машины не отражается. Но нужен ли вам "честный" рендеринг Audi R8 с помощью алгоритма трассировки лучей?

Большинство энтузиастов считают, что способ трассировки лучей по своей природе даёт лучшее описание, чем растеризация - но они зачастую основывают своё взгляд на картинке, произведённой оффлайновым движком, работающем не в реальном времени. При всем при том результаты таких движков намного лучше, чем способности современных игр. Помимо того, кругом трассировки лучей наблюдается определённая путаница. Энтузиасты часто сравнивают с растеризацией фотореалистичные изображения, которые получены комбинацией нескольких мастер, таких как трассировка лучей для прямых отражений, способ излучательности (radiosity) для диффузного отражения, фотонное описание (photon mapping) для каустики и т.д. Все эти технологии сочетаются, чтобы снабдить максимально фотореалистичное свойство.

Трассировка лучей

Чтобы получить фотореалистичный рендеринг, нужно сочетать несколько технологий. Трассировка лучей сама по себе недостаточна для симуляции сложных взаимодействий промеж материалами разных типов и света.

В своей базовой версии способ трассировки лучей, ежели рассматривать существующие попытки реализации в реальном времени, годится исключительно для идеальных отражений и жёстких (резких) теней. Игра Doom 3 несколько лет назад доказала, что позволительно создать надёжный 3D-движок, который идеально бы справлялся с динамическими тенями и сквозь растеризацию, но если кинуть взор в прошлое, то игра показала и то, что жёсткие тени не являются реалистичными.

Трассировка лучей

Чтобы творить мягкие тени или диффузные отражения (такие, какие вы видите на текстурированном металле, к примеру), требуются больше развитые техники трассировки лучей, такие как трассировка путей (path tracing) и или распределённая трассировка лучей (distributed ray tracing). Но подобные техники требуют немаловажно большего количества лучей, так что они покуда ещё слабо подходят для реального времени.

Некоторые пользователи считают, что раньше времени или поздненько будет доступна столь большая вычислительная мощность, что превосходство растеризации по производительности перестанет пребывать решающим фактором. По закону убывающей отдачи о приросте производительности при растеризации одним духом забудут, получив элегантность трассировки лучей. Около так же, как и раньше было забыто преимущество кодирования на ассемблере по производительности, которое оказалось недостаточным, чтобы перевесить преимущества языков высокого уровня.

Заключение

Хотя вообще-то, нас это вряд ли убедит. В любом случае, мы ещё покуда далеки до того времени, когда мы сможем пожертвовать производительностью из-за элегантности и простоты. Попросту посмотрите, что произошло за последние 10 лет в мире оффлайнового рендеринга. Ежели рендеринг одного кадра мультфильма "История игрушек/Toy Story" выполнялся, в среднем, за два часа, то кадр из мультфильма "Рататуй/Ratatouille" - уже за шесть с половиной часов, несмотря на вычислительную мощность, которая увеличилась в промежутке промеж двумя картинами больше чем в 400 раз. Другими словами, чем более вычислительной мощности и ресурсов вы предоставляете компьютерным художникам, тем быстрее они их поглощают.

Ежели более того группа, подобная Pixar, которая мочь дозволить себе выделить несколько часов вычислений для создания одного кадра, решила применять трассировку лучей исключительно время от времени из-за негативного влияния на производительность, это стало быть, что времена, когда мы получим достаточную вычислительную мощность в 3D-играх реального времени для выполнения всего рендеринга методом трассировки лучей, жутко и сильно далеки. Да и в будущем у энтузиастов точно будет, куда потратить такую вычислительную мощность.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Процессоры Core i5 и i7 в конструктиве LGA1156

Итак, свершилось — официальный выход в свет платформы LGA1156, наконец-то, состоялся! Не будет преувеличением назвать этот анонс самым долгожданным событием второй половины года: слишком уж давно все ждали новых процессоров. Просто потому, что до этого ситуация складывалась по классическим канонам: верхи не могут, а низы не хотят. Верхи (компания Intel) все никак не могли начать продажу «настоящих настольных» процессоров с архитектурой Nehalem, низы (пользователи) не хотели много чего — связываться с «устаревшей» архитектурой Core 2, платить слишком много за LGA1366 (благо своей ценой последняя платформа в наибольшей степени обязана особенностям, обычному домашнему пользователю не нужным), переходить на решения конкурента, наконец. Теперь же желания и возможности, наконец-то, слились воедино. Впрочем, пока Intel не может предложить ничего нового экономным пользователям – самый дешевый из появившихся процессоров (Core i5 750) имеет отпускную цену в 194 доллара, так что реальная розничная некоторое время будет превышать 200 долларов (предварительные заказы на этот процессор собирались из расчета 205-207 долларов за штуку), что выше своеобразного психологического барьера. Таким образом, наиболее экономичным пока придется довольствоваться разработками предыдущего поколения. Что особых проблем не вызывает — эта категория покупателей не склонна ориентироваться на новизну, исходя при выборе из чисто практических соображений. А вот тем, кто готов отдать за процессор хотя бы сотни две-три вечнозеленых, теперь придется подходить к выбору очень вдумчиво. Старший Core i5 превышает барьер лишь незначительно, старший же Core i7 870 по отпускной цене в точности равен другому топовому процессору, а именно Core i7 950, ну а модель с индексом 860 продается по той же цене, что и Core i7 920, пока еще сохраненный в ассортименте Intel. В рознице же с последней парой некоторое время продолжат конкурировать и «старые» квады Q9550 и Q9650, что еще сильнее затрудняет выбор. Добавьте к этому пару решений конкурента (Phenom II X4 955 и 965), после чего вряд ли кто-то будет спорить с тем, что конкурентная борьба в диапазоне 200-350 долларов становится очень напряженной и неоднозначной. В общем, основными критериями выбора становятся цена платформы (что несложно посчитать) и производительность (которую мы и будем измерять).

Немного об архитектуре и системе наименований

Сильно вдаваться в теорию сегодня смысла не имеет — архитектурно новые устройства это все тот же Nehalem. От своих предшественников и процессоров Xeon под LGA1366 принципиальное отличие только одно — поддержка ИКП двух, а не трех каналов памяти, что и привело к появлению нового сокета: ножек нужно меньше. Это упрощает (и удешевляет) разводку системной платы, позволяет наращивать память с меньшим шагом — в общем, снижает цену платформы. Тем более что дается оно «малой кровью» — как мы уже выяснили, для обычных настольных задач третий канал памяти просто не нужен. Ну а чтоб не было жалко теоретически уменьшившейся ПСП, компания совершенно официально разрешила использовать совместно с новыми процессорами DDR3 1333, также поддерживаемою Xeon X55x0, но не Core i7 под LGA1366.

Еще одним фактором, благотворно влияющим на итоговую стоимость платформы, является отказ от трехчиповой схемы (процессор-северный мост чипсета-южный мост чипсета) в пользу двухчиповой. Довольно-таки сложный и объемистый контроллер шины QPI в процессорах для LGA1156 заменен контроллерами PCI Express и DMI. Первый поддерживает 16 линий, соответствующих стандарту PCIe 2.0, которые могут использоваться либо для одного полноскоростного слота для видеокарт, либо для двух 8х для создания multi-GPU-конфигураций. Интерфейс DMI (который на деле представляет собой электрически измененную версию PCIe 4x) по-прежнему имеет пропускную способность 2 ГБ/с, не изменяющуюся со времен чипсетов серии i915, где и дебютировал. Так что, формально, для создания законченной системы можно просто «припаять» к соответствующим выходам процессора один из уже существующих южных мостов (а они все от ICH6 до ICH10R рассчитаны именно на DMI), на практике же производитель утверждает, что потребуются «чипсеты пятой серии», типа сегодня же анонсированного iP55.

Что самое интересное, на деле поддержка QPI никуда не исчезла, т.е. нельзя даже сказать, что один сложный контроллер заменили на два простых. Только теперь эта шина наружу не выходит, соединяя в пределах одного кристалла контроллеры PCIe и собственно основные блоки процессора, причем ее пропускная способность составляет все те же 4,8 ГТ/с, что и раньше. Зачем вообще было огород городить? Просто есть разница в сложности реализации высокоскоростной «дальнобойной» и «локальной» шин. Ранее длина линка измерялась сантиметрами, ныне же миллиметрами, что позволяет безболезненно работать с низким уровнем сигналов и т.п. Причем и на модификации ядра несколько сэкономили — все равно какой-нибудь интерфейс для связи между процессором и контроллером PCIe пришлось бы придумывать, так почему бы в качестве его не использовать упрощенный линк QPI?

А что изменилось кроме контроллеров «периферии» и памяти (где просто отрезали один из трех каналов)? В вышедших сегодня процессорах — ничего. Это по-прежнему все те же четырехъядерные процессоры архитектуры Nehalem, снабженные трехуровневой кэш-памятью, где емкость кэша L3 составляет 8 МБ. Все три поддерживают Turbo-Boost, две старших модели — и Hyper-Threading, совсем не отличаясь от ставших уже привычными за без малого год Core i7 под LGA1366. Причем поддержке (или отсутствию поддержки) НТ теперь уделено большое внимание — фактически именно она является тем, что делит три анонсированных процессора на две неравные группы.

До последнего времени по сети ходило много слухов о том, как же будут называться процессоры под LGA1156. Большинство сходилось на том, что название Core i7 сохранят приборы для LGA1366, а рассчитанные на новую платформу получат названия Core i5 и i3 в зависимости от числа ядер: в первое семейство попадут четырехъядерные процессоры, во второе — двухъядерные. По поводу всех этих спекуляций компания Intel долго хранила молчание, однако не так давно заявила, что все будет не настолько просто, как казалось. И, действительно, процессоры семейства 800, равно как уже знакомые нам представители линейки 900 (LGA1366) называются Core i7. Что требуется от процессора, чтобы попасть в этот класс? Умение выполнять восемь потоков вычислений. Замечу, что речь не о ядрах, а именно о потоках — в самых ближайших планах компании настоящих восьмиядерных процессоров нет (пока доподлинно известно только о шестиядерных). А восемь потоков нам обеспечивает как раз четыре ядра и поддержка Hyper-Threading.

Что такое процессор Core i5? Очевидно, устройство, способное выполнять четыре потока команд. Вот тут уже возможны варианты: это либо четырехъядерный процессор без поддержки Hyper-Threading, как уже выпущенный Core i5 750, либо двухъядерный с оной. А Core i3 сможет выполнять... нет, не два потока, а те же четыре. Вот только эти процессоры будут всегда работать на стартовой частоте, умея лишь снижать ее при необходимости, т.е. в них не будет поддержки Turbo-Boost. Если же «обрезать» все нововведения Nehalem (т.е. и ТВ, и НТ) и сократить число ядер до двух, получится... очередной Pentium. Нет, серьезно — компания решила в очередной раз продлить жизнь одному из своих любимых брендов.

Просто? Логично? Как нам кажется, не очень-то. Разве что Pentium смотрится хорошо — под этой маркой давно уже продаются двухъядерные процессоры начального уровня, которые «уже не Celeron, но еще не процессор». И с Core i7 все достаточно неплохо — процессоры верхнего уровня. А вот в стане Core i5 полный разброд и шатание. Просто потому, что в него попадают и 45 нм четырехъядерные процессоры с 256К кэша L2 на ядро и 8M общего L3, и двухъядерные 32 нм с 1М L2 на ядро (по сети бродят и упоминание про 2М на ядро, что вызывает недоумение с учетом полностью инклюзивной архитектуры кэш-памяти в Nehalem) и 4М L3. А с последними еще и практически совпадают по характеристикам Core i3. Нет, конечно, всех их разнесут по номерам и т.п., но старую систему наименования становится немного жаль — там хоть сразу очевидно было сколько у процессора ядер.

Впрочем, со всеми этими проблемами нам еще предстоит возиться в следующем году. Пока же единственная проблема, которая может ожидать неподготовленного пользователя — покупка платы с LGA1156 для Core i7 900 (или, соответственно, наоборот). А так все три выпущенных процессора это вполне полноценные четырехъядерники одинаковой архитектуры. Разве что у Core i5 нет поддержки НТ, ну так он и по всем остальным параметрам пока самый младший настольный Nehalem, так что с ним разобраться несложно. Turbo-Boost в Core i7 860 работает по схеме +5-4-1-1 (а не +2-1-1-1 как у Core i7 900, но и не как чудотворящие +3-3-2-2 у Xeon X5500), старшая модель может похвастаться доселе невиданной схемой +5-4-2-2, да и Core i5 750 почти не «обделили», дав ему схему +4-4-1-1, и память DDR3 1333 поддерживается официально — словом, крайне интересно посмотреть, во что эти различия выльются в плане производительности. Кроме того, компания Intel втихую применила к новым процессорам еще один твик — частота блока UnCore составляет по-умолчанию 2,4 ГГц. Этакое промежуточное значение, сравнительно с принятыми для 900-й серии 2,13 ГГц и 2,66 ГГц в Xeon X5500. Очевидно, что его увеличение скажется на производительности, особенно в тех задачах, которые восприимчивы к скорости работы памяти — ведь это означает, что и кэш третьего уровня, и контроллер памяти теперь будут работать немного быстрее, чем в одноименном семействе для другой платформы (в частности, возможно, получится на деле увидеть выигрыш от DDR3 1333, почти как в Xeon, а не отсутствие изменений, как было у нас при тестировании экстремальных процессоров 900-го семейства). Однако касается это только новых Core i7 — Core i5 750 (дабы не слишком пытался приблизиться к старшим моделям при работе с четырьмя или менее вычислительными потоками) имеет ту же частоту UnCore в 2,13 ГГц, что и «старые» Core i7. К тому же, у последних множитель для UnCore на многих платах можно менять, а вот в случае LGA1156 такой свободы не осталось (по крайней мере, пока ее обнаружить не удалось). В общем, технических параметров у современных процессоров становится все больше и больше, что обеспечивает производителям немалую свободу маневра — куда большую, чем во времена оны, когда единственным способом расширения ассортимента являлся выпуск процессоров с разной тактовой частотй.

Но интересно не только сравнение «новых» и «старых» Core i7, а также скоростные характеристики пока (и на долгое время еще) старшего Core i5 — еще и на прочих конкурентов посмотреть стоит. Чем мы сейчас и займемся.

Конфигурация тестовых стендов

Процессор Core i5 750 Core i7 860 Core i7 870
Название ядра Lynnfield Lynnfield Lynnfield
Технология пр-ва 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц 2,66/3,2 2,8/3,47 2,93/3,6
Кол-во ядер/потоков вычисления 4/4 4/8 4/8
Кэш L1, I/D, КБ 32/32 32/32 32/32
Кэш L2, КБ 4 x 256 4 x 256 4 x 256
Кэш L3, КБ 8192 8192 8192
Оперативная память 2 x DDR3-1333 2 x DDR3-1333 2 x DDR3-1333
Коэффициент умножения 20 21 22
QPI 4,8 ГТ/с 4,8 ГТ/с 4,8 ГТ/с
Сокет LGA1156 LGA1156 LGA1156
TDP 95 Вт 95 Вт 95 Вт
Цена $251( 29) $350( 30) $657( 34)

Итак, как мы видим, тактовые частоты (и стартовая, и буст-режима) у трех уже выпущенных процессоров отличаются ровно на один шаг, как в линейке Xeon, но не у Core i7 900-й серии, где ассортимент более «рыхлый» (кстати, и система нумерации в зависимости от тактовой частоты один-в-один с «зионовской»). Также у младшего процессора нет поддержки НТ и ниже частота UnCore, о чем мы выше уже сказали. Других различий нет.

Процессор Core i7 920 Core i7 950 Core i7 Extreme 975 Xeon X5560 Core 2 Quad Q9650 Phenom II X4 965
Название ядра Bloomfield Bloomfield Bloomfield Bloomfield Yorkfield Deneb
Технология пр-ва 45 нм 45 нм 45 нм 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц 2,66/2,93 3,06/3,33 3,33/3,6 2,8/3,2 3,0 3,4
Кол-во ядер/потоков вычисления 4/8 4/8 4/8 4/8 4/4 4/4
Кэш L1, I/D, КБ 32/32 32/32 32/32 32/32 32/32 64/64
Кэш L2, КБ 4 x 256 4 x 256 4 x 256 4 x 256 2 x 6144 4 x 512
Кэш L3, КБ 8192 8192 8192 8192 6144
Оперативная память 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1333 2 x DDR3-1333
Коэффициент умножения 20 23 25 21 9 17
QPI 4,8 ГТ/с 4,8 ГТ/с 6,4 ГТ/с 6,4 ГТ/с
Сокет LGA1366 LGA1366 LGA1366 LGA1366 LGA775 AM2+/AM3
TDP 130 Вт 130 Вт 130 Вт 95 Вт 95 Вт 140 Вт
Цена $309( 95) $656( 68) $1295( 45) $1964( 15) $379( 92) $336( 26)

Поскольку это старт новой платформы, конкурентов будет больше, чем испытуемых. Впрочем, использование для всех тестирований единой методики позволяет это делать без каких-либо временных трудностей — всю эту пачку процессоров мы уже оттестировали заранее :) Итак, с чем же мы будем сравнивать новичков? Во-первых, это все семейство Core i7 под LGA1366: 920, 950 и 975ЕЕ. Во-вторых, два гостя из других команд — «устаревший», но все еще активно продающийся Core 2 Quad Q9650 и новый, но хорошо знакомый Phenom II X4 965. C менее высокочастотными представителями этих линеек результаты при желании можно сравнить самостоятельно — все они в сводной таблице есть. В-третьих же мы решили немного увеличить интригу и вынесли на диаграммы результаты Xeon X5560: он имеет ту же стартовую тактовую частоту ядер, чуть большую частоту UnCore, аналогичное значение TDP, но немного другой буст (менее агрессивный в многопоточных приложениях, но более при нагрузке всего на одно или два ядра), чем Core i7 860. Понятно, что прямыми конкурентами эти процессоры не являются, но «в порядке повышения общей образованности» сравнение будет интересным.

  Системная плата Оперативная память
LGA1156 Gigabyte P55-UD6 (P55) Kingston KVR1333D3N9K3/6G (2 x 1333; 9-9-9-24)
LGA1366 (Core i7 920, 950) Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (3 x 1066; 8-8-8-19)
LGA1366 (Core i7 975, Xeon X5560) Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (3 x 1333; 9-9-9-24)
AM3 ASUS M4A78T-E (790GX) Corsair CM3X2G1600C9DHX (2 x 1333; 7-7-7-20-1T, Unganged Mode)
LGA775 ASUS P5Q3 (P45) Kingston KVR1333D3N9K3/6G (2 x 1333; 9-9-9-24-2T)

Все тесты проводились с памятью типа DDR3, причем процессоров Intel — с одними и теми же модулями. Только их общее количество менялось: все три из комплекта для LGA1366 и два для LGA775 и LGA1156. Можно было бы использовать конфигурацию 2х2 и для 1366, что, как мы уже выяснили, результаты тестов несколько меняет, однако такое «приведение к общему знаменателю» является несколько искусственным. В любом случае, результаты Core i7 920 с двумя модулями памяти в общей таблице есть, так что кому интересна конкретная раскладка по приложениями, могут сравнить процессоры и в таких условиях. А в ближайшее время мы постараемся «расставить все точки над ё» и в отношении конфигураций памяти для LGA1156.

Тестирование

Методика тестирования производительности (список используемого ПО и условия тестирования) подробно описана в статье. Для удобства восприятия, результаты на диаграммах представлены в процентах (за 100% принят результат Intel Core 2 Quad Q9300 в каждом из тестов). Подробные результаты в абсолютных величинах доступны в виде таблицы в формате Microsoft Excel.

3D-визуализация

Тесты этой группы не могут похвастаться хорошим параллелизмом, вполне обходясь парой ядер, так что максимальное значение имеет тактовая частота каждого ядра, скорость работы процессора с памятью и прочие архитектурные особенности, а вот Hyper-Threading чаще всего вообще вредит. Видно, что все три наших сегодняшних героя, хоть и не могут похвастаться рекордными достижениями, однако выглядят вполне достойно. Во всяком случае, это верно для Core i5 750 и Core i7 860, которые, благодаря агрессивному турбо-бусту и быстрому обмену данными с памятью «своих» непосредственных конкурентов побеждают. Примечательно, что 750 отсутствие НТ сослужило в этих тестах хорошую службу он почти догнал 860 (с большей стартовой тактовой частотой) и как бог черепаху изуродовал равночастнтный 920. Чуть сложнее положение Core i7 870 — он медленнее, нежели стоящий одинаково с ним Core i7 950. Впрочем, на стороне первого процессора все равно остается такое важное преимущество, как общая цена платформы. Опять же — у 950 и тактовая частота выше номинально, а 870 отстает от него лишь незначительно — благодаря агрессивному ТВ. Ну а процессоры предыдущего поколения, равно как и предложение от AMD здесь в проигрыше даже сравнительно с самой дешевой моделью.

Рендеринг трёхмерных сцен

До сих пор бушуют споры — полезен ли Hyper-Threading или наоборот. Как мы видим, в серьезных вычислительных задачах, типа рендеринга, способность процессора выполнять большее количество потоков команд сложно переоценить — прирост очень велик. И принципиально разное позиционирование Core i5 и i7 более чем оправдано: по частоте 750 и 860 отличаются лишь на 5%, а вот по производительности — на все 20%. Свою задачу, однако, 750 вполне выполняет, демонстрируя одинаковую производительность с лучшим (из неэкстремальных) представителем Core 2 Quad, который стоит дороже во всех смыслах: и продается по более высокой цене, и себестоимость его куда выше. Таким образом, теперь процессоры линейки Q9x50 можно снимать с производства безболезненно. А чтобы сильно не «обижать» уже сделавших вложения в LGA775 вполне достаточным будет освоить выпуск сравнимых по частотам моделей в семействе Q9x00, имеющих меньший объем кэш-памяти и, соответственно, много более дешевых. И такие шаги уже делаются — Q9505, по частоте идентичный Q9550, но снабженный 3М кэш-памяти на ядро, в ассортименте Intel уже « засветился». Очередь за недорогой (цена должна быть хотя бы сравнима с Core i5 750) заменой Q9650. Впрочем, не так уж последняя и нужна — все-таки сильно продлять жизнь LGA775 совсем не в интересах Intel.

Ну а «этажом выше» все тоже как ожидалось: 860 быстрее, нежели Core i7 920 (что при равных ценах процессоров делает последний практически ненужным) и Phenom II X4 965 (что, опять же, при сравнимых ценах процессоров и меньшем энергопотреблении новинки от Intel, очень неприятно для AMD), 870 же несколько отстает от 950, требуя, зато, меньших вложений в платформу в целом.

Научные и инженерные расчёты

Некоторым приложениям данной группы НТ даже вредит (поэтому Core i7 920 опять сумел  «продуть» равночастотному Core i5 750), хотя в целом картина существенно не изменилась: Core i5 750 просто прекрасный процессор для своей ценовой группы (способный побороться и с более дорогими устройствами), 860 и 870 «пристраиваются» снизу к 950, оставляя актуальным представителям семейства процессоров под LGA1366 возможность сохранить конкурентоспособность, но «вышибая» с рынка 920.

Растровая графика

Благодаря Adobe Photoshop и Paint.Net, к сравнительному позиционированию i5 и i7 снова нет вопросов. А если мысленно оставить на диаграмме только «десктопных» Nehalem разных модификаций, получается вообще очень стройная и красивая картинка, которую портит только Core i7 920. И что с ним сделать, чтоб не нарушал эстетическую красоту мироздания по версии Intel — очевидно ;)

Сжатие данных

Больше двух вычислительных ядер используемым нами версиям архиваторов не нужно, а вот к различным характеристикам подсистемы памяти они очень восприимчивы, причем ко всем — включая и производительность кэша L3 (что, в частности, позволяет Xeon X5560 почти догнать Core i7 950). Core i5 750 чудес не показывает, однако этого от него и не требуется — достаточно того, что этот достаточно недорогой процессор держится на уровне некоторых более дорогих. Остальная пара тоже на своих местах — 860 в очередной раз с разгромным счетом «отпинал» 920, 870 же вежливо пропустил вперед 950, дабы оправдать более высокий статус последнего.

Компиляция (VC++)

Очередной триумф процессоров с Hyper-Threading и, пожалуй, лучший результат Core i7 870 во всем тестировании (точнее, один из двух таковых). Опять же — сложно предъявлять претензии к Core i5 750: пусть он в данном случае самый медленный, зато и самый дешевый, что более чем оправдывает смешную разницу в производительности с, например, старшим Core 2 Quad. К слову — «нестарший» Q9550 в этом тесте медленнее, чем 750, но даже он все еще дороже последнего.

Java

Сходная картина и в тесте Ява-машины, только тут уже Core i5 750 даже не самый медленный.

Кодирование аудио

А при кодировании аудио — самый. Однако с учетом абсолютных значений скоростей, достигаемых современными процессорами высокого класса, на это вообще уже можно не обращать особого внимания: просто констатация факта. Обратите также внимание на то, как в этом тесте красиво выстроился ряд 860-870-950-975 и как некрасиво из него выбивается 920 :)

Кодирование видео

Логика работы современных и даже не очень современных видеокодеков на архитектуру Nehalem «ложится» просто идеально. Впрочем, полезность НТ и тут оспорить крайне сложно, однако, как мы видим, и без этой технологии шансов на «борьбу на равных» у конкурентов в принципе не наблюдается. И даже наличие форы в виде существенно более высокой тактовой частоты положения не спасает.

Из других интересных результатов — 870 во второй раз почти догнал 950. Но «почти» — не считается. В общем и целом уже можно сделать вывод, что из этой пары 950 предпочтительнее если рассматривать только производительность или цену процессора. И единственное, что ему мешает — более высокая цена платформы.

Игровое 3D

Глядя на результаты, так и хочется присвоить Core i5 750 статус лучшего игрового процессора. Нет, он не самый быстрый, но более быстрые намного дороже. Настолько, что разница в цене вообще способна окупить и переход на multi-GPU, что понятно каким образом скажется на итоговых результатах. Впрочем, мы не удивимся, если для игровых компьютеров будущие представители линейки Core i5 (всего с двумя ядрами, но с поддержкой НТ, зато работающие на более высоких частотах) подойдут еще лучше, однако до их выхода еще дожить надо. А Core i5 750 — вот он, пожалуйста :)

Итого

Итак, выход новой платформы состоялся. Успешно? Да — более чем. Если б не Core i7 под LGA1366, которые несколько смазывают триумф новичков, ситуацию вообще можно было бы сравнить с переходом с NetBurst на Core 2: когда новые процессоры среднего класса оказываются производительнее топовых решений как из «старой» линейки самой компании, так и от конкурента. Но вот то, что с архитектурой Nehalem мы уже успели близко познакомиться, превращает ситуацию из революции в нормальную эволюцию. Просто ранее новая микроархитектра была доступна лишь тем, кто готов был за комплект из материнской платы и процессора отдать не менее 500 долларов, а остальным на нее можно было только облизываться, теперь же ее сделали куда более доступной для покупателей, снизив цену «входного билета» в этот клуб сразу долларов на 150-200. Причем очевидно, что возможности для снижения цен для плат на Р55 даже больше, чем для Р45, да и появления со временем более дешевых чипсетов «пятой серии» тоже можно ожидать — как только появятся и более дешевые процессоры.

Не самые легкие времена настают для AMD — Phenom II наконец-то получили достойного конкурента «в чистом виде», каковыми не являлись обе платформы Intel, существующие до данного момента. Фактически до существенного усовершенствования архитектуры компании остается лишь играть с ценами, да уповать на не связанные с самими процессорами преимущества своей платформы (все-таки, как ни крути, а полноценных альтернатив чипсетам типа AMD 785G или 790GX у Intel пока в принципе нет, а окажется ли конкурентоспособным на этом уровне встроенное видеоядро двухъядерных процессоров под LGA1156 покажет время). И то — эти способы помогут лишь в борьбе с Core i5, а для полноценной конкуренции с младшими Core i7 компании, наверняка, придется воспользоваться еще одним из своих методов последних лет: давать пользователю больше ядер, чем Intel. Только теперь это будет сложнее делать — если трехъядерные процессоры как альтернатива двухъядерным были хороши, то наличие в новой микроархитектуре Intel такого дешевого «улучшайзера», как виртуальная многопроцессорность сделает борьбу настольных шестиядерников с оснащенными НТ квадами весьма непредсказуемой. Кстати, и Phenom II X3 всего через несколько месяцев придется конкурировать уже не с Core 2 Duo, а с Core i3/i5 при двух физических ядрах выполняющих по четыре потока вычислений и «распродажными» Core 2 Quad. Ответ компании на этот вызов (очень дешевые за счет отказа от кэша третьего уровня Athlon II X3 и X4) уже готов, но насколько он окажется адекватным судить пока трудно.  В общем, до перехода на 32 нм (после чего и частоты можно будет нарастить, и шестиядерные процессоры перестанут иметь слишком уж высокую себестоимость) и выхода Bulldozer (где, кстати, по имеющимся слухам тоже появится поддержка дополнительных потоков вычисления — для AMD это впервые) никакого серьезного оружия в арсенале компании не появится. Ну а поскольку все эти события ближе к 2011 году произойдут, 2010 пройдет под «знаком Intel» и будет похож на, например, год 2007 (остается только надеяться, что 2011 для AMD не повторит 2008).

Но вернемся к Intel. Как мы видим, без учета Core i7 920 линейка по итоговой производительности выстраивается гладкая и непротиворечивая, 920 же в ряду 750-860-870-950-975 очевидный «шестой лишний». Случайность? Да нет — все было предопределено. Очевидно, уже в мае сего года компания окончательно пришла к выводу, какими будут новые процессоры под LGA1156. И именно в мае произошло обновление «настольных» моделей под LGA1366. Если бы в Intel хотели смерти последней, причем быстрой и безболезненной, это обновление... просто не надо было производить :) 920, как мы видим, существенно хуже, чем 860, а 870 практически аналогичен 940 (в чем можно убедиться изучив таблицу с подробными результатами). При одинаковых ценах в каждой паре «неэкстремальные» модели под LGA1366 мгновенно теряют всякий смысл и их можно более не учитывать. А вот если бы в Intel хотели для 1366 жизни долгой и счастливой, надо было бы не только 940 на 950 поменять, но и 930 вместо 920 выпустить — тогда бы и младший процессор для данной платформы имел паритет по производительности, и старший хорошо бы смотрелся :) Впрочем, очевидно, что такое развитие событий компаний точно было бы не слишком интересно — зачем портить продажи новых Core i7? Но и полностью расставаться с LGA1366 на десктопе она нужным не считает. Вот и принято такое половинчатое решение — 920 нам более не нужен, так что его «убиваем» косвенным путем, но хотя бы одна не экстремальная модель нужна, так что делаем ее конкурентоспособной.

Итак, с позиционированием 950 разобрались: он и должен быть чуть быстрее, чем аналогичный по цене процессор для LGA1156, что компенсируется в определенной степени ценой платформы. А почему тогда блуждают слухи о замене 950 на 960? Тут уже придется заняться сравнительным позиционированием 860 и 870. Как видим, по производительности эти процессоры отличаются совершенно незначительно, да и сложно было бы ожидать обратного — у 870 всего лишь частота на 133 МГц больше (иногда, конечно, разница достигает и 266 МГц, но не обязательно это будет часто наблюдаться). Однако вот отпускные цены различаются почти вдвое: 284 и 562 доллара. Не слишком ли это дорого? Да, слишком. И на LGA1366 за ту же разницу в цене компания всегда давала больше — до мая сего года 266 МГц, а после вообще 400 МГц. Почему так? Вот тут мы уже вступаем в область предположений, но... Наиболее логичным объяснением можно считать такое: цена старшей модели под LGA1156 равна 562 доллара, но не обязательно этой самой старшей моделью долго будет являться Core i7 870. Точнее, сейчас будет, что компании на руку — не портит продажи i7 950 и смещает спрос в сторону i7 860, который на первых порах выпуска новых процессоров получается лучше: частота меньше, буст режим мягче, в процессе наладки производства годных кристаллов больше. А в дальнейшем вполне разумным будет выпустить модель с индексом 880, которая и займет планку в 562 доллара, «опустив» 870 до, допустим, 360 долларов. Правда Core i7 880 уже догонит Core i7 950, но не беда — меняем последний на i7 960 и, опять же, все довольны. В общем, данный вариант развития событий вполне возможен. Особенно, если AMD удастся до конца года выпустить Phenom II X4 975, слухи о чем ходят и очень упорные :)

В общем и целом проблем с мирным сосуществованием в настольных компьютерах сразу двух сокетов (LGA1366 и LGA1156) при разумном их позиционировании нет. Тем более, что практика AMD уже показала, что это возможно — на примере Socket 754 и 940: один массовый, второй для экстремалов (и совместимый с серверными процессорами). Несколько хуже все в противостоянии LGA1156 и LGA775 — опять же, на примере AMD (во времена 754 и 939) ясно, что ничего хорошего из такого бардака не выйдет. У Intel свой опыт тоже был — Socket 478 и 370. Тогда пришлось достаточно агрессивно бороться с «устаревшим» решением, чтобы не мешало новому, причем результат компании настолько не понравился, что больше существования подобного «зверинца» она не допускала. Очень может быть, поздний переход Intel к интегрированному контроллеру памяти как раз и был продиктован желанием использовать для всех настольных процессоров одно и то же исполнение. Теперь же, к сожалению, избежать его не удалось, так что покупатели вынуждены блуждать в трех сокетах, причем самые массовые (ценой до 200 долларов) и высокопроизводительные процессоры друг с другом просто несовместимы никак. Так что компании следует как можно быстрее осваивать техпроцесс в 32 нм для начала выпуска двухъядерных Core i5/i3, увеличивать количество предложений 45 нм четырехъядерных процессоров (в линейке Core i5 700 и Core i7) и постепенно переводить остатки LGA775  в самый бюджетный сегмент. Но это все дело будущего. В настоящем же мы имеем готовую и работающую платформу LGA1156 и уже три процессора для нее. Старший, как показало тестирование, при сегодняшнем уровне цен имеет ограниченную привлекательность, а вот средний и, в особенности, младший как раз те самые «народные нехалемы» (пусть и пока только для относительно обеспеченных слоев народа), которых многие уже успели заждаться.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Система жидкостного охлаждения Corsair Hydro H50

Формально этот продукт представляет собой все тот же платформер Asetek LCLC — до гениальности простой, но вместе с тем очень эффективный и эргономичный «агрегат» . Однако есть здесь и два существенных отличия. Первое: Hydro H50 построен на базе самой свежей и самой совершенной версии LCLC, снабженной переработанным теплосъемным блоком и улучшенным радиатором (причем, согласно техническим выкладкам спецов Asetek, конструктивные нововведения, реализованные в платформере, позволяют не только догнать и перегнать топовые теплотрубные кулеры, но также достойно побороться и с «водянками» высшего класса).

Второе, более весомое отличие, заключается в рыночном позиционировании Hydro H50. Как мы помним, предшествующие модификации LCLC были адресованы в основном OEM-производителям ПК, и даже если что-то перепадало конечным потребителям (комплекты NorthQ), то о реальном присутствии этих систем в рознице можно было не заикаться. Теперь акценты расставлены совершенно иначе: во главе угла восседает «Его Величество Потребитель» — компьютерный энтузиаст, и все вращается именно вокруг него. А уж закрутиться по-хорошему Corsair умеет — тут вам и передовое техническое качество вкупе с продуманной комплектацией, и широкая доступность Hydro H50 в дистрибуторской сети, и взвешенное ценообразование, и адекватная маркетинговая поддержка. В общем, как раз все то, что приличествует серьезному хай-эндовому продукту.

Итак, без долгих вступительных речей обратимся сразу к нашему тестовому объекту! Для начала ознакомимся с его конструктивными и эксплуатационными особенностями, ну и далее уже перейдем к главному пункту сегодняшнего исследования — чисто практической результативности Corsair Hydro H50. Приступим!

Конструктивно-технические особенности

Комплектация. Продукт поставляется в аккуратной упаковке с внутренним пластиковым блистером. Упаковка имеет все необходимые ориентиры, характеризующие внутреннее содержимое — красочный иллюстративный материал и подробный список технико-эксплуатационных параметров.

Поставка включает собственно сам платформер Asetek LCLC, фирменный вентилятор, набор мультплатформенного крепежа (поддерживаются платформы Intel LGA775 и LGA1366, AMD Socket AM2/AM3), набор метизов и краткое техническое руководство (присутствует русскоязычная инструкция).

Общетехническая характеристика. Система представлена неразборной композицией теплосъемного блока, гибких соединительных трубок и радиатора, который в процессе инсталляции дополняется комплектным вентилятором типоразмера 120х120х25 мм (допускается установка еще одного опционального вентилятора). Габариты радиатора 152х120х27 мм. Габариты теплосъемного блока 70х70х55 мм. Длина гибких трубок 30 см. Вес 695 г (без учета крепежа).


Конструктивные особенности (радиатор). «Рабочее тело» системы базируется на типичном «индустриальном» форм-факторе — радиатор составлен из стальных конструкционных элементов (предусмотрены 2 посадочных места для фиксации вентиляторов), пакета алюминиевых плоских трубок (11 шт) и медного оребрения (гофролента, 12 секций, общая площадь поверхности теплообмена порядка 3000 см2).

Значимыми плюсами комплектного радиатора являются:

  • развитая поверхность теплообмена
  • малая проходная дистанция в «ленточных» секциях (толщина оребрения составляет всего 15 мм, что улучшает продуваемость радиатора в связке с тихоходными и малошумными вентиляторами)
  • аккуратное сопряжение трубок и гофроленты (пайка)
  • высококачественное порошковое покрытие (увеличивает эффективную площадь поверхности теплообмена)

Сколько-нибудь серьезных недостатков в его конструктиве не обнаруживается даже при самом строгом рассмотрении предмета.
Экспертно-техническая оценка радиатора: отлично.

Конструктивные особенности (теплообменник и помпа). В рассматриваемой системе теплообменник интегрирован в «монолитный» рабочий блок, который образован связкой помпы и медной теплосъемной пластины (характерные размеры 53х46х12 мм).

К сильным сторонам такого технического решения можно отнести:

  • повышенную гидравлическую эффективность (близкое размещение помпы и теплосъемной пластины сокращает потери давления фактически до нуля)
  • оптимизацию внутренней конфигурации теплосъемника (развитое пластинчатое оребрение)
  • высокую надежность и долговременное функционирование (загерметизированный рабочий блок не требует обслуживания, утечки теплоносителя полностью исключены)
  • добротное техническое качество помпы (керамический подшипник, малопотребляющая «гибридная» электроника)
  • заниженные минимальные обороты рабочего колеса помпы (около 600 об/мин на напряжении 5 В), что дает возможность построить фактически бесшумную систему охлаждения

Слабой стороной «монолитного» рабочего блока является ограниченная мощность встроенной помпы (сравнительно малые штатные обороты — 1300 об/мин, дефицит напора). Однако в рамках платформера LCLC, который характеризуется невысоким импедансом, на этот аспект можно смело закрыть глаза.
Экспертно-техническая оценка теплообменника и помпы: отлично.

Конструктивные особенности (вентилятор). Система оснащена фирменным вентилятором (модель Y.S.Tech KM121225LB, номинальная скорость вращения крыльчатки 1700 об/мин).

В качестве достоинств штатной «вертушки» следует выделить:

  • сбалансированную аэродинамику (с привлекательным сочетанием производительности и шумовых характеристик)
  • добротную электромеханику (двойной подшипник качения и аккуратная управляющая схема, приправленная «стабилизирующими» конденсаторами)
  • ШИМ-контроль с широким диапазоном регулировки (300-1700 об/мин)


Слабой стороной комплектного вентилятора выступает дефицит давления в низкоскоростных функциональных режимах. Но при взаимодействии с оптимизированным радиатором платформера, Y.S.Tech KM121225LB способен сформировать гармоничный и производительный дуэт. Так что, в рамках рассматриваемой системы на этот аспект можно смело закрыть глаза.
Экспертно-техническая оценка вентилятора: отлично.

Эксплуатационная эргономика. В части инсталляционных процедур продукт практически не отличается от типовых теплотрубных кулеров. Так, установка теплосъемного блока осуществляется с помощью крепежного набора (монтажные кольца с подпружиненными винтами и соответствующие пластины-супинаторы), который предусматривает далеко не самые сложные манипуляции, интуитивно понятные и удобоваримые даже для неопытных пользователей. Единственной трудностью может выступить разве что только необходимость изъятия материнской платы из ПК (да и то не во всех случаях, где приятным исключением являются популярные модели корпусов Cooler Master HAF 932/922, или же «близкородственный» корпус Corsair Obsidian 800D, допускающие фиксацию крепежа без демонтажа платы). Однако если какие-то неудобства и возникают, их с лихвой компенсируют два вполне очевидных достоинства винтового крепежа — очень плотный прижим теплосъемника к процессору (с улучшенным термоконтактом) и «железобетонная» надежность фиксации рабочего блока в сокете.

Почти что образцовый порядок сохраняется и в отношении монтажа радиатора — во внутренностях ПК связка «радиатор-вентилятор» может быть размещена на любом доступном посадочном месте типоразмера 120х120 мм (будь то задняя панель, боковая и верхняя стенки, или даже передняя панель, если это позволяет дизайн корпуса). То есть, чрезмерная придирчивость к конструктиву корпусов и серьезные инсталляционные капризы, характерные для крупногабаритных «водянок» (с радиаторами на два-три вентилятора), здесь отсутствуют как класс.

Хорошим дополнением к эксплуатационному портрету Hydro H50 также выступают:

  • отличная технологичность (платформер не требует обслуживания, свойственного типовым системам жидкостного охлаждения)
  • предустановленный термоинтерфейс (высокоэффективная термопаста на основе оксида алюминия)
  • запитка помпы через трехпиновый коннектор (с возможностью гибкой регулировки оборотов рабочего колеса при подключении к реобасам или управляемым разъемам материнской платы)

Экспертно-техническая оценка эксплуатационных параметров: отлично.

Что ж, с конструктивными и эксплуатационными особенностями нашей подопытной системы мы разобрались, пора обратиться к результатам тестов!

Результаты тестовых испытаний (одновентиляторные сборки)

Для понимания сути вопроса настоятельно рекомендуем перед просмотром выкладки результатов обратиться к положениям нашей новой методики тестирования систем охлаждения премиум-класса.

Сперва посмотрим, как Hydro H50 реализует себя в максимально обесшумленном рабочем режиме (условно бесшумный домен, опорный показатель 20 дБА).

Диаграмма 1. Температурные показатели (температура процессорного ядра, максимальное обесшумливание)



Диаграмма 2. Термическое сопротивление (максимальное обесшумливание)

Как видим, в этом функциональном режиме преимущество оказывается на стороне технических решений Asetek — Hydro H50 выдает на-гора очень привлекательные показатели, заметно опережая самого сильного спортсмена из команды воздушного охлаждения — Thermalright IFX-14! Весьма интересным выглядит также сравнение с равношумной сборкой NorthQ Siberian Tiger II — даже при наличии крупногабаритного радиатора, двух вентиляторов и более производительной помпы, каких-то подвижек относительно Hydro H50 этот укрупненный вариант LCLC не выявляет. Такой результат может показаться несколько неожиданным, но он вполне конкретно свидетельствует: для максимально обесшумливания в первую очередь важна эффективность теплосъемника, а не голые габариты системы (ведь слабонапорные вентиляторы вкупе с заторможенными помпами практически полностью нивелируют различия радиаторов, сильно усложняя теплообменные процессы в тракте). И по факту, оптимизация теплосъемника Hydro H50 становится более действенным мероприятием, чем простое наращивание радиаторного конструктива Siberian Tiger II.

Ну, а что покажут результаты при опорном уровне шума 23 дБА? Смотрим!

Диаграмма 3. Температурные показатели (температура процессорного ядра, условно бесшумный домен)



Диаграмма 4. Термическое сопротивление (условно бесшумный домен)

Картина остается прежней — результативность Hydro H50 вновь вызывает только самые положительные эмоции! И в соперничестве с передовыми кулерами, и в конкуренции с предшествующими версиями платформера LCLC наш «новичок» проявляет свои спортивные таланты, демонстрируя по-настоящему конкурентные показатели (фактически на уровне крупногабаритной водянки NorthQ Siberian Tiger II). Так держать!

Далее смотрим расстановку сил в малошумном домене, сохраняя включение помпы на пониженном напряжении (7 В).

Диаграмма 5. Температурные показатели (температура процессорного ядра, малошумный домен)



Диаграмма 6. Термическое сопротивление (малошумный домен)

<

А вот здесь Hydro H50 преподносит уже самый настоящий сюрприз — он не только не уступает своему, казалось бы, более крепкому «родственнику» NorthQ Siberian Tiger II, но даже превосходит его! Судя по всему, в пользу Hydro H50 играют сразу два фактора — оптимизация теплосъемника и более интенсивная вентиляция радиатора. Что как раз и дает серьезный мультипликативный эффект, который выражается в истинно авангардных результатах (не хватает лишь совсем чуть-чуть, чтобы окончательно и бесповоротно свергнуть «воздушного короля» — Thermalright IFX-14!).

Теперь взглянем на показатели, зарегистрированные в эргономичном домене (шумовой репер 31-32 дБА).

Диаграмма 7. Температурные показатели (температура процессорного ядра, эргономичный домен)



Диаграмма 8. Термическое сопротивление (эргономичный домен)

Тут картина получается более сглаженной — топовые представители воздушного охлаждения старательно наверстывают упущенное, и на их фоне результативность Hydro H50 уже не выглядит столь блистательной (с некоторыми оговорками относительно показателей тестовой сборки, приправленной вентилятором Scythe Minebea, который, впрочем, представляет сейчас больше «академический», чем чисто практический интерес). Меняется знак также в соперничестве с NorthQ Siberian Tiger II — эта система получает очень хороший допинг от «полнокровного» включения помпы (при напряжении питания 12 В) и по-прежнему удерживает лидерство в эргономичном домене. То есть, режимы с «проектируемым» уровнем шума порядка 31-32 дБА и выше (помпа 7-12 В, обороты вентилятора более 1200 об/мин) вряд ли являются оптимальными для Hydro H50. Все-таки, его сила — в малошумной функциональности, а не в громогласных рекордах, которые могут быть поставлены только ценой ухудшения баланса эффективности и шумовых характеристик.

В завершение этого раздела приводим сравнительные диаграммы температурных показателей и термического сопротивления для штатных/эталонных конфигураций участников сегодняшнего тестирования (максимальные обороты набортных вентиляторов), диаграмму температурных показателей околосокетных индуктивных элементов (малошумный домен), а также рейтинг, составленный по величинам соотношения эффективность-шум (малошумный и эргономичный домен).

Диаграмма 9. Температурные показатели (температура процессорного ядра, штатные/эталонные режимы)



Диаграмма 10. Термическое сопротивление (штатные/эталонные режимы)



Диаграмма 11. Температурные показатели (температура околосокетных компонентов)



Диаграмма 12. Рейтинг «Соотношение эффективность/шум»

Результаты тестовых испытаний (двухвентиляторные сборки)

Теперь проверим Hydro H50 в двухвентиляторной конфигурации, снабдив радиатор дополнительным вентилятором Scythe Slip Stream (поставлен на высасывание).

Диаграмма 13. Температурные показатели (температура процессорного ядра, дополнительный вентилятор Scythe Slip Stream)

Как и следовало ожидать, сравнение штатных и двухвентиляторных вариантов Hydro H50 получается несколько неоднозначным. На деле, реальный практический интерес представляет лишь сборка со скоростной раскладкой 1300 об/мин (штатный нагнетающий вентилятор) и 1000 об/мин (высасывающий вентилятор Scythe Slip Stream) — при одинаковом шуме, она позволяет получить неплохую термическую «скидку» относительно штатной конфигурации 1300 об/мин (очевидно, добавка второй «вертушки» в этих условиях формирует своего рода переход через «критическую точку», значительно увеличивая эффективную скорость воздушного потока). Все другие равношумные варианты оказываются либо бесполезными, либо даже вредными — к примеру, раскладка 1300+1300 об/мин не дает абсолютно никаких преимуществ относительно одиночного вентилятора 1700 об/мин, а раскладка 500+500 об/мин уступает (причем, весьма серьезно уступает!) штатной сборке 700 об/мин.

Однако если пользователь готов поступиться эргономичностью шумовых характеристик, то построение двухвентиляторных конфигураций будет уже вполне оправданным мероприятием. Так, «вторичный» вентилятор 1900 об/мин довольно существенно облагораживает температурные показатели, по сравнению со штатным максимумом 1700 об/мин, а парное включение «вертушек» на скорости 1900 об/мин дает почти что рекордный результат, равнозначный достижениям двухвентиляторной сборки Thermalright IFX-14. Как видим, запас эффективности у Hydro H50 определенно есть. И немаленький!

Выводы

Рассмотренная система жидкостного охлаждения Corsair Hydro H50 в очередной раз подтверждает правильность ленинского тезиса «Лучше меньше, да лучше» — основываясь на компактном конструктиве платформера Asetek LCLC, она успешно и удачно сочетает хай-эндовое качество комплектующих, отличную технологичность, высокую производительность и малошумную функциональность. Причем, самой сильной стороной этой системы оказывается именно шумовая эргономика: в приоритетных рабочих режимах (с минимальным производимым шумом) Hydro H50 демонстрирует чемпионскую результативность, опережая признанных мастеров воздушного охлаждения — Thermalright IFX-14 и Scythe Mugen 2! Так что, нашим авангардным кулерам явно придется потесниться — в лице Hydro H50 они получают серьезного и достойного конкурента, который способен привлечь немало сторонников среди компьютерных энтузиастов! И на это есть все основания, ведь систему отличает не только сбалансированная совокупность технико-эксплуатационных качеств, но и вполне демократичная, по хай-эндовым меркам, цена — порядка 3000 рублей.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Прыг: 30 31 32 33 34 35 36 37 38 39 40
Скок: 10 20 30 40


Похожие ресурсы:

Copyright © 2009 Версия компьютеры
Сейчас 24 октября 2018, 03:22
Система авторегистрации в каталогах, 
           статьи про раскрутку сайтов, web дизайн, flash, photoshop, хостинг, рассылки; форум, баннерная сеть, каталог сайтов, услуги 
           продвижения и рекламы сайтов

Рейтинг популярности - на эти заметки чаще всего ссылаются: