Процессоры Core i5 и i7 в конструктиве LGA1156

Итак, свершилось — официальный выход в свет платформы LGA1156, наконец-то, состоялся! Не будет преувеличением назвать этот анонс самым долгожданным событием второй половины года: слишком уж давно все ждали новых процессоров. Просто потому, что до этого ситуация складывалась по классическим канонам: верхи не могут, а низы не хотят. Верхи (компания Intel) все никак не могли начать продажу «настоящих настольных» процессоров с архитектурой Nehalem, низы (пользователи) не хотели много чего — связываться с «устаревшей» архитектурой Core 2, платить слишком много за LGA1366 (благо своей ценой последняя платформа в наибольшей степени обязана особенностям, обычному домашнему пользователю не нужным), переходить на решения конкурента, наконец. Теперь же желания и возможности, наконец-то, слились воедино. Впрочем, пока Intel не может предложить ничего нового экономным пользователям – самый дешевый из появившихся процессоров (Core i5 750) имеет отпускную цену в 194 доллара, так что реальная розничная некоторое время будет превышать 200 долларов (предварительные заказы на этот процессор собирались из расчета 205-207 долларов за штуку), что выше своеобразного психологического барьера. Таким образом, наиболее экономичным пока придется довольствоваться разработками предыдущего поколения. Что особых проблем не вызывает — эта категория покупателей не склонна ориентироваться на новизну, исходя при выборе из чисто практических соображений. А вот тем, кто готов отдать за процессор хотя бы сотни две-три вечнозеленых, теперь придется подходить к выбору очень вдумчиво. Старший Core i5 превышает барьер лишь незначительно, старший же Core i7 870 по отпускной цене в точности равен другому топовому процессору, а именно Core i7 950, ну а модель с индексом 860 продается по той же цене, что и Core i7 920, пока еще сохраненный в ассортименте Intel. В рознице же с последней парой некоторое время продолжат конкурировать и «старые» квады Q9550 и Q9650, что еще сильнее затрудняет выбор. Добавьте к этому пару решений конкурента (Phenom II X4 955 и 965), после чего вряд ли кто-то будет спорить с тем, что конкурентная борьба в диапазоне 200-350 долларов становится очень напряженной и неоднозначной. В общем, основными критериями выбора становятся цена платформы (что несложно посчитать) и производительность (которую мы и будем измерять).

Немного об архитектуре и системе наименований

Сильно вдаваться в теорию сегодня смысла не имеет — архитектурно новые устройства это все тот же Nehalem. От своих предшественников и процессоров Xeon под LGA1366 принципиальное отличие только одно — поддержка ИКП двух, а не трех каналов памяти, что и привело к появлению нового сокета: ножек нужно меньше. Это упрощает (и удешевляет) разводку системной платы, позволяет наращивать память с меньшим шагом — в общем, снижает цену платформы. Тем более что дается оно «малой кровью» — как мы уже выяснили, для обычных настольных задач третий канал памяти просто не нужен. Ну а чтоб не было жалко теоретически уменьшившейся ПСП, компания совершенно официально разрешила использовать совместно с новыми процессорами DDR3 1333, также поддерживаемою Xeon X55x0, но не Core i7 под LGA1366.

Еще одним фактором, благотворно влияющим на итоговую стоимость платформы, является отказ от трехчиповой схемы (процессор-северный мост чипсета-южный мост чипсета) в пользу двухчиповой. Довольно-таки сложный и объемистый контроллер шины QPI в процессорах для LGA1156 заменен контроллерами PCI Express и DMI. Первый поддерживает 16 линий, соответствующих стандарту PCIe 2.0, которые могут использоваться либо для одного полноскоростного слота для видеокарт, либо для двух 8х для создания multi-GPU-конфигураций. Интерфейс DMI (который на деле представляет собой электрически измененную версию PCIe 4x) по-прежнему имеет пропускную способность 2 ГБ/с, не изменяющуюся со времен чипсетов серии i915, где и дебютировал. Так что, формально, для создания законченной системы можно просто «припаять» к соответствующим выходам процессора один из уже существующих южных мостов (а они все от ICH6 до ICH10R рассчитаны именно на DMI), на практике же производитель утверждает, что потребуются «чипсеты пятой серии», типа сегодня же анонсированного iP55.

Что самое интересное, на деле поддержка QPI никуда не исчезла, т.е. нельзя даже сказать, что один сложный контроллер заменили на два простых. Только теперь эта шина наружу не выходит, соединяя в пределах одного кристалла контроллеры PCIe и собственно основные блоки процессора, причем ее пропускная способность составляет все те же 4,8 ГТ/с, что и раньше. Зачем вообще было огород городить? Просто есть разница в сложности реализации высокоскоростной «дальнобойной» и «локальной» шин. Ранее длина линка измерялась сантиметрами, ныне же миллиметрами, что позволяет безболезненно работать с низким уровнем сигналов и т.п. Причем и на модификации ядра несколько сэкономили — все равно какой-нибудь интерфейс для связи между процессором и контроллером PCIe пришлось бы придумывать, так почему бы в качестве его не использовать упрощенный линк QPI?

А что изменилось кроме контроллеров «периферии» и памяти (где просто отрезали один из трех каналов)? В вышедших сегодня процессорах — ничего. Это по-прежнему все те же четырехъядерные процессоры архитектуры Nehalem, снабженные трехуровневой кэш-памятью, где емкость кэша L3 составляет 8 МБ. Все три поддерживают Turbo-Boost, две старших модели — и Hyper-Threading, совсем не отличаясь от ставших уже привычными за без малого год Core i7 под LGA1366. Причем поддержке (или отсутствию поддержки) НТ теперь уделено большое внимание — фактически именно она является тем, что делит три анонсированных процессора на две неравные группы.

До последнего времени по сети ходило много слухов о том, как же будут называться процессоры под LGA1156. Большинство сходилось на том, что название Core i7 сохранят приборы для LGA1366, а рассчитанные на новую платформу получат названия Core i5 и i3 в зависимости от числа ядер: в первое семейство попадут четырехъядерные процессоры, во второе — двухъядерные. По поводу всех этих спекуляций компания Intel долго хранила молчание, однако не так давно заявила, что все будет не настолько просто, как казалось. И, действительно, процессоры семейства 800, равно как уже знакомые нам представители линейки 900 (LGA1366) называются Core i7. Что требуется от процессора, чтобы попасть в этот класс? Умение выполнять восемь потоков вычислений. Замечу, что речь не о ядрах, а именно о потоках — в самых ближайших планах компании настоящих восьмиядерных процессоров нет (пока доподлинно известно только о шестиядерных). А восемь потоков нам обеспечивает как раз четыре ядра и поддержка Hyper-Threading.

Что такое процессор Core i5? Очевидно, устройство, способное выполнять четыре потока команд. Вот тут уже возможны варианты: это либо четырехъядерный процессор без поддержки Hyper-Threading, как уже выпущенный Core i5 750, либо двухъядерный с оной. А Core i3 сможет выполнять... нет, не два потока, а те же четыре. Вот только эти процессоры будут всегда работать на стартовой частоте, умея лишь снижать ее при необходимости, т.е. в них не будет поддержки Turbo-Boost. Если же «обрезать» все нововведения Nehalem (т.е. и ТВ, и НТ) и сократить число ядер до двух, получится... очередной Pentium. Нет, серьезно — компания решила в очередной раз продлить жизнь одному из своих любимых брендов.

Просто? Логично? Как нам кажется, не очень-то. Разве что Pentium смотрится хорошо — под этой маркой давно уже продаются двухъядерные процессоры начального уровня, которые «уже не Celeron, но еще не процессор». И с Core i7 все достаточно неплохо — процессоры верхнего уровня. А вот в стане Core i5 полный разброд и шатание. Просто потому, что в него попадают и 45 нм четырехъядерные процессоры с 256К кэша L2 на ядро и 8M общего L3, и двухъядерные 32 нм с 1М L2 на ядро (по сети бродят и упоминание про 2М на ядро, что вызывает недоумение с учетом полностью инклюзивной архитектуры кэш-памяти в Nehalem) и 4М L3. А с последними еще и практически совпадают по характеристикам Core i3. Нет, конечно, всех их разнесут по номерам и т.п., но старую систему наименования становится немного жаль — там хоть сразу очевидно было сколько у процессора ядер.

Впрочем, со всеми этими проблемами нам еще предстоит возиться в следующем году. Пока же единственная проблема, которая может ожидать неподготовленного пользователя — покупка платы с LGA1156 для Core i7 900 (или, соответственно, наоборот). А так все три выпущенных процессора это вполне полноценные четырехъядерники одинаковой архитектуры. Разве что у Core i5 нет поддержки НТ, ну так он и по всем остальным параметрам пока самый младший настольный Nehalem, так что с ним разобраться несложно. Turbo-Boost в Core i7 860 работает по схеме +5-4-1-1 (а не +2-1-1-1 как у Core i7 900, но и не как чудотворящие +3-3-2-2 у Xeon X5500), старшая модель может похвастаться доселе невиданной схемой +5-4-2-2, да и Core i5 750 почти не «обделили», дав ему схему +4-4-1-1, и память DDR3 1333 поддерживается официально — словом, крайне интересно посмотреть, во что эти различия выльются в плане производительности. Кроме того, компания Intel втихую применила к новым процессорам еще один твик — частота блока UnCore составляет по-умолчанию 2,4 ГГц. Этакое промежуточное значение, сравнительно с принятыми для 900-й серии 2,13 ГГц и 2,66 ГГц в Xeon X5500. Очевидно, что его увеличение скажется на производительности, особенно в тех задачах, которые восприимчивы к скорости работы памяти — ведь это означает, что и кэш третьего уровня, и контроллер памяти теперь будут работать немного быстрее, чем в одноименном семействе для другой платформы (в частности, возможно, получится на деле увидеть выигрыш от DDR3 1333, почти как в Xeon, а не отсутствие изменений, как было у нас при тестировании экстремальных процессоров 900-го семейства). Однако касается это только новых Core i7 — Core i5 750 (дабы не слишком пытался приблизиться к старшим моделям при работе с четырьмя или менее вычислительными потоками) имеет ту же частоту UnCore в 2,13 ГГц, что и «старые» Core i7. К тому же, у последних множитель для UnCore на многих платах можно менять, а вот в случае LGA1156 такой свободы не осталось (по крайней мере, пока ее обнаружить не удалось). В общем, технических параметров у современных процессоров становится все больше и больше, что обеспечивает производителям немалую свободу маневра — куда большую, чем во времена оны, когда единственным способом расширения ассортимента являлся выпуск процессоров с разной тактовой частотй.

Но интересно не только сравнение «новых» и «старых» Core i7, а также скоростные характеристики пока (и на долгое время еще) старшего Core i5 — еще и на прочих конкурентов посмотреть стоит. Чем мы сейчас и займемся.

Конфигурация тестовых стендов

Процессор Core i5 750 Core i7 860 Core i7 870
Название ядра Lynnfield Lynnfield Lynnfield
Технология пр-ва 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц 2,66/3,2 2,8/3,47 2,93/3,6
Кол-во ядер/потоков вычисления 4/4 4/8 4/8
Кэш L1, I/D, КБ 32/32 32/32 32/32
Кэш L2, КБ 4 x 256 4 x 256 4 x 256
Кэш L3, КБ 8192 8192 8192
Оперативная память 2 x DDR3-1333 2 x DDR3-1333 2 x DDR3-1333
Коэффициент умножения 20 21 22
QPI 4,8 ГТ/с 4,8 ГТ/с 4,8 ГТ/с
Сокет LGA1156 LGA1156 LGA1156
TDP 95 Вт 95 Вт 95 Вт
Цена $251( 29) $350( 30) $657( 34)

Итак, как мы видим, тактовые частоты (и стартовая, и буст-режима) у трех уже выпущенных процессоров отличаются ровно на один шаг, как в линейке Xeon, но не у Core i7 900-й серии, где ассортимент более «рыхлый» (кстати, и система нумерации в зависимости от тактовой частоты один-в-один с «зионовской»). Также у младшего процессора нет поддержки НТ и ниже частота UnCore, о чем мы выше уже сказали. Других различий нет.

Процессор Core i7 920 Core i7 950 Core i7 Extreme 975 Xeon X5560 Core 2 Quad Q9650 Phenom II X4 965
Название ядра Bloomfield Bloomfield Bloomfield Bloomfield Yorkfield Deneb
Технология пр-ва 45 нм 45 нм 45 нм 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц 2,66/2,93 3,06/3,33 3,33/3,6 2,8/3,2 3,0 3,4
Кол-во ядер/потоков вычисления 4/8 4/8 4/8 4/8 4/4 4/4
Кэш L1, I/D, КБ 32/32 32/32 32/32 32/32 32/32 64/64
Кэш L2, КБ 4 x 256 4 x 256 4 x 256 4 x 256 2 x 6144 4 x 512
Кэш L3, КБ 8192 8192 8192 8192 6144
Оперативная память 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1333 2 x DDR3-1333
Коэффициент умножения 20 23 25 21 9 17
QPI 4,8 ГТ/с 4,8 ГТ/с 6,4 ГТ/с 6,4 ГТ/с
Сокет LGA1366 LGA1366 LGA1366 LGA1366 LGA775 AM2+/AM3
TDP 130 Вт 130 Вт 130 Вт 95 Вт 95 Вт 140 Вт
Цена $309( 95) $656( 68) $1295( 45) $1964( 15) $379( 92) $336( 26)

Поскольку это старт новой платформы, конкурентов будет больше, чем испытуемых. Впрочем, использование для всех тестирований единой методики позволяет это делать без каких-либо временных трудностей — всю эту пачку процессоров мы уже оттестировали заранее :) Итак, с чем же мы будем сравнивать новичков? Во-первых, это все семейство Core i7 под LGA1366: 920, 950 и 975ЕЕ. Во-вторых, два гостя из других команд — «устаревший», но все еще активно продающийся Core 2 Quad Q9650 и новый, но хорошо знакомый Phenom II X4 965. C менее высокочастотными представителями этих линеек результаты при желании можно сравнить самостоятельно — все они в сводной таблице есть. В-третьих же мы решили немного увеличить интригу и вынесли на диаграммы результаты Xeon X5560: он имеет ту же стартовую тактовую частоту ядер, чуть большую частоту UnCore, аналогичное значение TDP, но немного другой буст (менее агрессивный в многопоточных приложениях, но более при нагрузке всего на одно или два ядра), чем Core i7 860. Понятно, что прямыми конкурентами эти процессоры не являются, но «в порядке повышения общей образованности» сравнение будет интересным.

  Системная плата Оперативная память
LGA1156 Gigabyte P55-UD6 (P55) Kingston KVR1333D3N9K3/6G (2 x 1333; 9-9-9-24)
LGA1366 (Core i7 920, 950) Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (3 x 1066; 8-8-8-19)
LGA1366 (Core i7 975, Xeon X5560) Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (3 x 1333; 9-9-9-24)
AM3 ASUS M4A78T-E (790GX) Corsair CM3X2G1600C9DHX (2 x 1333; 7-7-7-20-1T, Unganged Mode)
LGA775 ASUS P5Q3 (P45) Kingston KVR1333D3N9K3/6G (2 x 1333; 9-9-9-24-2T)

Все тесты проводились с памятью типа DDR3, причем процессоров Intel — с одними и теми же модулями. Только их общее количество менялось: все три из комплекта для LGA1366 и два для LGA775 и LGA1156. Можно было бы использовать конфигурацию 2х2 и для 1366, что, как мы уже выяснили, результаты тестов несколько меняет, однако такое «приведение к общему знаменателю» является несколько искусственным. В любом случае, результаты Core i7 920 с двумя модулями памяти в общей таблице есть, так что кому интересна конкретная раскладка по приложениями, могут сравнить процессоры и в таких условиях. А в ближайшее время мы постараемся «расставить все точки над ё» и в отношении конфигураций памяти для LGA1156.

Тестирование

Методика тестирования производительности (список используемого ПО и условия тестирования) подробно описана в статье. Для удобства восприятия, результаты на диаграммах представлены в процентах (за 100% принят результат Intel Core 2 Quad Q9300 в каждом из тестов). Подробные результаты в абсолютных величинах доступны в виде таблицы в формате Microsoft Excel.

3D-визуализация

Тесты этой группы не могут похвастаться хорошим параллелизмом, вполне обходясь парой ядер, так что максимальное значение имеет тактовая частота каждого ядра, скорость работы процессора с памятью и прочие архитектурные особенности, а вот Hyper-Threading чаще всего вообще вредит. Видно, что все три наших сегодняшних героя, хоть и не могут похвастаться рекордными достижениями, однако выглядят вполне достойно. Во всяком случае, это верно для Core i5 750 и Core i7 860, которые, благодаря агрессивному турбо-бусту и быстрому обмену данными с памятью «своих» непосредственных конкурентов побеждают. Примечательно, что 750 отсутствие НТ сослужило в этих тестах хорошую службу он почти догнал 860 (с большей стартовой тактовой частотой) и как бог черепаху изуродовал равночастнтный 920. Чуть сложнее положение Core i7 870 — он медленнее, нежели стоящий одинаково с ним Core i7 950. Впрочем, на стороне первого процессора все равно остается такое важное преимущество, как общая цена платформы. Опять же — у 950 и тактовая частота выше номинально, а 870 отстает от него лишь незначительно — благодаря агрессивному ТВ. Ну а процессоры предыдущего поколения, равно как и предложение от AMD здесь в проигрыше даже сравнительно с самой дешевой моделью.

Рендеринг трёхмерных сцен

До сих пор бушуют споры — полезен ли Hyper-Threading или наоборот. Как мы видим, в серьезных вычислительных задачах, типа рендеринга, способность процессора выполнять большее количество потоков команд сложно переоценить — прирост очень велик. И принципиально разное позиционирование Core i5 и i7 более чем оправдано: по частоте 750 и 860 отличаются лишь на 5%, а вот по производительности — на все 20%. Свою задачу, однако, 750 вполне выполняет, демонстрируя одинаковую производительность с лучшим (из неэкстремальных) представителем Core 2 Quad, который стоит дороже во всех смыслах: и продается по более высокой цене, и себестоимость его куда выше. Таким образом, теперь процессоры линейки Q9x50 можно снимать с производства безболезненно. А чтобы сильно не «обижать» уже сделавших вложения в LGA775 вполне достаточным будет освоить выпуск сравнимых по частотам моделей в семействе Q9x00, имеющих меньший объем кэш-памяти и, соответственно, много более дешевых. И такие шаги уже делаются — Q9505, по частоте идентичный Q9550, но снабженный 3М кэш-памяти на ядро, в ассортименте Intel уже « засветился». Очередь за недорогой (цена должна быть хотя бы сравнима с Core i5 750) заменой Q9650. Впрочем, не так уж последняя и нужна — все-таки сильно продлять жизнь LGA775 совсем не в интересах Intel.

Ну а «этажом выше» все тоже как ожидалось: 860 быстрее, нежели Core i7 920 (что при равных ценах процессоров делает последний практически ненужным) и Phenom II X4 965 (что, опять же, при сравнимых ценах процессоров и меньшем энергопотреблении новинки от Intel, очень неприятно для AMD), 870 же несколько отстает от 950, требуя, зато, меньших вложений в платформу в целом.

Научные и инженерные расчёты

Некоторым приложениям данной группы НТ даже вредит (поэтому Core i7 920 опять сумел  «продуть» равночастотному Core i5 750), хотя в целом картина существенно не изменилась: Core i5 750 просто прекрасный процессор для своей ценовой группы (способный побороться и с более дорогими устройствами), 860 и 870 «пристраиваются» снизу к 950, оставляя актуальным представителям семейства процессоров под LGA1366 возможность сохранить конкурентоспособность, но «вышибая» с рынка 920.

Растровая графика

Благодаря Adobe Photoshop и Paint.Net, к сравнительному позиционированию i5 и i7 снова нет вопросов. А если мысленно оставить на диаграмме только «десктопных» Nehalem разных модификаций, получается вообще очень стройная и красивая картинка, которую портит только Core i7 920. И что с ним сделать, чтоб не нарушал эстетическую красоту мироздания по версии Intel — очевидно ;)

Сжатие данных

Больше двух вычислительных ядер используемым нами версиям архиваторов не нужно, а вот к различным характеристикам подсистемы памяти они очень восприимчивы, причем ко всем — включая и производительность кэша L3 (что, в частности, позволяет Xeon X5560 почти догнать Core i7 950). Core i5 750 чудес не показывает, однако этого от него и не требуется — достаточно того, что этот достаточно недорогой процессор держится на уровне некоторых более дорогих. Остальная пара тоже на своих местах — 860 в очередной раз с разгромным счетом «отпинал» 920, 870 же вежливо пропустил вперед 950, дабы оправдать более высокий статус последнего.

Компиляция (VC++)

Очередной триумф процессоров с Hyper-Threading и, пожалуй, лучший результат Core i7 870 во всем тестировании (точнее, один из двух таковых). Опять же — сложно предъявлять претензии к Core i5 750: пусть он в данном случае самый медленный, зато и самый дешевый, что более чем оправдывает смешную разницу в производительности с, например, старшим Core 2 Quad. К слову — «нестарший» Q9550 в этом тесте медленнее, чем 750, но даже он все еще дороже последнего.

Java

Сходная картина и в тесте Ява-машины, только тут уже Core i5 750 даже не самый медленный.

Кодирование аудио

А при кодировании аудио — самый. Однако с учетом абсолютных значений скоростей, достигаемых современными процессорами высокого класса, на это вообще уже можно не обращать особого внимания: просто констатация факта. Обратите также внимание на то, как в этом тесте красиво выстроился ряд 860-870-950-975 и как некрасиво из него выбивается 920 :)

Кодирование видео

Логика работы современных и даже не очень современных видеокодеков на архитектуру Nehalem «ложится» просто идеально. Впрочем, полезность НТ и тут оспорить крайне сложно, однако, как мы видим, и без этой технологии шансов на «борьбу на равных» у конкурентов в принципе не наблюдается. И даже наличие форы в виде существенно более высокой тактовой частоты положения не спасает.

Из других интересных результатов — 870 во второй раз почти догнал 950. Но «почти» — не считается. В общем и целом уже можно сделать вывод, что из этой пары 950 предпочтительнее если рассматривать только производительность или цену процессора. И единственное, что ему мешает — более высокая цена платформы.

Игровое 3D

Глядя на результаты, так и хочется присвоить Core i5 750 статус лучшего игрового процессора. Нет, он не самый быстрый, но более быстрые намного дороже. Настолько, что разница в цене вообще способна окупить и переход на multi-GPU, что понятно каким образом скажется на итоговых результатах. Впрочем, мы не удивимся, если для игровых компьютеров будущие представители линейки Core i5 (всего с двумя ядрами, но с поддержкой НТ, зато работающие на более высоких частотах) подойдут еще лучше, однако до их выхода еще дожить надо. А Core i5 750 — вот он, пожалуйста :)

Итого

Итак, выход новой платформы состоялся. Успешно? Да — более чем. Если б не Core i7 под LGA1366, которые несколько смазывают триумф новичков, ситуацию вообще можно было бы сравнить с переходом с NetBurst на Core 2: когда новые процессоры среднего класса оказываются производительнее топовых решений как из «старой» линейки самой компании, так и от конкурента. Но вот то, что с архитектурой Nehalem мы уже успели близко познакомиться, превращает ситуацию из революции в нормальную эволюцию. Просто ранее новая микроархитектра была доступна лишь тем, кто готов был за комплект из материнской платы и процессора отдать не менее 500 долларов, а остальным на нее можно было только облизываться, теперь же ее сделали куда более доступной для покупателей, снизив цену «входного билета» в этот клуб сразу долларов на 150-200. Причем очевидно, что возможности для снижения цен для плат на Р55 даже больше, чем для Р45, да и появления со временем более дешевых чипсетов «пятой серии» тоже можно ожидать — как только появятся и более дешевые процессоры.

Не самые легкие времена настают для AMD — Phenom II наконец-то получили достойного конкурента «в чистом виде», каковыми не являлись обе платформы Intel, существующие до данного момента. Фактически до существенного усовершенствования архитектуры компании остается лишь играть с ценами, да уповать на не связанные с самими процессорами преимущества своей платформы (все-таки, как ни крути, а полноценных альтернатив чипсетам типа AMD 785G или 790GX у Intel пока в принципе нет, а окажется ли конкурентоспособным на этом уровне встроенное видеоядро двухъядерных процессоров под LGA1156 покажет время). И то — эти способы помогут лишь в борьбе с Core i5, а для полноценной конкуренции с младшими Core i7 компании, наверняка, придется воспользоваться еще одним из своих методов последних лет: давать пользователю больше ядер, чем Intel. Только теперь это будет сложнее делать — если трехъядерные процессоры как альтернатива двухъядерным были хороши, то наличие в новой микроархитектуре Intel такого дешевого «улучшайзера», как виртуальная многопроцессорность сделает борьбу настольных шестиядерников с оснащенными НТ квадами весьма непредсказуемой. Кстати, и Phenom II X3 всего через несколько месяцев придется конкурировать уже не с Core 2 Duo, а с Core i3/i5 при двух физических ядрах выполняющих по четыре потока вычислений и «распродажными» Core 2 Quad. Ответ компании на этот вызов (очень дешевые за счет отказа от кэша третьего уровня Athlon II X3 и X4) уже готов, но насколько он окажется адекватным судить пока трудно.  В общем, до перехода на 32 нм (после чего и частоты можно будет нарастить, и шестиядерные процессоры перестанут иметь слишком уж высокую себестоимость) и выхода Bulldozer (где, кстати, по имеющимся слухам тоже появится поддержка дополнительных потоков вычисления — для AMD это впервые) никакого серьезного оружия в арсенале компании не появится. Ну а поскольку все эти события ближе к 2011 году произойдут, 2010 пройдет под «знаком Intel» и будет похож на, например, год 2007 (остается только надеяться, что 2011 для AMD не повторит 2008).

Но вернемся к Intel. Как мы видим, без учета Core i7 920 линейка по итоговой производительности выстраивается гладкая и непротиворечивая, 920 же в ряду 750-860-870-950-975 очевидный «шестой лишний». Случайность? Да нет — все было предопределено. Очевидно, уже в мае сего года компания окончательно пришла к выводу, какими будут новые процессоры под LGA1156. И именно в мае произошло обновление «настольных» моделей под LGA1366. Если бы в Intel хотели смерти последней, причем быстрой и безболезненной, это обновление... просто не надо было производить :) 920, как мы видим, существенно хуже, чем 860, а 870 практически аналогичен 940 (в чем можно убедиться изучив таблицу с подробными результатами). При одинаковых ценах в каждой паре «неэкстремальные» модели под LGA1366 мгновенно теряют всякий смысл и их можно более не учитывать. А вот если бы в Intel хотели для 1366 жизни долгой и счастливой, надо было бы не только 940 на 950 поменять, но и 930 вместо 920 выпустить — тогда бы и младший процессор для данной платформы имел паритет по производительности, и старший хорошо бы смотрелся :) Впрочем, очевидно, что такое развитие событий компаний точно было бы не слишком интересно — зачем портить продажи новых Core i7? Но и полностью расставаться с LGA1366 на десктопе она нужным не считает. Вот и принято такое половинчатое решение — 920 нам более не нужен, так что его «убиваем» косвенным путем, но хотя бы одна не экстремальная модель нужна, так что делаем ее конкурентоспособной.

Итак, с позиционированием 950 разобрались: он и должен быть чуть быстрее, чем аналогичный по цене процессор для LGA1156, что компенсируется в определенной степени ценой платформы. А почему тогда блуждают слухи о замене 950 на 960? Тут уже придется заняться сравнительным позиционированием 860 и 870. Как видим, по производительности эти процессоры отличаются совершенно незначительно, да и сложно было бы ожидать обратного — у 870 всего лишь частота на 133 МГц больше (иногда, конечно, разница достигает и 266 МГц, но не обязательно это будет часто наблюдаться). Однако вот отпускные цены различаются почти вдвое: 284 и 562 доллара. Не слишком ли это дорого? Да, слишком. И на LGA1366 за ту же разницу в цене компания всегда давала больше — до мая сего года 266 МГц, а после вообще 400 МГц. Почему так? Вот тут мы уже вступаем в область предположений, но... Наиболее логичным объяснением можно считать такое: цена старшей модели под LGA1156 равна 562 доллара, но не обязательно этой самой старшей моделью долго будет являться Core i7 870. Точнее, сейчас будет, что компании на руку — не портит продажи i7 950 и смещает спрос в сторону i7 860, который на первых порах выпуска новых процессоров получается лучше: частота меньше, буст режим мягче, в процессе наладки производства годных кристаллов больше. А в дальнейшем вполне разумным будет выпустить модель с индексом 880, которая и займет планку в 562 доллара, «опустив» 870 до, допустим, 360 долларов. Правда Core i7 880 уже догонит Core i7 950, но не беда — меняем последний на i7 960 и, опять же, все довольны. В общем, данный вариант развития событий вполне возможен. Особенно, если AMD удастся до конца года выпустить Phenom II X4 975, слухи о чем ходят и очень упорные :)

В общем и целом проблем с мирным сосуществованием в настольных компьютерах сразу двух сокетов (LGA1366 и LGA1156) при разумном их позиционировании нет. Тем более, что практика AMD уже показала, что это возможно — на примере Socket 754 и 940: один массовый, второй для экстремалов (и совместимый с серверными процессорами). Несколько хуже все в противостоянии LGA1156 и LGA775 — опять же, на примере AMD (во времена 754 и 939) ясно, что ничего хорошего из такого бардака не выйдет. У Intel свой опыт тоже был — Socket 478 и 370. Тогда пришлось достаточно агрессивно бороться с «устаревшим» решением, чтобы не мешало новому, причем результат компании настолько не понравился, что больше существования подобного «зверинца» она не допускала. Очень может быть, поздний переход Intel к интегрированному контроллеру памяти как раз и был продиктован желанием использовать для всех настольных процессоров одно и то же исполнение. Теперь же, к сожалению, избежать его не удалось, так что покупатели вынуждены блуждать в трех сокетах, причем самые массовые (ценой до 200 долларов) и высокопроизводительные процессоры друг с другом просто несовместимы никак. Так что компании следует как можно быстрее осваивать техпроцесс в 32 нм для начала выпуска двухъядерных Core i5/i3, увеличивать количество предложений 45 нм четырехъядерных процессоров (в линейке Core i5 700 и Core i7) и постепенно переводить остатки LGA775  в самый бюджетный сегмент. Но это все дело будущего. В настоящем же мы имеем готовую и работающую платформу LGA1156 и уже три процессора для нее. Старший, как показало тестирование, при сегодняшнем уровне цен имеет ограниченную привлекательность, а вот средний и, в особенности, младший как раз те самые «народные нехалемы» (пусть и пока только для относительно обеспеченных слоев народа), которых многие уже успели заждаться.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Система жидкостного охлаждения Corsair Hydro H50

Формально этот продукт представляет собой все тот же платформер Asetek LCLC — до гениальности простой, но вместе с тем очень эффективный и эргономичный «агрегат» . Однако есть здесь и два существенных отличия. Первое: Hydro H50 построен на базе самой свежей и самой совершенной версии LCLC, снабженной переработанным теплосъемным блоком и улучшенным радиатором (причем, согласно техническим выкладкам спецов Asetek, конструктивные нововведения, реализованные в платформере, позволяют не только догнать и перегнать топовые теплотрубные кулеры, но также достойно побороться и с «водянками» высшего класса).

Второе, более весомое отличие, заключается в рыночном позиционировании Hydro H50. Как мы помним, предшествующие модификации LCLC были адресованы в основном OEM-производителям ПК, и даже если что-то перепадало конечным потребителям (комплекты NorthQ), то о реальном присутствии этих систем в рознице можно было не заикаться. Теперь акценты расставлены совершенно иначе: во главе угла восседает «Его Величество Потребитель» — компьютерный энтузиаст, и все вращается именно вокруг него. А уж закрутиться по-хорошему Corsair умеет — тут вам и передовое техническое качество вкупе с продуманной комплектацией, и широкая доступность Hydro H50 в дистрибуторской сети, и взвешенное ценообразование, и адекватная маркетинговая поддержка. В общем, как раз все то, что приличествует серьезному хай-эндовому продукту.

Итак, без долгих вступительных речей обратимся сразу к нашему тестовому объекту! Для начала ознакомимся с его конструктивными и эксплуатационными особенностями, ну и далее уже перейдем к главному пункту сегодняшнего исследования — чисто практической результативности Corsair Hydro H50. Приступим!

Конструктивно-технические особенности

Комплектация. Продукт поставляется в аккуратной упаковке с внутренним пластиковым блистером. Упаковка имеет все необходимые ориентиры, характеризующие внутреннее содержимое — красочный иллюстративный материал и подробный список технико-эксплуатационных параметров.

Поставка включает собственно сам платформер Asetek LCLC, фирменный вентилятор, набор мультплатформенного крепежа (поддерживаются платформы Intel LGA775 и LGA1366, AMD Socket AM2/AM3), набор метизов и краткое техническое руководство (присутствует русскоязычная инструкция).

Общетехническая характеристика. Система представлена неразборной композицией теплосъемного блока, гибких соединительных трубок и радиатора, который в процессе инсталляции дополняется комплектным вентилятором типоразмера 120х120х25 мм (допускается установка еще одного опционального вентилятора). Габариты радиатора 152х120х27 мм. Габариты теплосъемного блока 70х70х55 мм. Длина гибких трубок 30 см. Вес 695 г (без учета крепежа).


Конструктивные особенности (радиатор). «Рабочее тело» системы базируется на типичном «индустриальном» форм-факторе — радиатор составлен из стальных конструкционных элементов (предусмотрены 2 посадочных места для фиксации вентиляторов), пакета алюминиевых плоских трубок (11 шт) и медного оребрения (гофролента, 12 секций, общая площадь поверхности теплообмена порядка 3000 см2).

Значимыми плюсами комплектного радиатора являются:

  • развитая поверхность теплообмена
  • малая проходная дистанция в «ленточных» секциях (толщина оребрения составляет всего 15 мм, что улучшает продуваемость радиатора в связке с тихоходными и малошумными вентиляторами)
  • аккуратное сопряжение трубок и гофроленты (пайка)
  • высококачественное порошковое покрытие (увеличивает эффективную площадь поверхности теплообмена)

Сколько-нибудь серьезных недостатков в его конструктиве не обнаруживается даже при самом строгом рассмотрении предмета.
Экспертно-техническая оценка радиатора: отлично.

Конструктивные особенности (теплообменник и помпа). В рассматриваемой системе теплообменник интегрирован в «монолитный» рабочий блок, который образован связкой помпы и медной теплосъемной пластины (характерные размеры 53х46х12 мм).

К сильным сторонам такого технического решения можно отнести:

  • повышенную гидравлическую эффективность (близкое размещение помпы и теплосъемной пластины сокращает потери давления фактически до нуля)
  • оптимизацию внутренней конфигурации теплосъемника (развитое пластинчатое оребрение)
  • высокую надежность и долговременное функционирование (загерметизированный рабочий блок не требует обслуживания, утечки теплоносителя полностью исключены)
  • добротное техническое качество помпы (керамический подшипник, малопотребляющая «гибридная» электроника)
  • заниженные минимальные обороты рабочего колеса помпы (около 600 об/мин на напряжении 5 В), что дает возможность построить фактически бесшумную систему охлаждения

Слабой стороной «монолитного» рабочего блока является ограниченная мощность встроенной помпы (сравнительно малые штатные обороты — 1300 об/мин, дефицит напора). Однако в рамках платформера LCLC, который характеризуется невысоким импедансом, на этот аспект можно смело закрыть глаза.
Экспертно-техническая оценка теплообменника и помпы: отлично.

Конструктивные особенности (вентилятор). Система оснащена фирменным вентилятором (модель Y.S.Tech KM121225LB, номинальная скорость вращения крыльчатки 1700 об/мин).

В качестве достоинств штатной «вертушки» следует выделить:

  • сбалансированную аэродинамику (с привлекательным сочетанием производительности и шумовых характеристик)
  • добротную электромеханику (двойной подшипник качения и аккуратная управляющая схема, приправленная «стабилизирующими» конденсаторами)
  • ШИМ-контроль с широким диапазоном регулировки (300-1700 об/мин)


Слабой стороной комплектного вентилятора выступает дефицит давления в низкоскоростных функциональных режимах. Но при взаимодействии с оптимизированным радиатором платформера, Y.S.Tech KM121225LB способен сформировать гармоничный и производительный дуэт. Так что, в рамках рассматриваемой системы на этот аспект можно смело закрыть глаза.
Экспертно-техническая оценка вентилятора: отлично.

Эксплуатационная эргономика. В части инсталляционных процедур продукт практически не отличается от типовых теплотрубных кулеров. Так, установка теплосъемного блока осуществляется с помощью крепежного набора (монтажные кольца с подпружиненными винтами и соответствующие пластины-супинаторы), который предусматривает далеко не самые сложные манипуляции, интуитивно понятные и удобоваримые даже для неопытных пользователей. Единственной трудностью может выступить разве что только необходимость изъятия материнской платы из ПК (да и то не во всех случаях, где приятным исключением являются популярные модели корпусов Cooler Master HAF 932/922, или же «близкородственный» корпус Corsair Obsidian 800D, допускающие фиксацию крепежа без демонтажа платы). Однако если какие-то неудобства и возникают, их с лихвой компенсируют два вполне очевидных достоинства винтового крепежа — очень плотный прижим теплосъемника к процессору (с улучшенным термоконтактом) и «железобетонная» надежность фиксации рабочего блока в сокете.

Почти что образцовый порядок сохраняется и в отношении монтажа радиатора — во внутренностях ПК связка «радиатор-вентилятор» может быть размещена на любом доступном посадочном месте типоразмера 120х120 мм (будь то задняя панель, боковая и верхняя стенки, или даже передняя панель, если это позволяет дизайн корпуса). То есть, чрезмерная придирчивость к конструктиву корпусов и серьезные инсталляционные капризы, характерные для крупногабаритных «водянок» (с радиаторами на два-три вентилятора), здесь отсутствуют как класс.

Хорошим дополнением к эксплуатационному портрету Hydro H50 также выступают:

  • отличная технологичность (платформер не требует обслуживания, свойственного типовым системам жидкостного охлаждения)
  • предустановленный термоинтерфейс (высокоэффективная термопаста на основе оксида алюминия)
  • запитка помпы через трехпиновый коннектор (с возможностью гибкой регулировки оборотов рабочего колеса при подключении к реобасам или управляемым разъемам материнской платы)

Экспертно-техническая оценка эксплуатационных параметров: отлично.

Что ж, с конструктивными и эксплуатационными особенностями нашей подопытной системы мы разобрались, пора обратиться к результатам тестов!

Результаты тестовых испытаний (одновентиляторные сборки)

Для понимания сути вопроса настоятельно рекомендуем перед просмотром выкладки результатов обратиться к положениям нашей новой методики тестирования систем охлаждения премиум-класса.

Сперва посмотрим, как Hydro H50 реализует себя в максимально обесшумленном рабочем режиме (условно бесшумный домен, опорный показатель 20 дБА).

Диаграмма 1. Температурные показатели (температура процессорного ядра, максимальное обесшумливание)



Диаграмма 2. Термическое сопротивление (максимальное обесшумливание)

Как видим, в этом функциональном режиме преимущество оказывается на стороне технических решений Asetek — Hydro H50 выдает на-гора очень привлекательные показатели, заметно опережая самого сильного спортсмена из команды воздушного охлаждения — Thermalright IFX-14! Весьма интересным выглядит также сравнение с равношумной сборкой NorthQ Siberian Tiger II — даже при наличии крупногабаритного радиатора, двух вентиляторов и более производительной помпы, каких-то подвижек относительно Hydro H50 этот укрупненный вариант LCLC не выявляет. Такой результат может показаться несколько неожиданным, но он вполне конкретно свидетельствует: для максимально обесшумливания в первую очередь важна эффективность теплосъемника, а не голые габариты системы (ведь слабонапорные вентиляторы вкупе с заторможенными помпами практически полностью нивелируют различия радиаторов, сильно усложняя теплообменные процессы в тракте). И по факту, оптимизация теплосъемника Hydro H50 становится более действенным мероприятием, чем простое наращивание радиаторного конструктива Siberian Tiger II.

Ну, а что покажут результаты при опорном уровне шума 23 дБА? Смотрим!

Диаграмма 3. Температурные показатели (температура процессорного ядра, условно бесшумный домен)



Диаграмма 4. Термическое сопротивление (условно бесшумный домен)

Картина остается прежней — результативность Hydro H50 вновь вызывает только самые положительные эмоции! И в соперничестве с передовыми кулерами, и в конкуренции с предшествующими версиями платформера LCLC наш «новичок» проявляет свои спортивные таланты, демонстрируя по-настоящему конкурентные показатели (фактически на уровне крупногабаритной водянки NorthQ Siberian Tiger II). Так держать!

Далее смотрим расстановку сил в малошумном домене, сохраняя включение помпы на пониженном напряжении (7 В).

Диаграмма 5. Температурные показатели (температура процессорного ядра, малошумный домен)



Диаграмма 6. Термическое сопротивление (малошумный домен)

<

А вот здесь Hydro H50 преподносит уже самый настоящий сюрприз — он не только не уступает своему, казалось бы, более крепкому «родственнику» NorthQ Siberian Tiger II, но даже превосходит его! Судя по всему, в пользу Hydro H50 играют сразу два фактора — оптимизация теплосъемника и более интенсивная вентиляция радиатора. Что как раз и дает серьезный мультипликативный эффект, который выражается в истинно авангардных результатах (не хватает лишь совсем чуть-чуть, чтобы окончательно и бесповоротно свергнуть «воздушного короля» — Thermalright IFX-14!).

Теперь взглянем на показатели, зарегистрированные в эргономичном домене (шумовой репер 31-32 дБА).

Диаграмма 7. Температурные показатели (температура процессорного ядра, эргономичный домен)



Диаграмма 8. Термическое сопротивление (эргономичный домен)

Тут картина получается более сглаженной — топовые представители воздушного охлаждения старательно наверстывают упущенное, и на их фоне результативность Hydro H50 уже не выглядит столь блистательной (с некоторыми оговорками относительно показателей тестовой сборки, приправленной вентилятором Scythe Minebea, который, впрочем, представляет сейчас больше «академический», чем чисто практический интерес). Меняется знак также в соперничестве с NorthQ Siberian Tiger II — эта система получает очень хороший допинг от «полнокровного» включения помпы (при напряжении питания 12 В) и по-прежнему удерживает лидерство в эргономичном домене. То есть, режимы с «проектируемым» уровнем шума порядка 31-32 дБА и выше (помпа 7-12 В, обороты вентилятора более 1200 об/мин) вряд ли являются оптимальными для Hydro H50. Все-таки, его сила — в малошумной функциональности, а не в громогласных рекордах, которые могут быть поставлены только ценой ухудшения баланса эффективности и шумовых характеристик.

В завершение этого раздела приводим сравнительные диаграммы температурных показателей и термического сопротивления для штатных/эталонных конфигураций участников сегодняшнего тестирования (максимальные обороты набортных вентиляторов), диаграмму температурных показателей околосокетных индуктивных элементов (малошумный домен), а также рейтинг, составленный по величинам соотношения эффективность-шум (малошумный и эргономичный домен).

Диаграмма 9. Температурные показатели (температура процессорного ядра, штатные/эталонные режимы)



Диаграмма 10. Термическое сопротивление (штатные/эталонные режимы)



Диаграмма 11. Температурные показатели (температура околосокетных компонентов)



Диаграмма 12. Рейтинг «Соотношение эффективность/шум»

Результаты тестовых испытаний (двухвентиляторные сборки)

Теперь проверим Hydro H50 в двухвентиляторной конфигурации, снабдив радиатор дополнительным вентилятором Scythe Slip Stream (поставлен на высасывание).

Диаграмма 13. Температурные показатели (температура процессорного ядра, дополнительный вентилятор Scythe Slip Stream)

Как и следовало ожидать, сравнение штатных и двухвентиляторных вариантов Hydro H50 получается несколько неоднозначным. На деле, реальный практический интерес представляет лишь сборка со скоростной раскладкой 1300 об/мин (штатный нагнетающий вентилятор) и 1000 об/мин (высасывающий вентилятор Scythe Slip Stream) — при одинаковом шуме, она позволяет получить неплохую термическую «скидку» относительно штатной конфигурации 1300 об/мин (очевидно, добавка второй «вертушки» в этих условиях формирует своего рода переход через «критическую точку», значительно увеличивая эффективную скорость воздушного потока). Все другие равношумные варианты оказываются либо бесполезными, либо даже вредными — к примеру, раскладка 1300+1300 об/мин не дает абсолютно никаких преимуществ относительно одиночного вентилятора 1700 об/мин, а раскладка 500+500 об/мин уступает (причем, весьма серьезно уступает!) штатной сборке 700 об/мин.

Однако если пользователь готов поступиться эргономичностью шумовых характеристик, то построение двухвентиляторных конфигураций будет уже вполне оправданным мероприятием. Так, «вторичный» вентилятор 1900 об/мин довольно существенно облагораживает температурные показатели, по сравнению со штатным максимумом 1700 об/мин, а парное включение «вертушек» на скорости 1900 об/мин дает почти что рекордный результат, равнозначный достижениям двухвентиляторной сборки Thermalright IFX-14. Как видим, запас эффективности у Hydro H50 определенно есть. И немаленький!

Выводы

Рассмотренная система жидкостного охлаждения Corsair Hydro H50 в очередной раз подтверждает правильность ленинского тезиса «Лучше меньше, да лучше» — основываясь на компактном конструктиве платформера Asetek LCLC, она успешно и удачно сочетает хай-эндовое качество комплектующих, отличную технологичность, высокую производительность и малошумную функциональность. Причем, самой сильной стороной этой системы оказывается именно шумовая эргономика: в приоритетных рабочих режимах (с минимальным производимым шумом) Hydro H50 демонстрирует чемпионскую результативность, опережая признанных мастеров воздушного охлаждения — Thermalright IFX-14 и Scythe Mugen 2! Так что, нашим авангардным кулерам явно придется потесниться — в лице Hydro H50 они получают серьезного и достойного конкурента, который способен привлечь немало сторонников среди компьютерных энтузиастов! И на это есть все основания, ведь систему отличает не только сбалансированная совокупность технико-эксплуатационных качеств, но и вполне демократичная, по хай-эндовым меркам, цена — порядка 3000 рублей.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Рекорд пропускной способности 2,2 Гбайт/с: массив из 16 SSD

Введение

Несколько месяцев назад PR-агентство A&R Edelman (занимающееся Samsung в США) сообщило нам о видеоролике на YouTube, где были представлены 24 твёрдотельных накопителя Samsung PB22-J в RAID-массиве на high-end ПК. Авторы видео неплохо поработали и получили скорость передачи данных выше 2 Гбайт/с на контроллере линейки Adaptec 5 и плате Areca 1680ix на системе с двумя CPU Intel Skulltrail. Нас заинтересовал этот проект, и мы решили посмотреть, сможем ли обойти этот результат.

Зачем нужна такая производительность?

Данный проект имеет смысл, если смотреть на него под одним из двух углов. Вы можете рассматривать проект как забавный пример того, когда деньги не имеют значение, или как своего рода взгляд в будущее на производительность накопителей. Видеоролик Samsung показывает, чего можно ожидать от супербыстрого массива на SSD. Массив способен загружать приложения за долю того времени, которое требуется сегодня, он также эффективно устраняет все "узкие места", связанные с производительностью подсистемы хранения. Впрочем, конечно понятно, что использование 24 (или даже 16 накопителей как у нас) совершенно непрактично для настольного ПК.

Суперскоростной RAID-массив

Выбор накопителей

Впрочем, ситуация в мире high-end серверов иная, там максимальное количество операций ввода/вывода в секунду (IOPS) весьма важно для критичных приложений. Мы решили не только взять большое число SSD на флэш-памяти, но и выбрали наилучшие на рынке твёрдотельные накопители, которые позволили бы нам преодолеть пропускную способность массива Samsung, а также дать сенсационно высокое число операций ввода/вывода в секунду.

Нашим выбором стали SSD Intel X25-E, которые базируются на более дорогой флэш-памяти на одноуровневых ячейках (single-level cell, SLC). По сравнению с флэш-памятью Samsung на многоуровневых ячейках (MLC), память SLC может давать меньшие задержки и большую пропускную способность как для чтения, так и для записи. Но есть и недостаток: если накопители Samsung PB22-J предоставляют внушительную ёмкость 256 Гбайт, то профессиональные SSD Intel X25-E по-прежнему ограничены максимумом 64 Гбайт. К счастью, разница в ёмкости не очень значима в нашей гонке за производительностью, и всего 16 SSD-накопителей Intel оказываются достаточными, чтобы обойти 24 накопителя в видеоролике Samsung.

Приступим!

Intel тоже заинтересовалась нашим проектом и предоставила шестнадцать 64-Гбайт накопителей X25-E для тестов. Между тем мы запросили у Adaptec два RAID-контроллера 5805 PCI Express. На них мы создали гнездовой массив, состоящий из двух аппаратных массивов RAID 0, которые затем легли в основу программного массива RAID 0 под Windows. Наш подход оказался правильным, как вы вскоре увидите.

Накопители: Intel X25-E 64 GB SSD

Суперскоростной RAID-массив

Мы уже тестировали профессиональные SSD-накопители Intel X25-E в начале 2009 года, и наши выводы были очевидными: данный продукт не может обойти другие производительные накопители по пропускной способности чтения, но он даёт более высокую пропускную способность записи, а также способен обеспечивать массивную производительность ввода/вывода. Так X25-E выдаёт от 10x до 25x больше производительности по сравнению с одним жёстким диском корпоративного класса на 15 000 об/мин, в то же время обеспечивая превосходную пропускную способность. Рецепт успеха кроется в 10-канальном контроллере флэш-памяти Intel с интегрированной кэш-памятью для оптимизации уровня износа ячеек, а также и производительности записи. Последние обновления прошивки Intel, которые можно скачать на сайте компании, пока не охватывают профессиональные накопители X25-E.

Суперскоростной RAID-массив

64-Гбайт версия накопителя, построенная на 50-нм памяти SLC NAND, по-прежнему является топовой моделью Intel. Устройства следующего поколения должны перейти на более совершенный 34-нм техпроцесс. Это позволит удвоить ёмкость до 128 Гбайт в производительном сегменте и до 320 Гбайт у потребительских моделей X25-M. Есть ещё и потенциал дальнейшего увеличения производительности, но интерфейс SATA/300 скоро может стать очередным "узким местом". К счастью, SATA/600 уже готов прийти на смену.

Мы желали построить в массив с наибольшим возможным количеством накопителей X25-E, но ожидали достичь пропускной способности больше 2 Гбайт/с с намного меньшим количеством SSD, чем 24 в проекте Samsung. После того, как мы получили 16 SSD Intel, мы протестировали несколько конфигураций, чтобы получить максимальную пропускную способность и производительность ввода/вывода.

Контроллеры: Adaptec RAID 5805

Суперскоростной RAID-массив

Современной линейкой унифицированных host-контроллеров Adaptec является пятая. В ней много различных моделей, каждая из которых нацелена на разные внутренние/внешние требования к организации хранилища, например, низкий профиль или карты полной высоты, да и число портов различается. Модель 5805 является низкопрофильной, с восемью внутренними портами SAS/SATA.

Adaptec на данный момент предлагает одиночные карты с количеством портов до 28, но мы намеренно взяли две восьмипортовые карты вместо одной с большим числом портов, чтобы распределить пропускную способность по двум слотам PCI Express. Если посмотреть на интерфейс типичного RAID-контроллера SAS/SATA, то мы получим соединение x8 PCI Express первого поколения, максимальная скорость которого составляет 2 Гбайт/с. Поскольку мы хотели получить более высокую пропускную способность, то взяли две карты и создали программный RAID-массив средствами операционной системы.

Мы тестировали линейку 5 Adaptec более года назад, однако она по-прежнему остаётся топовой в семействе продуктов компании. Последним добавлением в семейство была линейка 5Z, с которой Adaptec добавила защиту Zero Maintenance Cache. Обычные RAID-контроллеры поставляются с кэш-памятью, как правило ECC DRAM, и опциональным резервным аккумулятором, который сохранит данные в кэше в случае сбоя питания. Подход Adaptec заключается в интеграции на контроллеры флэш-памяти, которая сохраняет своё содержимое и без подачи энергии.

Суперскоростной RAID-массив

Конфигурация системы

Мы решили не собирать специальную систему для проекта, поскольку хотели, чтобы наш проект из 16 накопителей SSD можно было повторить на любом компьютере топового уровня, например, на эталонной системе для тестов накопителей. Наша тестовая платформа состояла из процессора Core i7-920 (2,66 ГГц) на материнской плате Supermicro X8SAX, 3 Гбайт памяти Corsair CM3X1024 DDR3 и блока питания OCZ EliteXstream на 800 Вт.

Единственное, мы изменили конфигурацию видеокарты на нашей эталонной тестовой системе. С Radeon HD 3450 пришлось расстаться, поскольку используемый ей слот PCI Express нам потребовался для RAID-контроллера. Заменой стала старая GeForce 4 MX 440 со 128 Мбайт памяти и интерфейсом PCI.

Создание массива, часть I: на уровне контроллера

Суперскоростной RAID-массив

Суперскоростной RAID-массив

Мы выбрали опцию ручной конфигурации в окне Мастера настройки Adaptec Storage Manager.

Мы установили в систему обе карты Adaptec 5805, используя слоты PCI Express 1 и 3. Утилита Storage Manager сразу же определила карты, и мы подключили к каждому контроллеру по восемь накопителей. Мастер настройки Adaptec значительно облегчает создание RAID-массива на каждой карте. Все детали приведены на скриншотах.

Суперскоростной RAID-массив

Мы выбрали RAID 0, поскольку не хотели терять производительность на более сложных массивах.

Суперскоростной RAID-массив

Мы выбрали максимальный размер блока 256 кбайт и отключили опции энергосбережения для данного проекта. Мастер приводит точную конфигурацию накопителей справа.

Суперскоростной RAID-массив

Всё готово! Наш первый массив RAID 0 создан. Мы повторили этот процесс на втором контроллере, а уже затем перешли к Диспетчеру устройств/Device Manager в Windows.

Создание массива, часть II: на уровне операционной системы

Теперь у нас есть два массива RAID 0, каждый с восемью флэш-накопителями Intel X25-E. Поскольку мы знали, что максимальная пропускная способность PCI Express в обоих направлениях у интерфейса x8 составляет 2 Гбайт/с, мы хотели создать программный RAID-массив, в котором два дисковых массива будут объединены в RAID 0 средствами ОС. Мы запустили панель "Управление дисками/Disk management" и создали программный RAID на двух аппаратных массивах.

Суперскоростной RAID-массив

Два динамических диска по 475 Гбайт готовы к использованию.

Суперскоростной RAID-массив

Мы нажали на контроллере правой клавишей мыши и выбрали “New striped volume” для создания нового массива RAID, теперь уже средствами Windows.

Создание массива, часть II: на уровне операционной системы

Выберите оба виртуальных диска, чтобы их можно было использовать в новом массиве RAID 0.

Создание массива, часть II: на уровне операционной системы

Для большинства тестов нужно присвоить букву диска.

Создание массива, часть II: на уровне операционной системы

Windows нужно преобразовать виртуальные диски, представляющие собой массивы RAID 0 контроллеров, в динамические диски.

Суперскоростной RAID-массив

Сменившийся цвет говорит о том, что два диска теперь используются в массиве с чередованием, которому была присвоена буква диска "D:".

Тестовая конфигурация


Системное аппаратное обеспечение
CPU Intel Core i7-920 (45 нм, 2,66 ГГц, кэш L2 8 Мбайт)
Материнская плата (Socket 1366) Supermicro X8SAX, Revision: 1.0, Chipset Intel X58 + ICH10R, BIOS: 1.0B
Память 2 Гбайт DDR3-1333 Corsair CM3X1024-1333C9DHX
Системный жёсткий диск Seagate NL35 400 Гбайт, ST3400832NS, 7200 об/мин, SATA/150, 8 Мбайт
Контроллер (2x) Adaptec RAID 5805, 8 портов SAS, кэш 512 Мбайт
Блок питания OCZ EliteXstream 800W, OCZ800EXS-EU
Видеокарта Nvidia GeForce 4 MX440 (NV18, 150 нм), 32-битная шина PCI (3,3 В)
Тесты
Измерение производительности h2benchw 3.12
PCMark Vantage 1.0
Производительность ввода/вывода IOMeter 2006.07.27
Fileserver-Benchmark
Webserver-Benchmark
Database-Benchmark
Workstation-Benchmark
Streaming Reads
Streaming Writes
Системное ПО и драйверы
Операционная система Windows Vista Ultimate SP1
Чипсет Intel 9.1.0.1007
Драйверы Intel Matrix Storage Drivers 8.7.0.1007

Результаты тестов

Производительность ввода/вывода

Помните, что производительность ввода/вывода ограничивается не только количеством накопителей, но также RAID-контроллером и host-системой, которые должны давать достаточную производительность для максимального числа операций ввода/вывода в секунду. В данном случае более быстрый процессор смог бы ускорить производительность ввода/вывода ещё сильнее. Платформа Core i7 920, которую мы использовали, не всегда является лучшим выбором, но мы получили вполне достойные результаты.

Профили IOMeter Чтение Случайный доступ Размер блока Исполнители
Сервер баз данных 67% 100% 8 кбайт - 100% 4
Файловый сервер 80% 100% 512 байт - 10%
1 кбайт - 5%
2 кбайт - 5%
4 кбайт - 60%
8 кбайт - 2%
16 кбайт - 4%
32 кбайт - 4%
64 кбайт - 10%
4
Web-сервер 100% 100% 512 байт - 22%
1 кбайт - 15%
2 кбайт - 8%
4 кбайт - 23%
8 кбайт - 15%
16 кбайт - 2%
32 кбайт - 6%
64 кбайт - 7%
128 кбайт - 1%
512 кбайт - 1%
4
Рабочая станция 80% 80% 8 кбайт - 100% 4
Потоковое чтение 100% 0% 64 кбайт - 34%
128 кбайт - 33%
256 кбайт - 33%
4
Потоковая запись 0% 0% 64 кбайт - 34%
128 кбайт - 33%
256 кбайт - 33%
4

Производительность ввода/вывода

Доступ к базам данных, который осуществляется блоками размером по 8 кбайт, является 100% случайной операцией с долей чтения 67%. В данном случае наш массив из 16 накопителей смог дать в 5,6x большую производительность по сравнению с одним SSD на нашей системной конфигурации.

Производительность ввода/вывода

Профиль файлового сервера использует 100% случайный доступ и 80% операций чтения, но с разными размерами блоков. Преимущество нашего массива обеспечило 3,1x прирост производительности.

Производительность ввода/вывода

Наш тест web-сервера построен на 100% случайных операциях и 100% чтении с небольшими размерами блоков, типичными для небольших графических или HTML-файлов. Прирост производительности составил 3,3x.

Производительность ввода/вывода

Производительность рабочей станции особо не увеличилась.

В целом, вполне очевидно, что намного меньшего числа SSD-накопителей на флэш-памяти уже достаточно, чтобы нагрузить нашу тестовую систему четырьмя рабочими потоками. Вероятно, более высокую производительность ввода/вывода можно получить, если перейти на систему с двумя четырёхъядерными процессорами. Это позволило, например, в проекте Samsung запустить восемь рабочих потоков. Впрочем, Samsung не публикует значение производительности ввода/вывода, поэтому перейдём к пропускной способности.

Пропускная способность


Пропускная способность

Это мы и хотели получить! В наших тестах потокового чтения размер блока составляет 4 Мбайт, в результате чего 256-кбайт размер блока (stripe) у 16 накопителей используется в полной мере. Мы получили максимальную пропускную способность 2,23 Гбайт/с - больше, чем у 24 SSD Samsung в ролике.

Пропускная способность

Чтение или запись дают близкие результаты. Наша тестовая система с 16 SSD Intel X25-E смогла дать 2,23 Гбайт/с для операций обоего типа.

Мы также попытались проверить и другие размеры блоков, меньше и больше выбранного уровня 4 Мбайт, но максимальную производительность в нашей конфигурации мы получили именно с блоками по 4 Мбайт.

Заключение


Заключение

Самый быстрый массив в мире? Мы не встречали других решений DAS, обеспечивающих пропускную способность почти 2,3 Гбайт/с.

В теории массив, который состоит из 16 SSD на флэш-памяти, способных обеспечить 200 Мбайт/с каждый, должен давать пропускную способность до 3200 Мбайт/с. К сожалению, мы не добрались до этого уровня, несмотря на все проведённые оптимизации, но мы обошли массив из твёрдотельных накопителей Samsung. Данный массив работал с 24 SSD PB22-J. Мы же использовали всего 16 твёрдотельных накопителей Intel X25-E, после чего достигли более высокого уровня. Основной целью было получение более высокой постоянной пропускной способности, и нам было очень приятно добраться до уровня 2,23 Гбайт/с у нашего массива X25-E RAID против 2,12 Гбайт/с у массива Samsung PB22-J.

"Узкие места", как нам кажется, связаны с производительностью CPU, а также и с платформой - вплоть до уровня контроллеров накопителей. Хотя теоретический предел каждого интерфейса PCI Express x8 должен составлять 2 Гбайт/с, действительная пропускная способность может быть существенно меньше.


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Прыг: 19 20 21 22 23 24 25 26 27 28 29
Скок: 10 20 30

Новости для озабоченных:

Анонсы статей по темам:

Оглавление категорий:

Сервисы:

февраль, 2012
пн вт ср чт пт сб вс
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29        

Полезные сайты:
HP Designjet T1300 44-in ePrinter
rucomputers.ru

Похожие ресурсы:

Copyright © 2009 Версия компьютеры
Сейчас 05 февраля 2012, 22:09
Система авторегистрации в каталогах, 
           статьи про раскрутку сайтов, web дизайн, flash, photoshop, хостинг, рассылки; форум, баннерная сеть, каталог сайтов, услуги 
           продвижения и рекламы сайтов

Рейтинг популярности - на эти заметки чаще всего ссылаются: