Джиттер. Теория. Часть 2

Джиттер Теория Часть 2 Оглавление:

  • Часть 1. Введение, виды джиттера, измерения джиттера
  • Часть 2. Джиттер цифрового звукового интерфейса (S/PDIF, AES/EBU)
  • Часть 3. Джиттер при семплировании (ЦАП, АЦП, ASRC)

Джиттер цифрового интерфейса

Интерфейсный джиттер возникает, когда цифровой сигнал посылается с одного устройства на другое. В зависимости от свойств устройств цепи сигнала, джиттер может возникнуть, усилиться, накопиться или ослабнуть. Собственный джиттер передатчиков и приемников, потери в кабеле, шумы и наводки — всё это вызывает джиттер и порчу формы цифрового интерфейсного сигнала.

Формат цифровой передачи звукового сигнала AES3 регламентирует допуски на джиттер. Бытовая версия интерфейса — S/PDIF, описанная в стандарте IEC60958-3:20002, также содержит спецификации на джиттер. Это сделано для предотвращения проблем совместимости устройств, соединяющихся по цифровому интерфейсу.

Собственный джиттер

Если устройство работает автономно или синхронизировано с относительно безджиттерным сигналом, то джиттер, измеренный с передатчика сигнала, обусловлен лишь свойствами самого устройства. Такой джиттер называют собственным или внутренним джиттером (intrinsic jitter).

Уровень собственного джиттера определяется либо фазовым шумом собственного тактового генератора, либо характеристиками восстановления клока в ФАПЧ, если производится внешняя синхронизация.

Возьмем, например, кварцевый генератор, стоящий в CD плеере. Так как устройство работает автономно, джиттер на выходе определяется фазовым шумом тактового генератора и джиттером цифровых микросхем в цепи сигнала. Кварцевые генераторы имеют низкие фазовые шумы, а быстродействующие логические элементы имеют очень низкую флуктуацию времени задержки, так что джиттер мал — зачастую менее 1 пс RMS для частот джиттера выше 700 Гц.

Устройства, рассчитанные на внешнюю синхронизацию с перестраиваемой частотой,
могут иметь генератор управляемый напряжением (ГУН) в качестве клока. В этом случае фазовые шумы намного выше, чем для кварцевого генератора. Собственный джиттер ГУН обычно более 1 нс RMS для частот выше 700 Гц. Однако при восстановлении клока ГУН стоит в цепи ФАПЧ для синхронизации по внешнему источнику и собственный джиттер генератора ослабляется в ФАПЧ.

Собственный джиттер можно измерить даже при отсутствии референсного низкоджиттерного сигнала, если использовать в качестве последнего сигнал, восстановленный ФАПЧ. Характеристики ФАПЧ будут определять точку отсечки НЧ при измерениях. AES3 определяет допуск 3 дБ и частоту среза 700 Гц.

Джиттер, возникающий в кабеле

Другой источник джиттера цифрового интерфейса — неидеальные свойства линии передачи. Затухание в кабеле или несогласованность по импедансу может вызвать потери на ВЧ, что приведет к размыванию фронта импульсов, как показано на графике 7.


График 7. Серым цветом: идеальная форма сигнала AES3.
Голубым цветом: сигнал, прошедший через кабель
На увеличенном фрагменте показано смещение
точки пересечения нуля фронтом импульса

Это может и не стать серьёзной проблемой, если эффект проявится на каждом срезе фронта импульса, так как только повлечет за собой небольшую постоянную задержку в сигнале, что можно проигнорировать.

Однако это может быть только в случае постоянного следования импульсов — если следуют только нули или только единицы. Но реальный сигнал состоит из разных комбинаций битов, так что при порче сигнала в кабеле, это может привести к межсимвольным помехам или межсимвольной интерференции (intersymbol interference).

Проще говоря, импульсы сдвигаются и заходят на места соседних, и чем больше размывание фронтов сигнала в кабеле, тем дальше импульсы от теоретической точки пересечения нуля.

Так как интерфейс AES3 использует один и тот же сигнал для передачи тактового сигнала и данных, возможно возникновение джиттера из-за модуляции данных. Это означает, что нужно изучить закономерности взаимного влияния данных и тактового сигнала. Размывание формы сигнала в результате потерь в кабеле — одно из таких проявлений.

Межсимвольная интерференция


График 9. Межсимвольные помехи сигнала AES3
Черным цветом: 1-1-1
Серым цветом: 1-1-0
Синим цветом: 1-0-0
Голубым цветом: 0-1-0
Пунктирным синим: 0-0-0

На графике 9 показаны варианты сигнала формата AES3, с различными данными в первых трех битах, от 1-1-1 до 0-0-0. Данные закодированы по схеме, под названием двухфазная маркировка (bi-phase mark), также известная как манчестерский код или частотно-модулированное кодирование (Manchester code, FM code), с обязательной сменой уровня перед каждым следующим битом и двукратной сменой уровня в случае «1».

В нижней части показаны сигналы так, как они могут выглядеть после потерь при передаче по кабелю большой длины. Сигналы были получены с использованием симуляции кабеля на измерительной станции Audio Precision System Two. Потери в реальном кабеле могут вызвать тот же эффект: спад высоких частот с увеличением времени нарастания и спада импульсов.



График 8. Структура данных формата AES3. Заголовочная часть Y одинакова в каждом фрейме

В каждом случае данным предшествует заголовок Y, начинающий субфрейм B (График 8). Этот заголовок фиксирован и продолжается 5 битовых периодов (то есть 10 интервальных единиц, 10 UI). В результате этого, независимо от последующих данных сигналы после заголовка имеют примерно тот же самый уровень, так как они перед этим прошли тот же самый путь. Заголовок номинально длится 8 UI, но так как конец предшествующего бита и начало последующего фиксированы схемой кодирования, в результате постоянная часть имеет продолжительность 10 UI.

Черный, серый и синий графики имеют начало смены модуляции в момент времени 1465 нс (9 UI) от времени начала субфрейма, так как они имеют в начале своих данных «1». Голубой и синий пунктирный графики начинаются с «0», так что у них импульс еще не начался. Все пять графиков меняют направление в момент 1628 нс (10 UI), соответствующий концу первого бита (частота семплинга данных 48 кГц, так что 1 UI здесь равен 162,8 нс).

Пунктирные линии «a» и «b» показывают, что моменты пересечения нуля равны 1705 нс и 1745 нс. Более раннее время относится к графикам, соответствующим данным с «1» в первом бите, более позднее — с «0».

В результате потерь высокочастотной составляющей при эмуляции кабеля, переходные процессы увеличиваются, так что точка пересечения нуля смещается примерно на 100 нс. Такое взаимодействие между значением первого символа данных и временем начала второго символа данных называется межсимвольными помехами или межсимвольной интерференцией (intersymbol interference).

Эта интерференция ещё более сложная после второго битового символа (около 2050 нс с начала субфрейма, показана на увеличенном фрагменте графика 9). Здесь четыре различных момента времени пересечения нуля в соответствии с четырьмя возможными сочетаниями первых двух битов субфрейма. Наибольшая разница во времени обусловлена значением второго бита, но есть небольшая разница и в зависимости от значения первого бита.

Джиттер, вызываемый содержимым данных

Джиттером данных (data jitter) называют смещение фронтов импульсов части сигнала AES3, вызванного содержимым данных. Эта форма джиттера часто служит индикатором межсимвольной интерференции.

На графике 9 показан механизм образования джиттера данных, амплитудное значение которого составляет около 50 нс. Джиттер данных также может быть вызван нелинейностью линии связи, так что положительные и отрицательные составляющие фронта импульсов могут смещаться на разные значения.

Джиттер заголовка фрейма

Джиттером заголовка (preamble jitter) называют смещение фронта импульсов в заголовках фрейма AES3. Заголовки фрейма - это унифицированный несменяемый набор данных, используемый для определения начала блока фреймов данных и начала субфрейма (График 8). Заголовок Y в начале второго субфрейма B имеет абсолютно четкую постоянную последовательность битов. Эта неизменяемая часть данных может быть использована для измерений джиттера, так как нечувствительна к межсимвольной интерференции, и поэтому служит индикатором джиттера передающего устройства, а не джиттера, вызванного модуляцией данных.

Джиттер, вызванный шумами и помехами

Если фронты импульсов не размываются из-за потерь в кабеле, время нарастания и спада будет коротким, так что точка пересечения нуля практически не зависит от добавленных шумов. Но в случае длительного переходного процесса, вызванного потерями в кабеле, шумы и помехи «гуляют» по фронту импульса, тем самым, сдвигая точку пересечения нуля фронтом импульса по шкале времени.

Так, шум может изменить время определения фронта импульса. Чувствительность к шуму зависит от продолжительности переходного процесса, что, в свою очередь, обусловлено потерями в кабеле.


График 10. Формат сигнала AES3. Джиттер, вызванный шумами.

Сказанное проиллюстрировано на графике 10, где показано пять идентичных фрагментов Y-заголовка субфрейма B. (Как говорились выше, это неизменяемая комбинация данных нечувствительно к джиттеру данных, что позволяет изучить вызванный шумом джиттер более точно.) Две отметки, «a» и «b», показывают временной диапазон пересечения нуля третьим по счету импульсом. Интервал равен 31 нс. В этом примере производимое шумом отклонение является низкочастотным синусоидальным сигналом с амплитудой около 300 мВ. Такая помеха может быть вызвана линиями питания сети переменного тока.

Джиттер, вызванный шумами в кабеле, напрямую зависит от наклона фронта импульса в точке пересечения нуля. В случае короткого переходного процесса любые помехи не приведут к росту джиттера: изменение уровня сигнала вызовет лишь небольшое смещение по времени.

Замечание: В этом примере была проведена эмуляция длинного кабеля на измерительной станции Audio Precision System Two Cascade. Однако в случае короткого соединения уровень джиттера может быть по амплитуде меньше на несколько порядков.

Учтите, что направление смещения по времени зависит от направления переходного процесса. При нарастании сигнала добавление шума приведет к опережению фронта, тогда как при спаде фронт будет запаздывать. В отличие от джиттера данных, вызванного межсимвольной интерференцией, обсуждаемая форма джиттера больше касается устройств с восстановлением клока по кромке фронта импульса в заголовочной части данных. Так как этот фронт имеет только одно направление (положительный знак производной), смещение по времени последующих фронтов будет суммироваться.

В то же время, есть системы, использующие несколько кромок импульсов в субфрейме, где в равной степени берутся переходные процессы в обоих направлениях. Для таких систем взаимное погашение смещений уменьшает влияние низкочастотных составляющих вызванного шумом джиттера на восстанавливаемый тактовый сигнал. Смещения от высокочастотного шума не обладают такой корреляцией, так что взаимное подавление для ВЧ помех не работает.

Допуск на джиттер

Приемник (ресивер) цифрового звукового сигнала AES3 должен иметь возможность декодирования интерфейсных сигналов, у которых присутствует небольшой уровень джиттера по сравнению с длинной импульсов, которые необходимо декодировать. По мере увеличения уровня джиттера ресивер начинает неточно декодировать сигнал, а впоследствии теряет возможность его декодировать вообще – порой вызывая временное прекращение звука или даже полностью теряя захват цифрового сигнала (lock). Максимальный уровень джиттера до начала появления ошибок в данных называется допуском на джиттер (jitter tolerance).

Как было показано в соответствующем параграфе, ФАПЧ имеет свойства низкочастотного фильтра аналогично маховику: она реагирует на изменения, которые медленнее, чем значение частоты среза, и не обращает внимания на более быстрые изменения.

Допуск на джиттер, следовательно, не зависит от частоты джиттера выше частоты среза ресивера, но при уменьшении скорости дрожания фазы (то есть частоты джиттера), ресивер имеет больше шансов отследить эти измерения.

Это значит, что при низких скоростях джиттера ресивер может среагировать на бОльшие значения джиттера, поэтому допуск на джиттер возрастает. 

 


График 11. AES3. Шаблон допуска джиттера.

По мере приближения частоты джиттера к частоте среза, допуск существенно уменьшается. Это происходит потому, что резонансы в ресивере приводят к тому, что согласование между отклонением времени синхронизации передачи входных данных и приблизительного подсчета времени синхронизации самим ресивером, получается хуже, чем, если бы ресивер совсем не реагировал на джиттер.

Спецификации интерфейса AES3 определяют шаблон допуска по джиттеру, показанный на графике 11. Допуск задается в интерфейсных единицах, UI. Линия на графике показывает нижний предел допуска по джиттеру ресивера к синусоидальному джиттеру на частоте, отложенной по оси X. Обратите внимание — этот шаблон подразумевает, что у ресивера частота среза больше приблизительно 8 кГц. Это значит, что ФАПЧ ресивера не сможет подавить джиттер ниже этой частоты, поэтому сигнал с джиттером проследует дальше. Если необходимо значительное снижение джиттера, нужно использовать вторую ФАПЧ с меньшей частотой среза.

Передаточная функция и коэффициент усиления джиттера


График 12. Передаточная функция джиттера.

При синхронизации устройства от внешнего клока (например, S/PDIF, word clock или синхросигнал видео), джиттер внешнего источника может повлиять на выходной цифровой сигнал. В результате джиттер цифрового выхода равен комбинации этого полученного и собственного джиттера устройства. Хотя зависимость между входным и выходным джиттером может быть достаточно сложной, можно приближенно рассмотреть передачу как простой линейный процесс. Передаточная функция джиттера (jitter transfer function) равна отношению входного джиттера к выходному, как функция частоты джиттера. Отношение называют коэффициентом усиления джиттера (jitter gain) на данной частоте.

График 12 показывает передаточную функцию джиттера для ФАПЧ с частотой среза 100 Гц. Обратите внимание, что на частотах ниже частоты среза коэффициент усиления равен примерно 0 дБ. Выше частоты среза ФАПЧ начинает уменьшать джиттер, с наклоном характеристики 6 дБ на октаву. Данная схема имеет ФНЧ второго порядка в цепи обратной связи с частотой среза 1 кГц, так что выше этой частоты наклон усиливается и становится равным 18 дБ.

Обратите внимание, что ниже частоты среза коэффициент усиления достигает максимального значения, примерно равного 0.5 дБ. Подобное небольшое усиление вполне обычно для частот, чуть ниже частоты среза. Это явление носит название пиковый джиттер или всплеск джиттера (jitter peaking). Оно возникает из-за особенностей фазовой характеристики цепи обратной связи ФАПЧ.

Стандарт AES3 ограничивает коэффициента усиления джиттера значением +2 дБ.

Джиттер от нелинейности

К сожалению, линейная теория передачи джиттера не учитывает нелинейных зависимостей. Так, фазовый детектор ФАПЧ часто имеет мертвую точку, где теряется чувствительность к небольшим фазовым отклонениям. В результате наблюдается дрейф сигнала на выходе ФАПЧ, пока фазовый детектор не заработает и не внесет коррекцию. Этот дрейф вызывает периодическое смещение вперед и назад, порождая джиттер.

Еще одна причина возникновения джиттера по причине нелинейности - это алиазинг высокочастотных компонент джиттера, переносящий паразитные компоненты в низкочастотный диапазон при работе ФАПЧ. Например, при передаче сигнала с частотой семплирования 48 кГц по интерфейсу AES3, составляющая джиттера на 47 кГц даст паразитную компоненту интермодуляции на частоте 1 кГц, в диапазоне, где джиттер не подавляется ФАПЧ. При измерении передаточной функции джиттера это приведет к резкому увеличению коэффициента усиления джиттера, кратного частоте семплирования.

Накопление джиттера

При соединении цифровых звуковых устройств в цепочку, каждое последующее устройство синхронизируется от предыдущего и вносит свой вклад в джиттер. Каждое устройство добавит собственный джиттер, а каждый соединительный кабель внесет джиттер, образующийся в кабеле при передаче. На каждом этапе джиттер также может усилиться или ослабнуть.

Этот процесс называют накоплением джиттера (jitter accumulation). Эффект зависит от характеристик каждого устройства и структуры данных на каждой стадии, и в самом худшем случае джиттер накладывается в наиболее нежелательном варианте. В цепи устройств с восстановлением клока джиттер также в худшем случае накапливается. Как показано в таблице 1, это может привести к значительному усилению джиттера, несмотря на всего несколько стадий передачи сигнала.


Таблица 1. Накопление джиттера в зависимости от усиления джиттера и количества устройств.

Для подсчета максимального значения возьмем джиттер на частотах ниже частоты среза передаточной функции, то есть там, где подавление джиттера отсутствует. Примем, для упрощения, что все устройства имеют одинаковое количество джиттера J (джиттер в кабеле и собственный джиттер). Также представим, что каждое устройство усиливает джиттер предыдущей стадии на то же самое значение, принимая во внимание, что усиления возможно только для частот джиттера вблизи максимума передаточной функции.

Таблица 1 отображает суммарный джиттер для трех цепочек устройств в виде множителя J.

Как мы видим, в случае отсутствия усиления (0 дБ) выходной джиттер просто суммируется. Помните, что это справедливо только для частот ниже граничной, на более высоких частотах джиттер подавляется, так что рост значительно замедляется.

Усиление более 0 дБ отражает явления подъема джиттера передаточной функции, который происходит только вблизи частоты среза. При широкополосном джиттере будет усилена только небольшая часть сигнала, однако есть причины, почему джиттер концентрируется в районе подъема.

Во-первых, джиттер данных дает узкие по спектру компоненты. Для низких уровней сигнала джиттер будет связан со знаком сигнала, так как при приближении сигнала к нулю старшие значащие биты данных изменяются одновременно. Если по интерфейсу передается сигнал одной частоты низкой амплитуды, возникающий в кабеле джиттер стремится к меандру на этой частоте. Зачастую максимум на спектре совпадает с подъемом в передаточной функции джиттера.

В цепи устройств с восстановлением клока с похожими характеристиками, эффект повторяется на каждом этапе. Строчка со значением 6 дБ в таблице отражает уровень подъема джиттера оборудования, разработанного до того, как об этой проблеме стали серьёзно задумываться. Как показано в таблице, в таком случае суммарный джиттера достигает огромных значений, несмотря на небольшое число стадий.

Обычным признаком ненормального уровня накопления джиттера служит частая потеря данных или постоянный срыв синхронизации. К сожалению, такие ситуации сложно воспроизвести и служба технической поддержки здесь оказывается бессильной.

Начиная с 1997 года, спецификация AES3 имеет параграфы, которые посвящены потенциальной проблеме накопления джиттера. Основной из них определяет, что все устройства должны ограничить усиление джиттера значением 2 дБ для любых частот.

В дополнение, имеется установленное значение подавления джиттера, которому должны удовлетворять устройства подавления интерфейсного джиттера. Оговорено значение как минимум в 6 дБ для частот выше 1 кГц. Эта частота намного ниже, чем частота среза шаблона допуска на джиттер, так что устройствам необходим передающий тактовый сигнал, отличный от восстановленного, который определяется допуском на джиттер.


 

Продолжение следует…

Источник Джиттер. Теория. Часть 2


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Джиттер. Теория. Часть 1

Джиттер Теория Часть 1 Оглавление:

  • Часть 1. Введение, виды джиттера, измерения джиттера
  • Часть 2. Джиттер цифрового звукового интерфейса (S/PDIF, AES/EBU)
  • Часть 3. Джиттер при семплировании (ЦАП, АЦП, ASRC)

Введение

Цифровые аудиосистемы отличаются от аналоговых двумя главными особенностями:

  • Сигнал, непрерывно меняющийся по напряжению или току в аналоговой форме, представляется в цифровом виде фиксированным числом дискретных числовых значений
  • Эти числовые значения представляют сигнал не постоянно в течении всего времени, а только в определенные моменты времени, моменты квантования

Обычно моменты квантования определяются аналогово-цифровым преобразователем (АЦП) и цифро-аналоговыми (ЦАП) преобразователем, которые служат для преобразования сигнала из аналоговой формы в цифровую и обратно. Эти устройства зачастую имеют задающий генератор для управления частотой квантования или частотой дискретизации.

Моменты квантования также могут задаваться преобразователем частоты дискретизации — SRC, который использует математические вычисления для трансформации цифрового сигнала одной частоты в другую. В случае если SRC не имеет физического устройства, задающего моменты квантования, вычислительный процесс производится с использованием виртуального тактового генератора.

Цифровое аудио невосприимчиво к многим недостаткам аналоговой записи и аналоговой передачи сигнала: искажения, шумы на линии, шумы пленки, детонации, взаимное проникновение каналов. И даже если сигнал в цифровой форме не полностью избавлен от недостатков, он несомненно очень устойчив к большинству из таких воздействий. Но на практике цифровой сигнал встречается с новыми проблемами: нестабильность тактового генератора, падение характеристик сигнала в кабеле, паразитные наводки. Все это приводит к изменению формы сигнала и небольшим сдвигам во временной области, или джиттеру.

Джиттер также может возникать в случае самотактующегося сигнала (например, S/PDIF). В этом случае джиттер может привести к ошибкам в распознавании данных, к сбою синхронизации или потере отдельных битов. Джиттер задающего генератора также может ухудшать точность оцифровки в преобразователях в процессе квантования.


График 1. Цифровой сигнал формата AES3 под воздействием джиттера

Что такое джиттер?

Джиттером называется отклонение сигнала, такого как тактующий сигнал генератора, во времени от номинала.

Например, джиттер сигнала тактового генератора возникает по причине того, что фронт импульса реального и идеального генераторов различаются, что, кстати говоря, совершенно нормально. В отличие от достижимого в теории идеального сигнала, точка пересечения нуля фронта реального сигнала для разных импульсов различается по времени. Говоря иначе, джиттер — это фазовая модуляция формы цифрового сигнала.

Составляющая джиттера может быть извлечена из тактового или самотактующегося цифрового сигнала и проанализирована в отдельности. Среди наиболее полезных путей изучения влияния джиттера является исследование частотной характеристики и выявление главных частотных компонентов джиттера.

Измерения джиттера

При небольшом количестве джиттера, фронт меандра смещается назад или вперед на небольшую величину по времени. При увеличении джиттера, смещения достигают больших величин.

Амплитудой джиттера называют величину смещения по времени и измеряют в единицах времени: либо в долях секунды (наносекунды, пикосекунды), либо в интервальных единицах (unit). Для тех кто сталкивается с измерениями джиттера впервые, надписи по осям графика могут сбить с толку — зачастую и по вертикальной, и горизонтальной оси отложено время.

Частотой джиттера называют частоту, с которой происходит фазовый сдвиг. Также как в случае наложения шума или помехи, сигнал привносимый джиттером может быть чистой синусоидой, сложным колебанием или полностью случайным процессом.

Интервальная единица (UI)

Интервальной единицей (UI, unit interval) называют отрезок времени, обратно пропорциональный частоте следования данных. Этот термин часто используется при исследованиях джиттера. UI определяется как минимальный номинальный временной интервал в выбранной схеме кодирования. Для сигнала в стандарте AES3 при передачи данных частотой 48 кГц содержатся: 32 бита в субфрейме и 64 бита во фрейме, что дает 128 импульсов на фрейм после применения для кодирования двухфазной модуляции. В этом случае:

1 UI / (128 * 48000) = 163 нс

UI используется в нескольких спецификациях на джиттер в стандарте AES3¹ (стандарт сообщества Audio Engineering Society для интерфейса передачи двухканального цифрового аудио), в результате допуски по спецификации пропорционально масштабируются для разных данных и частот семплирования.

1. AES3-1992 — «Recommended Practice for Digital Audio Engineering — Serial Transmission Format for Two-Channel Linearly Represented Digital Audio Data» J. Audio Eng. Soc., vol. 40 No. 3, страницы 147-165, июнь 1992. (Последняя версия, включающая поправки, доступна на сайте www.aes.org).

Например, длина UI в секундах для частоты 96 кГц вполовину меньше, чем UI для 48 кГц. Требования по джиттеру для передачи и приема находятся в тех же пропорциях.

Примечание: Некоторые спецификации на пересылку данных определяют UI как продолжительность одного бита при передаче. Такое определение несовместимо со спецификацией AES3 и не будет здесь использоваться.

Как можно увидеть джиттер?

Джиттер цифрового сигнала можно увидеть по смещению импульсов, которые сдвинуты относительно идеального тактового сигнала. И любые правильные измерения джиттера основаны на сравнении подверженного джиттеру сигнала с идеальным клоком.

На практике зачастую нет идеального тактового сигнала, с котором можно сравнить испытуемый сигнал. Поэтому при измерении джиттера приходится опираться на сам сигнал, на смещения по оношению к самому себе.

Простейший и наиболее неудачный пример такого пути — это «наблюдение формы сигнала на осциллографе», подключив сигнал с джиттером к осциллографу, как показано на графике 2. К сожалению, вы получите вводящий в заблуждени результат, который будет зависеть от несовершенства генератора осциллографа, а также от спектра джиттера сигнала. Вместо джиттера, такой способ показывает интервальное отклонение. Между ними есть определенная связь, но на некоторых частотах джиттер не будет виден вовсе, тогда как на других амплитуда джиттера может удвоиться. В частности, если речь идет о низкочастотном джиттере.


График 2. Наблюдение смещения фронтов сигнала на осциллографе.
Неверный способ оценки джиттера!

Вместо этого, можно сэмулировать идеальный тактовый сигнал автоподстройкой фазы относительно низкоджиттерного генератора, используя ФАПЧ (PLL) (см. параграф Фазовая автоматическая подстройка частоты). Такой способ самоуточнения сигнала аналогичен наложению ВЧ фильтра с частотой среза, равной частоте среза ФАПЧ. Полученный идеальный тактовый сигнал можно, например, использовать для внешней тактовки осциллографа или как референсный сигнал при просмотре на двухлучевом осциллографе.

Если тактовать осциллограф от референсного сигнала с ФАПЧ и отмасштабировать отображение по времени ровно в один UI, множество следующих друг за другом импульсов будут отображаться как один, накладываясь двух на друга из-за послесвечения точек люминофора экрана. Такая характерная картинка называется глазковая диаграмма (eye pattern). Величина открытия глаза на диаграмме зависит от смещения по времени фронтов импульса. Узость глазного просвета показывает джиттер (меньше просвет — больше джиттер).


График 3. Глазковая диаграмма, построенная APWIN.
Синяя линия сформирована тестируемым сигналом;
серый прямоугольник показывает минимальный допуск спецификации AES3
(синяя линия не должна заходить внутрь серого прямоугольника)

Используя цифровую обработку сигнала (DSP), можно вычислить идеальный задающий сигнал усреднением анализируемого сигнала. После этого есть возможность выделить сигнал и его джиттер с очень большой точностью. По этим данным анализатор может построить отклонение импульсов по амплитуде и времени в виде глазковой диаграммы (график 3); отобразить джиттер во временной области (график 4), или, используя БПФ, построить спектральное разложение джиттера (график 5).


График 4. Джиттер с основной частотой 5 кГц во временной области


График 5. FFT анализ выделенного из сигнала джиттера

Джиттер при семплинге

Джиттер может влиять на цифровой сигнал в двух широких областях: в процессе преобразования аналога в цифру и обратно, и при передаче в цифровом виде.

Джиттером дискретизации или джиттером семплинга (sampling jitter) называют ошибки выбора моментов времени квантования в процессе оцифровки в АЦП, при преобразования в аналог в ЦАП или в преобразователях частоты дискретизации (SRC). Большое значение джиттера в перечисленных случаях может привести к слышимом ухудшении качества сигнала.

Интерфейсный джиттер

В отличие от постепенного ухудшения звука при увеличении джиттера семплинга, большое значение интерфейсного джиттера при передаче звуковых данных может привести к потери целостности данных. Так что становится важным контролировать значение джиттера при передаче данных. Джиттер цифровых звуковых интерфейсов должен находиться в определенных допусках, чтобы его можно было скомпенсировать на приемной стороне.

Джиттер генератора синхросигнала

Во многих задачах цифрового аудио важно хранить, передавать и обрабатывать сигнал синхронно на всех участках цепочки. Это требует стабильной единой частоты дискретизации. В других задачах важно, чтобы частота семплирования сигнала была строго пропорциональной другой частоте, например частоте кадров видеоряда, чтобы не было расхождения видео и аудиодорожки. Способ управления таймингом в этом случае зовется тактовой синхронизацией (clock synchronization).

Когда тактовый генератор синхонизирован с внешним источником синхронизации, добавляется джиттер от генератора синхросигнала. Также джиттер может быть добавлен на этапе передачи сигнала синхронизации. К счастью, можно отфильтровать джиттер сигнала синхронизации. Зная характеристики джиттера генератора синхросигнала, можно отфильтровать джиттер на приемной стороне.

При тактовании от внешнего генератора таким образом, характеристики подавления джиттера сильно влияют на качество звукового сигнала. В других обстоятельствах это становится не так важно.

Фазовая автоматическая подстройка частоты (Phase-Locked Loop)

При быстром вращении тяжелого маховика на скорость его вращения влияют только продолжительно прикладываемые усилия по ускорению и замедлению, с полным игнорированием коротких по времени воздействий. Нечто похожее наблюдается при работе схемы фазовой автоматической подстройки частоты (ФАПЧ).

На входе ФАПЧ имеется фазовый детектор, который формирует управляющий сигнал на основе сравнения разности фаз входного сигнала и цепи обратной связи. Далее сигнал следует на ФНЧ и генератор управляемый напряжением (VCO). Управление возможно из-за наличия цепи отрицательной обратной связи с заданным коэффициентом усиления (PLL Loop Gain).

Если фазовая разность равна нулю, управляющее воздействие отсутствует, контур замыкается. Если же имеется разность фаз, она управляет источником тока (CP), подающего разностный периодический сигнал на ФНЧ. Отфильтрованный дельта-сигнал управляет генератором VCO, который преобразует напряжение в производную фазы по времени, т.е. в частоту. Происходит регулирование частоты таким образом, чтобы фазовая разность стала равной нулю. Происходит фазовая автоматическая подстройка частоты.

ФНЧ вводится намеренно, для достижения ФАПЧ свойства «маховика». ФНЧ сглаживает ВЧ-помехи во входном сигнале и уменьшает полосу, в которой частота VCO стабилизируется схемой ФАПЧ.


График 6. Передаточные функции ФАПЧ

Ниже частоты сопряжения, благодаря ООС, выход ФАПЧ практически повторяет сигнал на входе, при этом фазовый шум ГУН подавляется. С ростом частоты ООС ослабевает, так что джиттер на выходе ФАПЧ будет в большей степени зависеть от собственного фазового шума ГУН и в меньшей от джиттера входного сигнала. Ключевой момент в реализации ФАПЧ приемника или передатчика состоит в компромиссе между собственным джиттером и его подавлением.

Продолжение следует…

Источник Джиттер. Теория. Часть 1


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Семейства видеокарт AMD Radeon
Справочная информация

Семейства видеокарт AMD Radeon br Справочная информация Обращает внимание высокая сложность нового чипа — 4,3 млрд. транзисторов, что более чем наполовину превышает количество транзисторов в предыдущем топовом графическом процессоре. Возможность сделать такой сложный кристалл дало применение современного 28-нанометрового техпроцесса, и новый чип по площади получился даже чуть меньше размера Cayman. А практические его характеристики, влияющие на производительность, были заметно улучшены: количество ALU, TMU, шина памяти. Лишь число блоков ROP не выросло, и частота видеопамяти GDDR5 осталась на той же отметке.

Принцип наименования видеокарт компании остался прежним. Radeon HD 7970 является наиболее производительным одночиповым решением компании, через некоторое время вышла и младшая модель HD 7950, анонсированная несколько позже. Изначально HD 7970 не имела конкурентов на рынке и не заменяла какую-то конкретную видеокарту из линейки AMD, а скорее сдвинула её вниз. Что касается сравнения с конкурентом, то NVIDIA своё 28-нанометровое решение выпустила значительно позднее.

На новую видеокарту AMD устанавливается всё та же память типа GDDR5, но её объём, вместо 2 гигабайт в предыдущем поколении, вырос до 3 гигабайт. Так получилось из-за расширения шины памяти с 256-битной до 384-битной. И теперь на новую плату можно поставить или 1,5 ГБ или 3 ГБ. Естественно, с маркетинговой точки зрения установка меньшего объёма была бы явным недостатком, поэтому было принято решение поставить 3 ГБ, хотя на сегодняшний день это слегка перебор. Лишь в сверхвысоких разрешениях да с MSAA 16x не хватит 1,5-2 ГБ. Впрочем, у AMD есть и Eyefinity, а для игр на трёх и более мониторах экранный буфер будет как раз занимать очень большой объём.

Итак, рассмотрим Radeon HD 7970. Новая видеокарта верхнего ценового диапазона имеет двухслотовую систему охлаждения, закрытую привычным для всех современных плат AMD пластмассовым кожухом по всей длине карты. Лишь дизайн этого кожуха немного изменился, хотя задняя часть всё так же выходит за пределы печатной платы. А вот дизайн планки с выводами был изменён — для улучшения охлаждения видеокарты, один из двух слотов (половина планки) был занят исключительно вентиляционным отверстием для отвода тепла.

Но пользователи не должны пострадать от снижения количества разъёмов DVI, распаянных прямо на плате. Для их удобства в комплект поставки будет включен специальный переходник HDMI—DVI, который позволит подключить два монитора, имеющих DVI-разъёмы. К слову, энергопотребление новой карты не ниже, чем у Radeon HD 6970, поэтому на неё пришлось установить набор из одного 8-контактного и одного 6-контактного разъёмов питания.

Зато в новой Radeon HD 7970 в лучшую сторону изменилась система охлаждения. Применяется новое поколение испарительной камеры и новый кулер большего размера, с изменённой формой лопастей и увеличенной производительностью (обеспечивается больший поток воздуха). В результате отмечается увеличение эффективности кулера при одновременном снижении шума.

С платы никуда не делся и переключатель прошивок Dual BIOS, о котором мы писали в описании Radeon HD 6900. Вкратце: видеокарта имеет две версии BIOS, одна с возможностью пользовательской перепрошивки, а вторая — с жёстко зашитой на фабрике прошивкой. Это удобное решение настолько приглянулось и пользователям и самой AMD, что та решила продолжить им комплектовать топовые решения.

Можно только поприветствовать данное решение, которое реально помогает в различных случаях, связанных как с неожиданными проблемами при перепрошивке (выключение электроэнергии в процессе, например), так и позволяет бесстрашно проводить различные эксперименты с образами BIOS. Неудивительно, что AMD ещё и снова намекает на отличные возможности разгона новой видеокарты:

Как видите, практически обещается разгон до частоты 1 ГГц и выше, если не учитывать мелкой надписи (которая не вошла в скриншот) о том, что гарантия перестаёт действовать даже в том случае, если видеокарта вышла из строя в результате эксперимента с поднятием частоты из настроек видеодрайвера.

Архитектурные особенности Radeon HD 7970

Чтобы оценить актуальность архитектурных модификаций в Southern Islands, сначала рассмотрим развитие GPU за прошедшие несколько лет в представлении AMD. До 2002 года графические чипы представляли собой специфичное аппаратное обеспечение, способное исключительно на графические вычисления. Видеочипы того времени имели ограниченную функциональность, они умели лишь накладывать и фильтровать текстуры, обрабатывать геометрию, заниматься примитивной растеризацией и поэтому совсем не подходили для универсальных вычислительных задач.

За следующие несколько лет к GPU была добавлена базовая программируемость, но ориентированная также исключительно на графические задачи. Это было время поддержки DirectX 8 и 9, ограниченных по функциональности шейдерных программ с возможностью расчётов с плавающей запятой. Видеочипы того времени имели специализированные блоки ALU для вершинной и пиксельной обработки, а также выделенные кэши для пикселей, текстур и других данных. Универсальности всё ещё не было даже близко.

И лишь в 2007 году у компании AMD появилась унифицированная шейдерная архитектура DirectX 10, а также возможности программирования GPU при помощи специальных средств: CAL, Brook, ATI Stream. GPU того времени уже имели продвинутое кэширование и поддержку локальных и глобальных общих данных. Архитектурно чипы были основаны на блоках VLIW5 и VLIW4, достаточно гибких для некоторых базовых неграфических вычислений, но всё же ориентированных на графические алгоритмы.

А теперь настало время для новой архитектуры, ещё лучше подходящей для универсальных вычислений — Graphics Core Next (GCN). Для AMD это новая архитектурная эра, поэтому и название выбрано такое. Новые GPU предлагают отличные возможности и производительность по обработке графики, но сделанные архитектурные изменения предназначены, прежде всего, для улучшения позиций в неграфических вычислениях — увеличению производительности и эффективности в сложных универсальных задачах. Новый дизайн GPU предназначен для так называемых гетерогенных вычислений — смеси графических и универсальных в мультизадачной среде. Архитектура GCN стала гибче и должна ещё лучше подходить для энергоэффективного выполнения различных задач.

Базовым блоком в новой архитектуре является блок GCN. Именно на таких «кирпичиках» основаны все новые графические процессоры серии Southern Islands. Архитектура впервые для графических чипов компании AMD использует не VLIW-дизайн, в нём применяются векторные и скалярные блоки, и одним из самых важных изменений стало то, что каждый из вычислительных блоков GCN имеет свой планировщик и может выполнять инструкции из различных программ (kernel).

Новая вычислительная архитектура разработана для высокой эффективности загрузки вычислительных блоков в многозадачной среде. Вычислительный блок GCN разделён на четыре подраздела, каждый из которых работает над своим потоком команд каждый такт. Потоки могут использовать и скалярный блок, имеющийся в GCN, для управления потоком данных или операций над указателями. Комбинация векторных и скалярных блоков предлагает очень простую программную модель. Например, указатели на функции и стек (function pointers и stack pointers) программируются гораздо проще, да и задача компилятора теперь значительно упрощена, так как исполнительные блоки скалярные.

Каждый блок GCN имеет выделенное локальное хранилище данных для объёмом 64 КБ для обмена данными или расширения локального стека для регистров. Также блок имеет в своём составе и кэш-память первого уровня с возможностью чтения и записи, и полноценный текстурный конвейер (блоки выборки и фильтрации). Поэтому новый вычислительный блок способен работать самостоятельно, без центрального планировщика, который в предыдущих архитектурах отвечал за распределение работы по блокам. Теперь каждый из блоков GCN способен заниматься планированием и распределением команд сам, один вычислительный блок может исполнять до 32 разных потоков команд, которые могут быть из разных виртуальных адресных пространств в памяти и полностью защищены и независимы друг от друга.

Предыдущие архитектуры GPU компании AMD использовали архитектурные модели VLIW4 и VLIW5, и хотя они достаточно хороши для графических задач, но являются недостаточно эффективными для универсальных вычислений, так как загрузить все исполнительные блоки работой в таких условиях очень непросто. Новая архитектура GCN предлагает столь же большое количество исполнительных блоков, но при скалярном исполнении, которое убирает ограничения и зависимости регистров и инструкций. Переход от архитектуры VLIW к скалярному исполнению даёт заметное упрощение задач по оптимизации кода.

При исполнении инструкций на предыдущей VLIW4 архитектуре компилятору приходится заниматься решением конфликтов регистров, выполнять сложное распределение инструкций на исполнительные блоки на стадии компиляции кода и т. д. При этом для достижения высокой производительности зачастую требуется нетривиальная оптимизация, что подходит для большинства графических задач и гораздо менее гибко для других вычислений. Новая же архитектура предлагает значительное упрощение разработки и поддержки, упрощённое создание, анализ и отлов ошибок в низкоуровневом коде, стабильную и предсказуемую производительность.

Подсистема кэширования памяти

Пропускной способности и объёма памяти и кэшей никогда не бывает достаточно, и всегда есть необходимость и методы их увеличения. В новых GPU компании AMD применяется полноценная двухуровневая кэш-память с возможностью чтения и записи. Каждый вычислительный блок имеет по 16 килобайт кэша первого уровня, а общий объём кэша второго уровня составляет 768 килобайт (всего в чипе получается 512 КБ L1 и 768 КБ L2), что на 50% больше, чем в предыдущем чипе, вовсе не имеющем возможности записи в L2-кэш.

Что касается производительности, то каждый вычислительный блок GCN за один такт может получить или записать по 64 байта данных из/в L1-кэш или глобальную память, которая служит для обмена данными между потоками команд. Столько же данных способен передавать и принимать каждый раздел кэш-памяти второго уровня L2. В результате, для топового GPU компании получается 2 терабайт/с для L1 и 700 ГБ/с для L2, что на 50% больше, чем у предыдущего топового решения AMD.

Графический процессор «Tahiti»

После того, как мы рассмотрели низкоуровневые архитектурные изменения новой серии Southern Islands, самое время перейти к подробностям о самом мощном решении этой линейки — Radeon HD 7900, включающей в себя две модели. Прежде всего, отметим просто огромную сложность нового GPU, ведь он включает более чем 4,3 миллиарда транзисторов, что вдвое больше, чем было в чипе, на котором основан Radeon HD 5870! Естественно, что такой могучий чип стал возможен лишь благодаря применению нового техпроцесса 28 нм. Итак, что же у него есть внутри?

Количество геометрических блоков не изменилось, по сравнению с Cayman, их всё так же две штуки, но зато эффективность их работы значительно увеличена — мы остановимся на этом подробнее чуть позже. На схеме графического процессора мы видим 32 вычислительных блока архитектуры GCN, доступные на Radeon HD 7970, а в случае с младшим решением, некоторые из них будут отключены. Если считать пиковую вычислительную производительность решения, то она составляет почти 3,8 терафлопа (количество операций с плавающей запятой в секунду), что является абсолютным рекордом для GPU на сегодняшний день.

Каждый блок GCN имеет в своём составе по 16 текстурных блоков, что даёт итоговую цифру в 128 TMU на чип, или более чем 118 гигатекселей/сек — и это ещё один рекорд на момент выпуска, и он далеко не последний. А вот количество блоков ROP не изменилось, их всё так же 32 штуки в 8 укрупнённых блоках RBE. Ещё одно интересное архитектурное изменение — теперь блоки ROP «прикреплены» не к каналам памяти, как это было ранее, а к блокам GCN.

Хотя теоретически скорость записи во фреймбуфер почти не изменилась, и максимально возможны те же 32 значений цвета и 128 значений глубины за такт, практическая скорость заполнения (филлрейт) в реальных применениях значительно возросла из-за увеличенной пропускной способности памяти. По измерениям AMD, Cayman обеспечивал запись лишь 23 пикселей за такт, в то время как новый Tahiti приблизился к теоретическим 32 пикселям за такт.

Это и понятно, ведь новый видеочип компании AMD имеет 384-битную шину памяти — шесть 64-битных каналов, точно как и текущее топовое решение конкурента. Именно это полуторакратное увеличение ПСП и даёт возможность повысить реальную скорость текстурных выборок и записи во фреймбуфер. Пропускная способность в 264 ГБ/сек должна помочь выжимать близкие к теоретическим показатели в 118 гигатекселей/сек и 30 гигапикселей/сек, и в практической части мы это проверим.

В случае «урезанного» графического процессора Radeon HD 7950 в Tahiti входит 28 активных вычислительных блоков архитектуры GCN из 32 физически имеющихся в чипе. В случае с младшим решением серии Radeon HD 7970 было решено отключить четыре из них. Так как каждый блок GCN имеет в своём составе по 16 текстурных блоков, итоговая цифра количества TMU для новой модели составляет 112 блоков TMU, что даёт производительность почти 90 гигатекселей/сек.

А вот количество блоков ROP и контроллеров памяти в HD 7950 не изменилось, их решили не урезать и оставить всё те же 32 и 6 штук, соответственно. Поэтому, видеочип Tahiti Pro имеет такую же 384-битную шину памяти, собранную из шести 64-битных каналов, как и топовое решение AMD. Видимо, больше всего от брака при производстве страдают именно вычислительные функциональные устройства, а всё остальное решили не урезать.

Тесселяция и обработка геометрии

С архитектурной точки зрения, ничего особенного в геометрических блоках Tahiti со времен Cayman не изменилось. Используется всё так же по два блока для обработки (установка вершин и тесселяция) геометрических данных и растеризации, и схема весьма похожа на ту, что мы видели ранее, разве что тесселяторы названы аж 9-м поколением:

Несмотря на схематическое сходство, последнее поколение этих блоков способно на значительно большую производительность тесселяции и обработки геометрии, так как блоки подверглись значительным модификациям. Хотя пиковая производительность выросла лишь почти до двух миллиардов вершин и примитивов в секунду (925 МГц и две вершины а такт), реальная производительность выросла больше. Это было достигнуто при помощи увеличения объёма кэшей, улучшения буферизации геометрических данных и повторного использования вершинных данных.

В результате, производительность тесселяции улучшена при всех коэффициентах разбиения треугольников до четырёх раз, по сравнению с Radeon HD 6970 из предыдущего поколения. Но четыре раза достигаются не во всех случаях даже на диаграмме от самой AMD:

Диаграмма показывает сравнение производительности тесселяции Radeon HD 7970 по сравнению с HD 6970 при коэффициентах разбиения от 1 до 32. И, как вы видите, разница в производительности получилась от 1,7 до 4 раз. Но это — голая синтетика. И чтобы приблизиться к реальности, приведём ещё данные о скорости тесселяции уже в игровых приложениях:

Как видите, синтетические цифры AMD неплохо подкрепляются игровыми — производительность в реальных приложениях с «тяжёлой» тесселяцией значительно выросла. Это очень неплохой результат, который мы обязательно проверим в практической части, на примере синтетики и игровых приложений.

Неграфические вычисления

С точки зрения гетерогенных и неграфических вычислительных задач весьма важны появившиеся два асинхронных вычислительных движка (Asynchronous Compute Engines — ACE). Они предназначены для планирования и распределения работы между исполнительными блоками для эффективной многозадачности и работают вместе с графическим командным процессором (Command Processor).

Radeon HD 7900 имеет два независимых вычислительных движка и один графический. В сумме это даёт три программируемых блока и три потока команд, полностью отделённых друг от друга. А в дополнение к асинхронной подаче команд для быстрого переключения контекста, новый GPU также имеет два двунаправленных контроллера прямого доступа к памяти (DMA), появившиеся в Cayman. Эти два контроллера необходимы для того, чтобы полностью использовать возможности новой шины PCI Express 3.0.

Как мы знаем, с точки зрения серьёзных вычислений важна не только скорость выполнения операций с плавающей запятой с одинарной точностью, но и двойной (double precision floating point). И новая архитектура AMD весьма неплохо справляется с такой задачей. На данный момент предполагается существование двух версий вычислительных блоков GCN, имеющих разный темп исполнения FP64 инструкций. Для старшего GPU темп выполнения составляет 1/4 от скорости FP32, а для младших чипов выбран темп 1/16, что вполне достаточно для сохранения совместимости, но не слишком усложняет недорогие решения. В итоге, Radeon HD 7970 способен на 947 миллиардов операций двойной точности в секунду (эх, до терафлопа совсем же чуть-чуть не дотянули!) — налицо очередное высочайшее достижение нового чипа AMD.

Причём, это не те гигафлопы, что в случае предыдущих архитектур, а более «жирные». Ведь эффективность нового GPU в сложных вычислительных задачах должна серьёзно возрасти. Во-первых, улучшена подсистема памяти и кэширования. Во-вторых, каждый вычислительный блок GCN имеет свой планировщик, что должно улучшить исполнение ветвящегося кода и общую эффективность. Ну и в третьих отметим скалярное исполнение, не требующее сложных оптимизаций от компилятора, в результате чего вычислительные блоки будут гораздо реже простаивать. И в итоге в любых задачах новому чипу будет легче показать высокую производительность и загрузку ALU.

Из других нововведений, связанных с вычислительными возможностями, отметим полную поддержку ECC для DRAM и SRAM. С программной стороны важно, что Tahiti — это первый графический процессор с полной поддержкой новых версий API: OpenCL 1.2, DirectCompute 11.1 и C++ AMP и их возможностей. Например, OpenCL 1.2 позволяет объединять возможности нескольких вычислительных устройств в одно, и компания AMD уже выпустила соответствующую поддержку в виде AMD APP SDK 2.6 и драйвера Catalyst 11.12.

Производительность и эффективность архитектуры

После обзора всех архитектурных нововведений на примере топового чипа серии Southern Island настало время поговорить об эффективности всех этих изменений. Понятно, что производительность новых чипов гораздо выше, чем у предыдущих, обратное было бы весьма удивительно. Вопрос в том, насколько быстрее. В различных задачах получаются цифры от 40-50% (минимум!) до пятикратной разницы. Улучшения в архитектуре позволяют превысить теоретическую 1,4-кратную разницу по тупым гигафлопсам. Давайте рассмотрим это на примерах:

На диаграмме сравнивается новое топовое решение и предыдущее одночиповое: Radeon HD 7970 и HD 6970, что вполне справедливо. Тесты производительности выбраны различные: SmallptGPU и LuxMark — это рейтрейсинг на OpenCL, SHA256 — безопасный алгоритм хеширования, а AES256 — симметричный алгоритм шифрования. Ну а Mandelbrot — широко известная задача, рассчитанная с двойной точностью вычислений.

Вертикальной прерывистой линией на графике отмечена теоретическая разница в производительности, но данные о скорости показывают, что в трёх из пяти задач скорость нового GPU оказалась значительно выше. Это вызвано всеми изменениями, направленными на увеличение эффективности: уход от VLIW, наличие планировщика в каждом вычислительном блоке, улучшенное кэширование и т. п.

Изменения в качестве рендеринга

Собственно, эту часть вполне можно было бы и пропустить, так как к качеству изображения в последнее время особенных претензий уже нет и быть не может — по разным причинам. Например, качество полноэкранного сглаживания у видеокарт разных производителей весьма близкое, особенно учитывая широкое распространение программных методов сглаживания при помощи фильтров постобработки, выполняемых на всех GPU абсолютно одинаково.

То же самое касается и текстурной фильтрации — сейчас её качество таково, что отличить решения AMD и NVIDIA весьма непросто даже если делать попиксельное сравнение. У Radeon HD 6900 — предыдущего поколения компании — анизотропная фильтрация улучшилась ещё немного, и теперь даже «микроскоп» не поможет найти там какие-то значительные недостатки. Единственное замечание в том, что в движении видеокарты Radeon немного уступали GeForce из-за более заметных специфических артефактов, вроде «шума» или «песочка».

С выходом видеочипов нового поколения веса текселей в текстурном фильтре пересмотрели ещё раз, модифицировав их так, чтобы снизить подобные артефакты, иногда видимые на Radeon HD 6900 при наличии текстур определённого вида («высокочастотных», с резкими переходами от тёмного к светлому, например). Изменения в качестве настолько трудно показать на примерах, что AMD не приводит сравнительные картинки HD 7900 против HD 6900, а просто сравнивает качество «аппаратного» алгоритма с чисто программным, выполняемым на потоковых процессорах GPU, а потому — идеальным:

На таком мелком скриншоте разницы в качестве не видно, но AMD уверяет, что все проведённые изменения не привнесли никакого падения производительности и ни в одном из аспектов не ухудшили качество картинки — оно всё так же не зависит от угла и качество фильтрации близко к идеальному. В одном из будущих практических материалов мы это обязательно проверим.

Частично резидентные текстуры (Partially Resident Textures)

Идея Partially Resident Textures (PRT) заключается в использовании аппаратной возможности представленного графического процессора — виртуальной памяти. Наверняка многие пользователи уже видели игру RAGE компании id Software, которая использует технологию виртуального текстурирования, так называемое мегатекстурирование («MegaTexture»), которое обеспечивает возможность использования огромных объёмов текстурных данных и подкачку (streaming) их в видеопамять.

Используя виртуальную видеопамять, очень легко получить эффективную аппаратную поддержку подобных алгоритмов, позволяющих применять в приложении до 32 терабайт текстур, что даёт возможность сделать уникальные локации в играх, без повторяющихся кусков текстур, при полном отсутствии проблем с подгрузкой текстурных данных. Правда, наглядный пример AMD приводит слишком странный, из которого ничего особо непонятно:

PRT позволяет добиться высокого качества картинки и помогает повысить эффективность использования видеопамяти. Подобные алгоритмы уже применяются в движке id Software, и ожидается их появление во многих движках следующего поколения. Игры будущего нуждаются в работе с огромными объёмами данных и преимущество нового GPU в том, что локальная графическая память в алгоритмах а-ля PRT работает как аппаратная кэш-память, и текстуры в неё подгружаются при необходимости. GPU семейства Southern Islands поддерживают «мегатекстуры» объёмом до 32 терабайт (разрешением до 16384×16384) и, что особенно важно, аппаратную текстурную фильтрацию для них, что недоступно на более ранних видеочипах.

Виртуальные текстуры разбиваются на куски размером 64 килобайта (именно килобайты, а не тексели) и этот размер куска фиксирован. И в локальную память видеокарты подгружаются только те из них, которые нужны при рендеринге текущего кадра. Технология работает независимо от текстурного формата, просто размеры кусков в текселях будут отличаться. Например, для обычной несжатой текстуры с 32 бит на цвет, размер куска будет 128×128 текселей, а для сжатой в DXT3-формат — 256×256 текселей.

Технология предполагает и использование мип-уровней текстур (уменьшенных копий, используемых при текстурной фильтрации). При рендеринге и фильтрации к ним требуется многократный доступ. Рассмотрим работу алгоритма на примере.

На этом рисунке выделены четыре разных куска из разных мип-уровней, требуемые при рендеринге. Когда шейдерная программа запрашивает данные из них, некоторые из кусков уже имеются в локальной памяти и эти данные сразу же отправляются в шейдер для дальнейших вычислений. Но некоторые куски отсутствуют в таблице, и приложение должно выбрать последующие действия при таком промахе. Например, можно запросить данные из мип-уровня меньшего разрешения, тогда изображение будет нечётким, но оно хотя бы будет похоже на правду и отрисуется без задержки. А к рендерингу следующего кадра оно уже может быть подгружено в кэш — локальную видеопамять. Игравшие в RAGE нас поймут.

Это — мощнейший алгоритм, позволяющий использовать огромные текстуры, уникальные для каждого из объектов. Аналогичные алгоритмы давно используются при оффлайн-рендеринге, за исключением необходимости расчётов в реальном времени. AMD даже сделала демо-программу, использующую технику наложения текстур Per-Face Texture Mapping, разработанную Walt Disney Animation Studios для их анимационных фильмов. К сожалению, демонстрационная программа ещё не готова, и мы видели лишь скриншоты низкого разрешения.

Суть данной техники наложения текстур в том, чтобы каждому полигону назначить определённый кусок текстуры, без необходимости использования UV-преобразования (нахождения соответствия между координатами поверхности трёхмерного объекта и координатами на двухмерной текстуре). Такой подход решает некоторые проблемы с созданием тесселированного контента, делая алгоритм смещения векторов (displacement mapping) очень простым. А PRT в этом методе используется для эффективного хранения и доступа к текстурных данным.

Инструкции по обработке медиаданных

Интересным нововведением в Southern Islands кажется поддержка специализированных инструкций, используемых при обработке изображений, статичных и динамических. Например, была улучшена широко используемая инструкция под названием «сумма абсолютных разностей», более известная как SAD (Sum of Absolute Differences). Скорость её исполнения — весьма критичное к производительности узкое место многих алгоритмов обработки изображений и видеоданных, вроде определения движения (motion detection), распознавания жестов (gesture recognition), поиска по изображениям, компьютерного зрения и многих других.

Но в обзоре древней видеокарты Radeon HD 5870 мы уже писали о поддержке SAD. Теперь, кроме обычного SAD (4×1) в Southern Islands появилась новая инструкция — QSAD (счетверённый SAD), объединяющая SAD с операторами сдвига для увеличения производительности и энергоэффективности, а также «маскируемая» инструкция MQSAD, игнорирующая пиксели заднего плана и используемая для изоляции движущихся в кадре объектов от фона.

Новые GPU могут обрабатывать до 256 пикселей на каждый вычислительный блок GCN за такт, что в случае модели AMD Radeon HD 7970 означает возможность обработки до 7,6 триллионов пикселей в секунду в случае 8-битных целочисленных значений цвета. Хотя это теоретическая цифра, возможности новых графических процессоров по обработке визуальных данных весьма впечатляют — многие задачи по обработке видео можно будет выполнять в режиме реального времени.

PCI Express 3.0

Не могли мы пройти мимо поддержки третьей версии PCI Express всей линейкой новых графических решений Southern Islands. Эта поддержка была вполне ожидаемой, так как спецификации третьей версии PCI Express окончательно утвердили ещё осенью 2010 года, но аппаратных решений с её поддержкой до сих пор не было, хотя системные платы уже появляются, видеокарты выпущены в конце 2011 года, да и центральными процессорами соответствующие есть.

Обновленный интерфейс обладает скоростью передачи 8 гигатранзакций в секунду вместо 5 ГТ/с для версии 2.0, и его пропускная способность ещё раз выросла вдвое (до 32 Гб/с), по сравнению со стандартом PCI Express 2.0. В новой шине применяется другая схема кодирования пересылаемых по шине данных, но совместимость с предыдущими версиями PCI Express была сохранена.

Первые системные платы с поддержкой PCI Express 3.0 были представлены летом 2011, в основном базе чипсета Intel Z68, а в широкой продаже они появились лишь осенью того же года. Вот и видеокарты подоспели, и AMD по скорости выхода новых графических процессоров с поддержкой самых совершенных технологий снова стала впереди планеты всей. Но будет ли от PCI-E 3.0 какой-то практический толк — судить слишком рано.

Технология AMD PowerTune

Одним из самых интересных нововведений в Cayman была технология расширенного управления питанием PowerTune. Гибкое управление питанием GPU уже давно применялось, но до Radeon HD 6900 все эти технологий были довольно примитивными и в основном программными методами и изменяли частоту и напряжение ступенчато, не умея отключать большие части видеочипов.

Ещё в семействе Radeon HD 5000 появился ограничитель производительности при превышении определённого уровня потребления, а в Radeon HD 6900 система перешла на качественно иной уровень. Для этого в чип включили специальные датчики во все блоки, которые отслеживают параметры загрузки. Графический процессор постоянно измеряет нагрузку и энергопотребление и не позволяет последнему выйти за определённый порог, автоматически регулируя частоту и напряжение, чтобы параметры оставались в рамках указанного теплопакета.

В отличие от ранних технологий управления питанием, PowerTune обеспечивает прямой контроль над энергопотреблением GPU, в отличие от косвенного управления при помощи изменения частот и напряжений. Эта технология помогает установить высокие частоты GPU, получив высокую производительность в играх, и не бояться, что потребление может выйти за безопасные пределы. Ведь большинство игр и обычных приложений, использующих вычисления на GPU, предъявляют значительно менее высокие требования к питанию и не подходят к опасным пределам энергопотребления, в отличие от тестов стабильности, вроде Furmark и OCCT.

Даже самые тяжёлые игры не требуют максимального потребления энергии, и если ограничить потребление частотой, испытывая видеокарты экстремальными тестами, то в случае 3D-игр останется довольно много неиспользованных возможностей по производительности и питанию. В случае, когда видеокарта не достигла предела безопасного уровня потребления, GPU будет работать на выставленной на фабрике частоте, а в тестах FurMark и OCCT, частота GPU понизится, чтобы оставаться в рамках потребления.

Таким образом, PowerTune помогает выставить более высокие фабричные частоты и настроить систему на максимально эффективное использование ресурсов GPU при установленном максимальном уровне потребления. На показанном выше примере, HD 5870 не использует PowerTune и из-за ограничения частоты GPU высоким потреблением в тестах выносливости не использует все свои возможности. В то время как для Radeon HD 7970 установлен максимальный TDP, и видеочип сбрасывает частоты лишь при его превышении, получая максимально возможную производительность в любых приложениях.

Наглядно это показано на следующей диаграмме. В случае игровых приложений достижение TDP возможно при повышении частоты GPU, а для пиковых нагрузок тестами выносливости частота снижается до безопасного уровня энергопотребления. Без PowerTune пришлось бы выбирать — или получить вероятность выхода из строя видеокарты при длительной работе FurMark и OCCT, или урезать потенциально возможную производительность в играх. Новая технология решает эти вопросы максимально эффективно.

AMD PowerTune отличается быстрой отзывчивостью на изменение условий (микросекунды), так как это аппаратная технология. Также её отличает гибкая настройка частот, а не ступенчатая, как это было в предыдущих чипах. Все измерения не зависят от драйвера, но могут быть скорректированы пользователем при помощи настроек видеокарты.

Отличия PowerTune от общепринятого ранее подхода в том, что в других случаях используется защита от перегрева (thermal throttling), которая переводит графический процессор в режим значительно пониженного потребления, а PowerTune просто плавно снижает его частоту, приводя потребление GPU к установленному ограничителю. При этом достигаются более высокие тактовые частоты и производительность.

Технология AMD ZeroCore

Компания AMD не ограничилась применением уже известной по предыдущим решениям технологии управления питанием. В первых чипах семейства Southern Islands она представляет технологию AMD ZeroCore, которая помогает добиться ещё большей энергетической эффективности в режиме «глубокого простоя» (или «сна») с отключенным устройством отображения, который поддерживается всеми операционными системами.

Ведь практически любая система, даже игровая, большую часть времени проводит в режиме низкой нагрузки на графический процессор. И видеокарта не должна потреблять много энергии в таком режиме. И уж тем более не говоря о режиме с отключенным монитором — в этом случае GPU желательно вовсе отключить. Так в AMD и сделали. Благодаря ZeroCore, в состоянии глубокого простоя новый GPU потребляет менее 5% энергии полноценного режима, отключая большинство функциональных блоков в этом режиме.

AMD приводит схематическое сравнение со своей же Radeon HD 5870, которая поддержкой такой технологии не обладала. ZeroCore — эксклюзивное нововведение Southern Islands, пришедшее в настольные решения из мобильных GPU, предназначенных для ноутбуков. Кстати, преимущества этой технологии связаны не только со снижением потребления. Кроме этого, в режиме длительного простоя при отключении дисплея видеокарта ещё и полностью выключает вентилятор на кулере видеокарты!

Это именно то, чего давно ждали многие пользователи. Самое интересное, что по нашим данным, лабораторные испытания подобных PowerTune и ZeroCore решений проходили ещё несколько поколений видеокарт назад. Некоторые из инженерных сэмплов видеокарт давно ушедших с рынка серий компании AMD именно так и работали, полностью отключая кулер в простое.

Но не только пользователи систем с одной видеокартой получат бонус от снижения шума и потребления энергии с новыми видеокартами AMD с поддержкой ZeroCore. Аналогичные улучшения ожидают и счастливых владельцев CrossFire систем на базе двух, трёх и даже четырёх GPU. Логично ведь, что в режиме отрисовки двухмерного интерфейса операционной системы все видеокарты, кроме главной, не должны бы работать вовсе? Но ведь сейчас они работают именно так!

В случае же CrossFire систем на видеокартах с поддержкой ZeroCore в 2D-режиме все вторичные видеокарты погружены в глубокий сон с минимальным потреблением энергии и отключенным кулером. Такой режим работает и для нескольких одночиповых видеокарт и для двухчиповых решений. Кроме того, первичная видеокарта CrossFire также будет переходить в такой режим в случае длительного простоя, настроенного в Windows. Наглядно разница в работе выглядит так:

Кстати, технология не так проста, как может показаться. Инженерам AMD пришлось решить массу вопросов, связанных с работой операционной системы в режиме простоя. Например, они выяснили, что Windows пытается обновлять информацию на экране даже при отключенном мониторе. Что, естественно, не позволяет отключить GPU вовсе. Поэтому программистам компании пришлось пойти обходным путём, игнорируя все команды отрисовки экрана при отключенном мониторе в режиме сна.

Технология AMD Eyefinity 2.0

Естественно, что в новой архитектуре нашлось место и для улучшений проверенной технологии вывода изображения на несколько мониторов — AMD Eyefinity, теперь в версии 2.0. Она получила новые возможности, большие разрешения, поддержку большего количества дисплеев и расширение гибкости.

Эта технология довольно интересна, хотя крайне малое количество пользователей найдёт в комнате место и наберётся смелости перед семьёй для установки более чем двух мониторов. Но лучше иметь возможность, чтобы всегда смочь ей воспользоваться, чем не иметь её вовсе. Тем более, что цены на мониторы больших диагоналей почти не снижаются, а вот решения среднего уровня постоянно дешевеют.

И действительно, сейчас выгодне купить три монитора с диагональю экрана в 24″, чем один 30-дюймовый. AMD приводит именно такой пример, когда 30″ монитор с разрешением 2560×1600 стоит более $1000, а три 24″ FullHD можно купить за половину этой цены:

Но как тратить свои деньги и пространство в комнате — это личное дело каждого пользователя. Главное, что такая возможность есть. Плюс к этому, Eyefinity 2.0 теперь поддерживает вывод изображения и в стереорежиме HD3D — то, чего не хватало в предыдущих решениях, которые по этому параметру уступали конкурирующим. Объединившая технологии AMD Eyefinity и HD3D видеокарта Radeon HD 7970 является первым одночиповым решением с поддержкой трёх мониторов, работающих в стереорежиме.

Для стереорендеринга в высоком разрешении нужен очень быстрый интерфейс передачи данных. И с предыдущими версиями HDMI выходов, возможности были ограничены 24 Гц на каждый глаз, что вполне достаточно для просмотра кино на Blu-ray 3D, но для любителей игр явно слишком мало.

Для таких задач стали применять формат frame packing, когда кадры для левого и правого глаза объединяются в один, и AMD Radeon HD 7970 поддерживает формат HDMI 1.4a frame packing для вывода стереокартинки. Это первая видеокарта с поддержкой 3-гигагерцового HDMI с frame packing, когда на каждый глаз приходится FullHD картинка с частотой 60 Гц (120 Гц в итоге):

Ещё одной любопытной новинкой нам кажется технология многоканального вывода звука Discrete Digital Multi-Point Audio (DDMA), работающая вместе с Eyefinity. Все предыдущие GPU способны выводить по HDMI и DisplayPort лишь по одному аудиопотоку. То есть, даже если к ПК подключены по HDMI три монитора, находящиеся в разных комнатах, то звуковой канал передаётся лишь один. А вот AMD Radeon HD 7900 получил поддержку одновременного вывода сразу нескольких независимых аудиоканалов, что вполне может пригодиться в некоторых мультимониторных конфигурациях.

Эта же возможность будет весьма полезной для применения в сфере видеоконференций с выводом нескольких собеседников на отдельные экраны, а также многозадачного применения вроде игры на трёх мониторах с игровым аудиосопровождением и просмотром новостей на отдельном экране с независимым звуковым потоком. Ранее для всего этого приходилось применять несколько отдельных аудиосистем, а теперь всё работает максимально удобно.

Не забыта и программная поддержка Eyefinity, почти каждый месяц технология обновляется — появляются новые возможности. Так, ещё в октябре появилась поддержка разрешений вплоть до 16384×16384 и новые мультимониторные конфигурации: горизонтальные и вертикальные 5×1, а также на основе шести мониторов в режиме 3×2.

В декабрьском обновлении видеодрайвера AMD Catalyst стала возможной совместная работа Eyefinity и HD3D, а в феврале обещают поддержку пользовательских разрешений, настройки размещения панели задач и улучшения управления наборами настроек.

Вывод изображения на шесть мониторов может быть осуществлён при помощи двух портов DisplayPort 1.2 и двух концентраторов MST (о которых мы писали ранее), а три или даже четыре монитора потребуют лишь одного порта и соответствующего концентратора. Такие концентраторы позволяют гибко конфигурировать систему вывода изображения, они поддерживают до четырёх FullHD-устройств на один разъём DisplayPort 1.2 и должны появиться в продаже к лету 2012 года.

К слову о разрешении. Высоком разрешении или даже ультравысоком — Ultra High Resolution. Нынешние устройства с разрешением 4000 пикселей по большей стороне требуют подключения при помощи сразу нескольких кабелей: двух DP 1.1 или четырёх DVI. Мониторы такого разрешения следующего поколения будут подключаться лишь по одному кабелю: DP 1.2 HBR2 или HDMI 1.4a 3 ГГц. И новая видеокарта компании AMD уже готова к таким мониторам, снова она стала первой в мире.

Кодирование и декодирование видеоданных

Вполне естественно, что в состав AMD Radeon HD 7970 включён всё тот же блок UVD для декодирования видеоданных, появившийся ещё в предыдущем поколении видеочипов компании. Он просто не нуждается в доработках, поддерживая многопоточный кодек MVC, декодирование форматов MPEG-2/MPEG-4 (DivX), VC-1 и H.264, а также декодирование двух FullHD-потоков во всех поддерживаемых форматах.

Решения AMD обеспечивают максимальное качество декодирования видеопотока, используют несколько десятков специальных алгоритмов улучшения качества и обеспечивают максимальный результат в тестах качества вроде HQV. Среди поддерживаемых особенностей отметим: регулировку цвета и тона, шумоподавление, повышение резкости, качественное масштабирование, динамическую контрастность, продвинутый деинтерлейсинг, а также inverse telecine. Вот пример улучшения контрастности на лету:

Но с декодированием у всех видеочипов давно всё более-менее в порядке. Все новые GPU обеспечивают приличное качество и производительность при просмотре видеоданных. А вот кодирование видео на GPU всё ещё пребывает в зачаточной стадии и основные претензии пользователей направлены на низкое качество получаемой сжатой картинки.

Возможно, новая серия Radeon HD 7000 сможет помочь и в этом, ведь все графические процессоры серии имеют в своём составе блок кодирования видео Video Codec Engine (VCE). Модель Radeon HD 7970 стала первой видеокартой с поддержкой аппаратно ускоренного кодирования и сжатия видео при помощи специализированного блока (ранее в кодировании принимали участие потоковые процессоры).

Качество и производительность должно быть явно лучше, чем раньше, поддерживается кодирование в формат 1080p при 60 кадрах в секунду, причём даже быстрее, чем в реальном времени. Про качество сказать без тестов что-то сложно, но нам обещаны разные уровни оптимизации кодера для видеоданных и игр, а также изменяемое качество сжатия (возможность выбирать между повышением качества или производительности).

Пока что опробовать VCE негде — приложений с его поддержкой просто нет, но компания AMD работает с партнёрами, такими как ArcSoft, для обеспечения поддержки VCE в соответствующих программных продуктах. В будущем планируется выпуск программной библиотеки для ускорения кодирования видеоданных, которая облегчит задачу разработчиков по поддержке продукции AMD нового поколения.

Кодирование может производиться в двух режимах: полное и гибридное (с использованием возможностей потоковых процессоров GPU). Полный режим разработан для задач, которые требуют максимальной энергоэффективности и постоянного уровня производительности. Кодирование в полном режиме на VCE быстрее реального времени и обеспечивает низкие задержки. Но есть и гибридный режим:

В таком режиме вместе с VCE работают и математические блоки GPU. Все хорошо распараллеливающиеся стадии, которые обведены жёлтой линией на схеме, могут использовать мощь вычислительных блоков GCN, а выделенный блок VCE занимается эффективным аппаратным энтропийным кодированием. Такой режим хорошо подходит для видеокарт с большой математической мощью, вроде Radeon HD 7970. Остаются вопрос к качеству этих двух режимов, но это требует тщательного анализа в отдельном материале.

AMD Steady Video

Кроме кодирования и декодирования видеоданных, есть и ещё одна область применения мощи новой графики от компании AMD — улучшение видеороликов плохого качества, снятых с рук, без использования штатива и других аналогичных средств стабилизации изображения. Технология стабилизации видео называется AMD Steady Video, и уже выпущена её вторая версия.

Алгоритм работы программного стабилизатора довольно прост: на основе видеопотока собирается статистика о движении камеры (сдвиг, вращение, приближение) и это движение компенсируется в текущем кадре, относительно предыдущих — изображение сдвигается, поворачивается и масштабируется так, чтобы картинка сильно не прыгала и оставалась стабильной.

Насколько это просто на словах, настолько же сложно в реализации. Просто потому, что пикселей на экране два миллиона, а кадров в секунду до 30 или даже 60. Представьте, сколько вычислений нужно проделать, чтобы отследить все возможные смещения кадра. Мы уже писали выше о функции QSAD, применяемой в видеообработке, как раз она используется и в Steady Video 2.0 для ускорения алгоритма определения движения. Так вот GPU должен обрабатывать случайные сдвиги с амплитудой до 32 пикселей в любом направлении и для этого требуется производительность, соответствующая более чем 500 млрд. операций SAD в секунду (для 1920×1080 при 60 FPS).

За счёт поддержки новых инструкций QSAD в Radeon HD 7970, его преимущество над мощными CPU в алгоритме motion detection превышает 10x! То есть, качественное видео нам теперь будет обеспечено, причём не только при обработке домашних роликов в видеоредакторах, но и просмотре чужих онлайновых видеороликов, снятых неизвестно чем и неизвестно как.



Подробности: серия Radeon HD 7800

  • Кодовое имя чипа: «Pitcairn»
  • Технология производства: 28 нм
  • 2,8 млрд. транзисторов (чуть больше, чем у Cayman, который является основой серии Radeon HD 6900)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11.1, в том числе и шейдерной модели Shader Model 5.0
  • 256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
  • Частота ядра: до 1000 МГц (для Radeon HD 7870)
  • 20 вычислительных блоков GCN, включающих 80 SIMD-ядер, состоящих в целом из 1280 ALU для расчётов с плавающей запятой (целочисленные и плавающие форматы, поддержка точности FP32 и FP64 в рамках стандарта IEEE 754)
  • 80 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчета за такт
  • Интегрированная поддержка до шести мониторов, включая HDMI 1.4a и DisplayPort 1.2

Спецификации видеокарты Radeon HD 7870

  • Частота ядра: 1000 МГц
  • Количество универсальных процессоров: 1280
  • Количество текстурных блоков: 80, блоков блендинга: 32
  • Эффективная частота памяти: 4800 МГц (4×1200 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 2 гигабайта
  • Пропускная способность памяти: 153,6 гигабайта в сек.
  • Теоретическая максимальная скорость закраски: 32,0 гигапикселя в сек.
  • Теоретическая скорость выборки текстур: 80,0 гигатекселей в сек.
  • Один разъём CrossFire
  • Шина PCI Express 3.0
  • Разъёмы: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Энергопотребление: от 3 до 175 Вт
  • Два 6-контактных разъёма питания
  • Двухслотовый дизайн
  • Рекомендованная цена для рынка США: $349

Спецификации видеокарты Radeon HD 7850

  • Частота ядра: 860 МГц
  • Количество универсальных процессоров: 1024
  • Количество текстурных блоков: 64, блоков блендинга: 32
  • Эффективная частота памяти: 4800 МГц (4×1200 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 2 гигабайта
  • Пропускная способность памяти: 153,6 гигабайта в сек.
  • Теоретическая максимальная скорость закраски: 27,5 гигапикселя в сек.
  • Теоретическая скорость выборки текстур: 55,0 гигатекселей в сек.
  • Один разъём CrossFire
  • Шина PCI Express 3.0
  • Разъёмы: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Энергопотребление: от 3 до 130 Вт
  • Один 6-контактный разъём питания
  • Двухслотовый дизайн
  • Рекомендованная цена для рынка США: $249

И в этот раз принцип именования продуктов компании не был изменён и тенденции предыдущих серий были продолжены. Среднебюджетная серия видеокарт, основанная на архитектуре GCN, отличается от топовой и бюджетной линеек второй цифрой в индексе: вместо 7 и 9 поставлена цифра 8, что вполне логично. Раз AMD взяла психологический рубеж в 1000 МГц для частоты GPU, то Radeon HD 7870 получил дополнение «GHz Edition» к названию, указывающее на взятие этой частоты.

Из названия понятно, что Radeon HD 7800 более производительна, чем HD 7700, но имеет меньшую скорость, по сравнению со старшими моделями — HD 7900. Что касается сравнения с решениями NVIDIA, то старшая выпущенная модель HD 7870 на момент выхода конкурирует с видеокартой GeForce GTX 570, а младшая нацелена на борьбу с GTX 560 Ti, а новых 28 нм чипов среднего уровня NVIDIA не выпустила до сих пор.

Обе модели видеокарт от AMD имеют GDDR5 память одинакового объёма в 2 гигабайта. Они обе используют 256-битную шину памяти, и поэтому на них можно было бы поставить 1, 2 или 4 ГБ. 1 гигабайт — это слишком мало, а 4 ГБ — слишком дорого для данного ценового сегмента. Поэтому можно сказать, что выбран идеальный объём в 2 ГБ видеопамяти, вполне достаточный для подавляющего большинства игр даже в высоких разрешениях, и не слишком затратный по себестоимости.

В остальном, с точки зрения потребителя, модели HD 7850 и HD 7870 всё-таки отличаются. Старшая Radeon HD 7870 имеет более высокое энергопотребление, поэтому нуждается в двух дополнительных 6-штырьковых разъёмах питания, а HD 7850 довольствуется лишь одним из них. Обе платы имеют двухслотовый дизайн системы охлаждения, но большинство производителей выпускают платы с собственным дизайном как минимум кулера, а то ещё и печатной платы.

Архитектурные особенности семейства Radeon HD 7800

Выше по тексту мы тщательнейшим образом описали все особенности новой архитектуры Graphics Core Next (GCN), поэтому повторим лишь самое важное. Все новые графические процессоры компании предлагают отличные возможности и производительность уже не только при обработке графики, но и в неграфических вычислениях, в том числе и смеси разных типов вычислений. Также, новая архитектура GCN предлагает серьёзное упрощение задач по оптимизации кода, упрощение разработки и поддержки, а также стабильную и предсказуемую производительность и в целом — достаточно высокую эффективность.

Базовым блоком новой архитектуры является блок GCN, и из них собраны все графические процессоры серии Southern Islands. Рассмотрим блок-схему чипа Pitcairn:

На схеме показан графический процессор Radeon HD 7870 («упрощённый» HD 7850 отличается от него несколькими отключенными блоками) мы видим 20 вычислительных блоков архитектуры GCN. В случае с младшим решением серии Radeon HD 7800 были отключены четыре из них, и количество активных блоков в нём равно 16. Это соответствует 1280 и 1024 потоковым процессорам, соответственно (точно как и в случае с семейством HD 7700, только блоков ровно вдвое больше). Так как каждый блок GCN имеет в своём составе по четыре текстурных блока, итоговая цифра количества TMU для старшей модели составляет 80 блоков TMU, а для младшей — 64 TMU.

А вот число блоков ROP и контроллеров памяти в HD 7870 и HD 7850 тоже не отличается, как и у решений самой младшей линейки. Количество блоков ROP оставили довольно высоким — по 32 штук для обеих моделей. Шина памяти у плат на базе Pitcairn урезана до 256-бит, она собрана из четырёх 64-битных каналов. Это неплохо для решения такого уровня, хотя и в полтора раза меньше, чем в топовой линейке, ведь шина памяти традиционно урезается первым делом. Хорошо, что применение быстрой GDDR5 памяти дало сравнительно высокую пропускную способность в 153 ГБ/с.

Как и остальные чипы архитектуры GCN, Pitcairn имеет в своём составе блок тесселятора 9-го поколения, отличающийся многочисленными оптимизациями по буферизации и кэшированию, позволяющий заметно повысить производительность обработки геометрии. Вот сравнение новой платы компании AMD с решением предыдущего поколения в синтетической задаче, по которому можно предположить рост скорости тесселяции вплоть до четырёхкратного:

Точно также поддерживается и множество технологий компании AMD, которые были внедрены и улучшены в новых видеочипах линейки Radeon HD 7000. Вот их неполный список: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, улучшения качества текстурной фильтрации и т.п. Обо всём этом подробнейше написано выше. Дополним список тем, что Radeon HD 7800 полностью поддерживает как улучшенный алгоритм сглаживания MLAA 2.0, так и сглаживание методом суперсэмплинга (SSAA).

Что касается сравнения производительности в играх, то Radeon HD 7870 значительно быстрее своего прямого конкурента GeForce GTX 570, особенно в условиях нехватки 1,25 ГБ видеопамяти у последнего (по сравнению с 2 ГБ у рассматриваемых решений), наблюдаемой в современных играх при высоком разрешении рендеринга. Младшую Radeon HD 7850 можно сравнить с GeForce GTX 560 Ti, и тут объёмом памяти ей уже не похвастать. Тем не менее, по замерам компании AMD, их новое решение всё же быстрее конкурирующего в большинстве игр.



Подробности: серия Radeon HD 7700

  • Кодовое имя чипа: «Cape Verde»
  • Технология производства: 28 нм
  • 1,5 млрд. транзисторов (меньше чем у Barts, который является основой серии Radeon HD 6800)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11.1, в том числе и шейдерной модели Shader Model 5.0
  • 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой памяти GDDR5
  • Частота ядра: до 1000 МГц (для Radeon HD 7770)
  • 10 вычислительных блоков GCN, включающих 40 SIMD-ядер, состоящих в целом из 640 ALU для расчётов с плавающей запятой (целочисленные и плавающие форматы, поддержка точности FP32 и FP64 в рамках стандарта IEEE 754)
  • 40 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 16 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 16 отсчетов за такт, а в режиме без цвета (Z only) — 64 отсчета за такт
  • Интегрированная поддержка до шести мониторов, включая HDMI 1.4a и DisplayPort 1.2

Спецификации видеокарты Radeon HD 7770

  • Частота ядра: 1000 МГц
  • Количество универсальных процессоров: 640
  • Количество текстурных блоков: 40, блоков блендинга: 16
  • Эффективная частота памяти: 4500 МГц (4×1125 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 1 гигабайт
  • Пропускная способность памяти: 72 гигабайта в сек.
  • Теоретическая максимальная скорость закраски: 16,0 гигапикселей в сек.
  • Теоретическая скорость выборки текстур: 40,0 гигатекселей в сек.
  • Один разъём CrossFire
  • Шина PCI Express 3.0
  • Разъёмы: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Энергопотребление: от 3 до 80 Вт
  • Один 6-контактный разъём питания
  • Двухслотовый дизайн
  • Рекомендованная цена для рынка США: $159

Спецификации видеокарты Radeon HD 7750

  • Частота ядра: 800 МГц
  • Количество универсальных процессоров: 512
  • Количество текстурных блоков: 32, блоков блендинга: 16
  • Эффективная частота памяти: 4500 МГц (4×1125 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 1 гигабайт
  • Пропускная способность памяти: 72 гигабайта в сек.
  • Теоретическая максимальная скорость закраски: 12,8 гигапикселей в сек.
  • Теоретическая скорость выборки текстур: 25,6 гигатекселей в сек.
  • Шина PCI Express 3.0
  • Разъёмы: DVI Dual Link, HDMI 1.4, один DisplayPort 1.2
  • Энергопотребление: от 3 до 55 Вт
  • Не требует дополнительного питания
  • Однослотовый дизайн
  • Рекомендованная цена для рынка США: $109

Недорогая серия видеокарт, основанная на архитектуре GCN, отличается от топовой и средней линеек второй цифрой в индексе: место 9 заняла цифра 7, как было и ранее. Radeon HD 7770 является более производительным решением, но есть и младшая модель — HD 7750. Старшая плата на момент выхода не имела прямых конкурентов на рынке, располагаясь где-то между GeForce GTX 560 и GTX 550 Ti, а младшая нацелена на борьбу с GTX 550 Ti. Для HD 7770 позднее был объявлен конкурент в лице GeForce GTX 560 SE (все решения NVIDIA основаны на старых GPU).

Обе рассматриваемые модели видеокарт AMD имеют GDDR5 память одинакового объёма в 1 гигабайт. Из-за использования 128-битной шины памяти на них можно было бы поставить и 2 ГБ, но такой объём GDDR5 памяти обойдётся слишком дорого для их ценового сегмента. Поэтому пока что вышли модели с таким объёмом, хотя в будущем возможен выход вариантов и с 2 ГБ видеопамяти. Пока же этот объём решили оставить для HD 7800.

По остальным потребительским характеристикам, модели HD 7750 и HD 7770 довольно сильно отличаются. Если старшая Radeon HD 7770 имеет двухслотовый дизайн системы охлаждения и её кулер закрыт пластмассовым кожухом как у старших решений, то младшая HD 7750 выглядит заметно проще, занимая один слот и имея простенький кулер. Впрочем, большинство производителей всё равно выпускают платы с собственным дизайном. Энергопотребление у новых моделей этого ценового диапазона также разное, старшая имеет один 6-контактный разъём дополнительного питания, а младшая обходится питанием, получаемым по PCI Express.

Архитектурные особенности Radeon HD 7700

Базовым блоком новой архитектуры является блок GCN, и из них собраны все графические процессоры серии. Каждый из имеющихся блоков GCN способен заниматься планированием и распределением команд сам, и один вычислительный блок может исполнять до 32 независимых потоков команд. Посмотрим на блок-схему чипа Cape Verde:

На схеме показан графический процессор Radeon HD 7770 («урезанный» HD 7750 отличается несколькими отключенными блоками) мы видим 10 вычислительных блоков архитектуры GCN. В случае с младшим решением серии Radeon HD 7700 было решено отключить два из них, и количество блоков стало равно 8. Это соответствует 640 и 512 потоковым процессорам. И так как каждый блок GCN имеет в своём составе по 4 текстурных блока, итоговая цифра количества TMU для старшей модели составляет 40 блоков TMU, а для младшей — 32 TMU.

Количество блоков ROP и контроллеров памяти в HD 7770 и HD 7750 не отличается, причём ROP решили не урезать слишком сильно, оставив их по 16 штук. А вот шина памяти у Cape Verde урезана до 128-бит, которая собрана из двух 64-битных каналов. В целом, это втрое меньше, чем в топовой серии, и мы увидели очередное подтверждение тому, что шина памяти традиционно урезается в недорогих чипах первым делом. Хотя применение быстрой GDDR5 памяти позволило оставить сравнительно высокую (для таких недорогих решений) пропускную способность в 72 ГБ/с.

Нам осталось отметить довольно большой объём кэш-памяти второго уровня — целых 512 килобайт (сравните с 768 КБ у топового чипа — видимо, кэш L2 не занимает на чипе слишком много места), а также улучшения в геометрической производительности. Как и топовый чип, Cape Verde имеет тесселятор 9-го поколения, отличающийся многочисленными оптимизациями по буферизации и кэшированию, что позволяет заметно повысить производительность обработки геометрии, по сравнению с серией Radeon HD 6000.

В общем, мы не будем повторять всю информацию о технологиях компании AMD, которые были внедрены и улучшены в новых видеочипах линейки Radeon HD 7000 (вот их неполный список: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, улучшения качества текстурной фильтрации и т.п.), обо всём этом подробнейше написано выше. Серия HD 7700 поддерживает все указанные там возможности, в том числе AMD Eyefinity 2.0 с шестью мониторами и стереорендерингом, а также имеет улучшенный блок декодирования и кодирования видеоданных.

Ну а как же самое главное — производительность в играх? Первые прикидки о скорости рендеринга всегда можно сделать из презентаций производителя. Компания AMD считает, что Radeon HD 7770 располагается где-то посередине между GeForce GTX 560 и GeForce GTX 550 Ti, соответственно и сравнивает её в своих материалах со второй моделью конкурента.

А вот Radeon HD 7750 они не сравнивают ни с чем, просто отмечая, что большинство современных игр играбельны на этой модели при максимальных настройках в FullHD разрешении. Впрочем, это и немудрено, так как последние годы ПК-эксклюзивов практически нет, а мультиплатформенные игры значительно менее требовательны. Так что платы серии Radeon HD 7700 отлично подойдут для нетребовательных пользователей.

Источник Семейства видеокарт AMD Radeon Справочная информация


RSS лента ВСЕГО блога с комментариями RSS лента ВСЕГО блога БЕЗ комментариев RSS лента этой КАТЕГОРИИ с комментариями RSS лента этой КАТЕГОРИИ и БЕЗ комментариев RSS лента ЭТОГО ПОСТА с комментариями к нему

Прыг: 01 02 03 04 05 06 07 08 09 10
Скок: 10 20 30 40

Анонсы статей по темам:

Оглавление категорий:

Сервисы:

апрель, 2018
пн вт ср чт пт сб вс
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            


Похожие ресурсы:

Copyright © 2009 Версия компьютеры
Сейчас 21 апреля 2018, 03:04
Система авторегистрации в каталогах, 
           статьи про раскрутку сайтов, web дизайн, flash, photoshop, хостинг, рассылки; форум, баннерная сеть, каталог сайтов, услуги 
           продвижения и рекламы сайтов

Рейтинг популярности - на эти заметки чаще всего ссылаются: