Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум сайта Футажик.Ру _ Комплектующие компьютера _ Процессор

Автор: ARDI 16.2.2010, 19:58

здесь всё о процессорах

Автор: VASYARU 21.2.2010, 22:59

Есть мысль и процессор,поменять.
Посоветуйте какой будет лучше,по категориям:цена,качество,удобство,и скорость обработки видеоданных.И хотя бы немножечко с перспективой,что бы он не стал отстойом через пол года.А то мне полтора года назад установили Пентиум 4 (3 ггц.).Да посравнениюс предидущим Целероном,2.6 он быстрея.Но читаю на форумах,когда спрашую,почему в Афтере,у меня так медленно,даже предосмотр работает,говорят-потому что процессор отстой. И с учетом что бы не менять материнку(Asus P5KPL-C,число гнёзд для ЦП1 LGA775,)И оптимальная оперативная память для предложенных процессоров.
Вот к примеру-хочеться Интел Сор 2 дуо Е8400 или Е8500,с частотоой от 3 Ггц.или Интел Кор 2 Квадр Кю 9505,с частотой 2,83 ггц.посоветуйте,что лучше для видеообработки,два ядра с частотой 3 Ггц или четыре но с 2.88 Ггц.И что бы поддерживал виртувльность.Или там еще включаються другие факторы(я где-то читал,тесты,но мне не очень там понятно).Опять же цена вопроса до 200-250 у.е И где в Киеве.можно купить?
Буду очень благодарен,за толковые советы.Так как сам,не очень селён в таких вопоосах,хотя пытаюсь вникать.

Автор: ARDI 23.2.2010, 7:01

двух головый камешек по 3 герца на голову или 4-х головый, но по 2,83 герца. а теперь смотри сюда:

Нажмите для просмотра скрытого текста

Сочетая революционную производительность процессора и усовершенствованные технологии энергосбережения, настольные ПК с процессорами семейства Intel® Core™2 позволяют выполнять больше задач за меньшее время и при этом сократить расходы на электроэнергию в среднем на 50%.№ Процессоры на базе уникальной 45-нанометровой производственной технологии Intel имеют отличную производительность и уникальные функции энергосбережения, благодаря которым ПК, созданные на их основе, соответствуют стандартам ENERGY STAR І. Благодаря этому обеспечивается уменьшение энергопотребления настольных ПК и сокращение расходов вашей компании на электроэнергию.

Информация о продукции

Чтобы узнать о дополнительных преимуществах модернизации, загрузите краткое описание продукции (PDF, 767 КБ)
Информация о номерах процессоровΔ

Характеристики и преимущества

Наивысший уровень производительности. Процессоры Intel® Core™2 Duo для настольных ПК включают в себя многочисленные технологии, обеспечивающие высочайшую производительность, в том числе до 6 МБ общей кэш-памяти 2 уровня и системную шину с частотой до 1333 МГц.

Добейтесь повышения производительности в многозадачных средах до 3 раз с многоядерными процессорами , в которых два независимых процессорных ядра объединены в одном корпусе.№ Оба ядра работают с одинаковой частотой и совместно используют до 6 МБ кэш-памяти 2 уровня и системную шину с частотой 1333 МГц, обеспечивающую реальный параллелизм вычислений.

Улучшите время исполнения и энергоэффективность благодаря обработке большего количества команд за один тактовый цикл с технологией Intel® Wide Dynamic Execution.

Добейтесь интеллектуальной и энергоэффективной производительности с технологией Intel® Intelligent Power Capability.

Повысьте производительность системы с технологией Intel® Smart Memory Access, оптимизирующей использование доступной для передачи данных пропускной способности.

Используйте более производительную и эффективную подсистему кэш-памяти на базе технологии Intel® Advanced Smart Cache , оптимизированную для многоядерных и двухъядерных процессоров.

Ускорьте выполнение целого ряда приложений, включая приложения обработки видео, речи, изображений и фотоснимков, шифрования, а также финансовые, технические и научные приложения, с помощью технологии Intel® Advanced Digital Media Boost.
Переходите на настольные ПК на базе процессора Intel® Core™2 Duo

№ Энергоэкономичность и производительность определялись посредством измерения производительности процессора и общего энергопотребления системы на уровне розетки во время работы теста SYSmark* 2007. Для сравнения были использованы настольные ПК на базе процессора Intel® Core™2 Duo E8500 и условный настольный ПК на базе процессора Intel® Pentium® 4 630 с аналогичной тактовой частотой. При сравнении ноутбуков были использованы ноутбук на базе процессора Intel® Centrino® 2 P8600 и условный ноутбук на базе процессора Intel® Core™ Duo T2700 с аналогичной тактовой частотой. Информацию об энергоэкономичности и производительности можно найти на сайте http://intelcapabilitiesforum.net/eep/ . Конфигурации настольных ПК - процессор Intel® Core™2 Duo E8500 (6 МБ кэш-памяти, тактовая частота 3,16 ГГц, частота системной шины 1333 МГц) на системной плате DQ45CB с набором микросхем Intel® Q45 Express, 2 ГБ двухканальной памяти DS Micron (2x1 ГБ) DDR2-800 5-5-5-18 с графической системой Intel GMA 4500 и жестким диском Seagate, 320 ГБ, NCQ SATA2 (BIOS: 0059 графическая система: 15.9.9.1591). Процессор Pentium® 4 630 с технологией HT (2 МБ кэш-памяти, тактовая частота 3,00 ГГц, частота системной шины 800 МГц) на системной плате Intel® D945GCL для настольных ПК с 1 ГБ двухканальной памяти DS Micron (2x512 МБ) DDR2-667 5-5-5-15 с интегрированной графической системой 945G и жестким диском Seagate, 320 ГБ, NCQ SATA2 (INF: 8.4.0.1016, графическая система: 15.6.1.1437. Конфигурации мобильных ПК – Процессор Intel® Core™2 Duo Р8600 (3 МБ кэш-памяти, тактовая частота 2,40 ГГц, частота системной шины 1066 МГц), Lenovo* T400 с набором микросхем Intel® GM45 Express, 2 ГБ двухканальной памяти Elpida* (2x1 ГБ) DDR2-800 5-5-5-12 с интегрированной графической системой GMA 4500MHD и жестким диском Hitachi*, 200 ГБ, SATA (BIOS: Lenovo 7UET45WW, INF: 8.0.7, графическая система: 7.15.0010.1502). Процессор Intel® Core™ Duo T2700 (2 МБ кэш-памяти, тактовая частота 2,33 ГГц, частота системной шины 667 МГц), Lenovo T60 с набором микросхем Intel® 945GM Express, 2 ГБ двухканальной памяти Micron (2x1 ГБ) DDR2-667 5-5-5-12 с интегрированной графической системой GMA950 и жестким диском Hitachi* SATA, 100 ГБ (BIOS: Lenovo 79ETE1WW, INF: 8.1.1.1010, графическая система: 7.14.0010.1329)

І ENERGY STAR* - это обозначение энергетической спецификации системного уровня, установленное Агентством по защите окружающей среды (США) и указывающее на соответствие данной спецификации всех компонентов системы, в том числе процессора, набора микросхем, блока питания, жесткого диска, видеоконтроллера и памяти. Более подробную информацию можно найти по адресу www.energystar.gov/index.cfm?fuseaction= find_a_product.showProductGroup&pgw_code=CO .

Δ Номерные обозначения процессоров Intel® не являются показателем производительности. Номера процессоров указывают на различия характеристик процессоров в пределах семейства, а не на различия между семействами процессоров. Дополнительную информацию можно найти на странице www.intel.com/products/processor_number/rus/.

а более подробно смотри здесь http://processorfinder.intel.com/Default.aspx
и плюс нужно учитывать системные требования используемого софта, а именно инструкции поддерживаемые процессором(MMX, SSE, SSE2 и т.д.)

Нажмите для просмотра скрытого текста

SSE
[править]
Материал из Википедии — свободной энциклопедии

SSE (англ. Streaming SIMD Extensions, потоковое SIMD-расширение процессора) — это SIMD (англ. Single Instruction, Multiple Data, Одна инструкция — множество данных) набор инструкций, разработанный Intel и впервые представленный в процессорах серии Pentium III как ответ на аналогичный набор инструкций 3DNow! от AMD, который был представлен годом раньше. Первоначально названием этих инструкций было KNI, что расшифровывалось как Katmai New Instructions (Katmai — название первой версии ядра процессора Pentium III).

Технология SSE позволяла преодолеть 2 основные проблемы MMX — при использовании MMX невозможно было одновременно использовать инструкции сопроцессора, так как его регистры использовались для MMX и работы с вещественными числами.

SSE включает в архитектуру процессора восемь 128-битных регистров (xmm0 до xmm7), каждый из которых трактуется как 4 последовательных значения с плавающей точкой одинарной точности. SSE включает в себя набор инструкций, который производит операции со скалярными и упакованными типами данных.

Преимущество в производительности достигается в том случае, когда необходимо произвести одну и ту же последовательность действий над разными данными.

Реализация блоков SIMD осуществляется распараллеливанием вычислительного процесса между данными, то есть, когда через один блок проходит поочерёдно множество потоков данных.Содержание [убрать]
1 Новое в SSE
2 Регистры
3 SSE-команды
4 Пример
5 См. также
6 Внешние ссылки

[править]
Новое в SSE
Восемь 128-битных регистров XMM.
32-битный MXCSR регистр флагов.
128-битный запакованный одинарной точности с плавающей точкой тип данных (т. е. 4 числа с плавающей точкой).
Инструкции над вещественными числами одинарной точности, а также расширился набор SIMD операции над целыми числами.
Инструкции чтобы сохранять и загружать состояние регистра MXCSR.
Инструкции явной предвыборки данных, контроля кэширования данных и контроля порядка операций сохранения.
Расширения инструкции CPUID. Используется для получения информации о процессоре. С её помощью программа может определить тип центрального процессора и его возможности (например, какие расширения поддерживаются процессором).
[править]
Регистры

В SSE добавлены восемь 128-битных регистров, которые называются xmm0..xmm7.

Каждый регистр может содержать:
Четыре 32-битных значений с плавающей точкой одинарной точности
Два 64-битных значения с плавающей точкой двойной точности
Два 64-битных целых числа
Четыре 32-битных целых числа
Восемь 16-битных целых чисел
Шестнадцать 8-битных целых чисел или символов
[править]
SSE-команды

Команды над числами с плавающей точкой
Команды пересылки
Скалярные типы – MOVSS
Упакованные типы – MOVAPS, MOVUPS, MOVLPS, MOVHPS, MOVLHPS, MOVHLPS
Арифметические команды
Скалярные типы – ADDSS, SUBSS, MULSS, DIVSS, RCPSS, SQRTSS, MAXSS, MINSS, RSQRTSS
Упакованные типы – ADDPS, SUBPS, MULPS, DIVPS, RCPPS, SQRTPS, MAXPS, MINPS, RSQRTPS
Команды сравнения
Скалярные типы – CMPSS, COMISS, UCOMISS
Упакованные типы – CMPPS
Перемешивание и распаковка
Упакованные типы – SHUFPS, UNPCKHPS, UNPCKLPS
Команды для преобразования типов
Скалярные типы – CVTSI2SS, CVTSS2SI, CVTTSS2SI
Упакованные типы – CVTPI2PS, CVTPS2PI, CVTTPS2PI
Битовые логические операции
Упакованные типы – ANDPS, ORPS, XORPS, ANDNPS

Команды над целых чисел
Арифметические команды
PMULHUW, PSADBW, PAVGB, PAVGW, PMAXUB, PMINUB, PMAXSW, PMINSW
Команды пересылки
PEXTRW, PINSRW
Другие
PMOVMSKB, PSHUFW

Другие команды
MXCSR-управление
LDMXCSR, STMXCSR
Управление Кешом и памятью
MOVNTQ, MOVNTPS, MASKMOVQ, PREFETCH0, PREFETCH1, PREFETCH2, PREFETCHNTA, SFENCE

[править]
Пример

Следующий пример демонстрирует перемножение четырёх пар чисел с плавающей точкой одной инструкцией mulps: (Программа написана на языке ANSI C++ с использованием ассемблерной вставки __asm и инструкций ассемблера для работы с SSE)
float a[4] = { 300.0, 4.0, 4.0, 12.0 };
float b[4] = { 1.5, 2.5, 3.5, 4.5 };

__asm {
movups xmm0, a ; // поместить 4 переменные с плавающей точкой из a в регистр xmm0
movups xmm1, b ; // поместить 4 переменные с плавающей точкой из b в регистр xmm1

mulps xmm1, xmm0 ; // перемножить пакеты плавающих точек: xmm1=xmm1*xmm0
; // xmm10 = xmm10*xmm00
; // xmm11 = xmm11*xmm01
; // xmm12 = xmm12*xmm02
; // xmm13 = xmm13*xmm03

movups a, xmm1 ; // выгрузить результаты из регистра xmm1 по адресам a
};

Материал из Википедии — свободной энциклопедии

3DNow! — дополнительное расширение MMX для процессоров AMD, начиная с AMD K6 3D. Причиной создания 3DNow! послужило стремление завоевать превосходство над процессорами производства компании Intel в области обработки мультимедийных данных.

Технология 3DNow! ввела 21 новую команду процессора и возможность оперировать 32-битными вещественными типами в стандартных MMX-регистрах. Также были добавлены специальные инструкции, оптимизирующие переключение в режим MMX/3DNow! (femms, которая заменяла стандартную инструкцию emms) и работу с кэшем процессора. Таким образом технология 3DNow! расширяла возможности технологии MMX, не требуя введения новых режимов работы процессора и новых регистров.
[править]
Проверка поддержки 3DNow! процессором

Перед началом работы с расширением 3DNow! следует убедиться, что ЦП их поддерживает. Для этого используется инструкция CPUID. Общий порядок действий при проверке выглядит следующим образом:
Убедиться, что процессор поддерживает инструкцию CPUID. Если нет, то ЦП не поддерживает и 3DNow!.
Выполнить инструкцию cpuid со значением EAX = 0 — это необходимо для следующего шага.
Выполнить CPUID со значением EAX = 80000000h. Если после выполнения инструкции в EAX будет значение меньше 1, то 3DNow! не поддерживается.
Выполнить CPUID с EAX = 80000001h. Если после выполнения бит 31 регистра EDX будет установлен в 1, то 3DNow! поддерживается. Иначе — нет.
[править]
Инструкции 3DNow!
PAVGUSB — вычисление среднего 8-битовых целых значений
PI2FD — перевод 32-битных целых в вещественные числа
PF2ID — перевод вещественных в 32-битные целые числа
PFCMPGE — сравнение вещественных чисел, больше или равно
PFCMPGT — сравнение вещественных чисел, больше
PFCMPEQ — сравнение вещественных чисел, равно
PFACC — накопление суммы вещественных чисел
PFADD — сложение вещественных чисел
PFSUB — вычитание вещественных чисел
PFSUBR — обратное вычитание вещественных чисел
PFMIN — нахождение минимума вещественных чисел
PFMAX — нахождение максимума вещественных чисел
PFMUL — умножение вещественных чисел
PFRCP — нахождение приближённого значения обратного (1/x) вещественных чисел
PFRSQRT — нахождение приближённого значения обратного от квадратного корня (1/sqrt(x)) вещественных чисел
PFRCPIT1 — первый шаг вычисления значения обратного (1/x) вещественных чисел
PFRSQIT1 — первый шаг вычисления значения обратного от квадратного корня (1/sqrt(x)) вещественных чисел
PFRCPIT2 — второй шаr вычисления значения обратного или обратного от квадратного корня вещественных чисел
PMULHRW — умножение 16-битных целых чисел с округлением
FEMMS — быстрое переключение состояния FPU/MMX
PREFETCH/PREFETCHW — предвыборка строки кэша процессора из памяти

MMX (Multimedia Extensions — мультимедийные расширения) — коммерческое название дополнительного набора инструкций, выполняющих характерные для процессов кодирования/декодирования потоковых аудио/видео данных действия за одну машинную инструкцию. Впервые появился в процессорах Pentium MMX. Разработан в лаборатории Intel в Хайфе, Израиль, в первой половине 1990-х.Содержание [убрать]

Регистры MMX

Расширение MMX включает в себя восемь 64-битных регистров общего пользования MM0—MM7. Для совместимости со способами сохранения состояния процессора в существующих ОС Intel была вынуждена объединить в программной модели процессора восемь регистров MMX с мантиссами восьми регистров FPU (Математический сопроцессор). Аппаратно это могут быть разные устройства, но с точки зрения программиста - это одни и те же регистры. Таким образом, нельзя одновременно пользоваться командами Математического сопроцессора и MMX.

Типы данных MMX

Команды технологии MMX работают с 64-разрядными целочисленными данными, а также с данными, упакованными в группы (векторы) общей длиной 64 бита. Такие данные могут находиться в памяти или в восьми MMX-регистрах.

Команды технологии MMX работают со следующими типами данных:
упакованные байты (восемь байтов в одном 64-разрядном регистре) (англ. packed byte);
упакованные слова (четыре 16-разрядных слова в 64-разрядном регистре) (packed word);
упакованные двойные слова (два 32-разрядных слова в 64-разрядном регистре) (packed doubleword);
64-разрядные слова (quadword).

Синтаксис

MMX-команды имеют следующий синтаксис: instruction [dest, src] Здесь instruction — имя команды, dest обозначает выходной операнд, src — входной операнд.

В систему команд введено 57 дополнительных инструкций для одновременной обработки нескольких единиц данных. Большинство команд имеют суффикс, который определяет тип данных и используемую арифметику:
US (unsigned saturation) — арифметика с насыщением, данные без знака.
S или SS (signed saturation) — арифметика с насыщением, данные со знаком. Если в суффиксе нет ни S, ни SS, используется циклическая арифметика (wraparound).
B, W, D, Q указывают тип данных. Если в суффиксе есть две из этих букв, первая соответствует входному операнду, а вторая — выходному.

Новые инструкции включают следующие группы:
Команды пересылки данных (Data Transfer Instructions) между регистрами MMX и целочисленными регистрами и памятью;
Команды преобразования типов
Арифметические операции (Arithmetic Instructions), включающие сложение и вычитание в разных режимах, умножение и комбинацию умножения и сложения;
Команды сравнения (Comparison Instructions) элементов данных на равенство или по величине;
Логические операции (Logical Instructions)- И,И-НЕ,ИЛИ и Исключающие ИЛИ, выполняемые над 64 битными операндами;
Сдвиговые операции (Shift Instructions) логические и арифметические;
Команды управления состоянием (Empty MMX State) очистка MMX - установка признаков пустых регистров в слове тегов.

Инструкции MMX не влияют на флаги условий. Регистры MMX, в отличие от регистров FPU, адресуются физически, а не относительно TOS. Любая инструкция MMX обнуляет поле TOS регистра состояния FPU. Инструкции MMX доступны из любого режима процессора.

SSE2 (англ. Streaming SIMD Extensions 2, потоковое SIMD-расширение процессора) — это SIMD (англ. Single Instruction, Multiple Data, Одна инструкция — множество данных) набор инструкций, разработанный Intel, и впервые представленный в процессорах серии Pentium 4. SSE2 расширяет набор инструкций SSE с целью полностью вытеснить MMX. SSE2 добавила 144 новых команд к SSE, в котором было только 70 команд.
[править]
Особенности
SSE2 использует восемь 128-битных регистров (xmm0 до xmm7), включённых в архитектуру x86 с вводом расширения SSE, каждый из которых трактуется как 2 последовательных значения с плавающей точкой двойной точности.
SSE2 включает в себя набор инструкций, который производит операции со скалярными и упакованными типами данных.
SSE2 содержит инструкции для потоковой обработки целочисленных данных в тех же 128-битных xmm регистрах, что делает это расширение более предпочтительным для целочисленных вычислений, нежели использование набора инструкций MMX, появившегося гораздо раньше.
SSE2 включает в себя две части – продолжение SSE и продолжение MMX.
Продолжение SSE работает с вещественными числами.
продолжение MMX работает с целыми. В SSE2 регистры по сравнению с MMX удвоились (64 бита -> 128 битов). Т.к. скорость выполнения инструкций не изменилась, при оптимизации под SSE2 программа получает двукратный прирост производительности. Если программа уже была оптимизирована под MMX, то оптимизация под SSE2 даётся сравнительно легко в силу сходности системы команд.
SSE2 включает в себя ряд команд управления кэшем, предназначенных для минимизации загрязнения кэша при обработке неопределенных потоков информации.
SSE2 включает в себя сложные дополнения к командам преобразования чисел

SSE3 (PNI — Prescott New Instruction) — третья версия SIMD-расширения Intel, потомок SSE, SSE2 и MMX. Впервые представлено 2 февраля 2004 года в ядре Prescott процессора Pentium 4. В 2005 AMD предложила свою реализацию SSE3 для процессоров Athlon 64 (ядра Venice, San Diego и Newark).

Набор SSE3 содержит 13 инструкций: FISTTP (x87), MOVSLDUP (SSE), MOVSHDUP (SSE), MOVDDUP (SSE2), LDDQU (SSE/SSE2), ADDSUBPD (SSE), ADDSUBPD (SSE2), HADDPS (SSE), HSUBPS (SSE), HADDPD (SSE2), HSUBPD (SSE2), MONITOR (нет аналога в SSE3 для AMD), MWAIT (нет аналога в SSE3 для AMD).

Наиболее заметное изменение - возможность горизонтальной работы с регистрами. Если говорить более конкретно, добавлены команды сложения и вычитания нескольких значений, хранящихся в одном регистре. Эти команды упростили ряд DSP и 3D-операций. Существует также новая команда для преобразования значений с плавающей точкой в целые без необходимости вносить изменения в глобальном режиме округления.Содержание [убрать]

Инструкции SSE3
ADDSUBPD (Add Subtract Packed Double).
ADDSUBPS (Add Subtract Packed Single).
HADDPD (Horizontal Add Packed Double).
HADDPS (Horizontal Add Packed Single).
HSUBPD (Horizontal Subtract Packed Double).
HSUBPS (Horizontal Subtract Packed Single).
FISTTP — преобразование вещественного числа в целое с сохранением целочисленного значения и округлением в сторону нуля.
LDDQU — загрузка 128bit невыровненных данных из памяти в регистр xmm, с предотвращением пересечения границы строки кеша.

Процессоры с поддержкой SSE3
AMD:
Athlon 64 (начиная с Venice Stepping E3 и San Diego Stepping E4)
Athlon 64 X2
Athlon 64 FX (since San Diego Stepping E4)
Opteron (начиная с Stepping E4)
Sempron (начиная с Palermo. Остановлено в E3)
Phenom
Phenom II
Athlon II
Turion 64
Turion 64 X2
Intel:
Celeron D
Celeron 420, 430 and 440
Pentium 4 (начиная с Prescott)
Pentium D
Pentium Dual-Core
Pentium Extreme Edition (но НЕ Pentium 4 Extreme Edition)
Intel Core Duo
Intel Core Solo
Intel Core 2 Duo
Intel Core 2 Extreme
Intel Core 2 Quad
Xeon (начиная с Nocona)
Atom
Intel Core i5
Intel Core i7
VIA/Centaur:
C7
Nano
Transmeta
Efficeon TM88xx (NOT Model Numbers TM86xx)

SSE4 - новый набор команд микроархитектуры Intel Core, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD)[1].

Он был анонсирован 27 сентября 2006 года, однако детальное описание стало доступно только весной 2007 года. Более подробное описание новых возможностей процессоров для программистов можно найти на сайте Intel.

SSE4 состоит из 54 инструкций, 47 из них относят к SSE4.1 (они есть в процессорах Penryn). Полный набор команд (SSE4.1 и SSE4.2, то есть 47 + оставшиеся 7 команд) доступен только в процессорах Intel с микроархитектурой Nehalem, которые были выпущены в середине ноября 2008 года. Ни одна из SSE4 инструкций не работает с 64-х битными mmx регистрами (только с 128-ми битными xmm0-15).

Компилятор языка Си от Intel начиная с версии 10 генерирует инструкции SSE4 при задании опции -QxS. Компилятор Sun Studio от Sun Microsystems с версии 12 update 1 генерирует инструкции SSE4 с помощью опций -xarch=sse4_1 (SSE4.1) и -xarch=sse4_2 (SSE4.2)[2].Содержание [убрать]

Изменения

Добавлены инструкции, ускоряющие компенсацию движения в видеокодеках, быстрое чтение из USWC памяти, множество инструкций для упрощения векторизации программ компиляторами. Кроме того, в SSE4.2 добавлены инструкции обработки строк 8/16 битных символов, вычисления CRC32, popcnt. Впервые в SSE4 регистр xmm0 стал использоваться как неявный аргумент для некоторых инструкций.
[править]
Новые инструкции SSE4.1
[править]
Ускорение видео
MPSADBW xmm1, xmm2/m128, imm8 — (Multiple Packed Sums of Absolute Difference)
Input — { A0, A1,… A14 }, { B0, B1,… B15 }, Shiftmode
Output — { SAD0, SAD1, SAD2,… SAD7 }

Вычисление восьми сумм абсолютных значений разностей (SAD) смещённых 4-х байтных беззнаковых групп. Расположение операндов для 16-ти битных SAD определяется 3-мя битами непосредственного аргумента imm8.
s1 = imm8[2]*4
s2 = imm8[1:0]*4
SAD0 = |A(s1+0)-B(s2+0)| + |A(s1+1)-B(s2+1)| + |A(s1+2)-B(s2+2)| + |A(s1+3)-B(s2+3)|
SAD1 = |A(s1+1)-B(s2+0)| + |A(s1+2)-B(s2+1)| + |A(s1+3)-B(s2+2)| + |A(s1+4)-B(s2+3)|
SAD2 = |A(s1+2)-B(s2+0)| + |A(s1+3)-B(s2+1)| + |A(s1+4)-B(s2+2)| + |A(s1+5)-B(s2+3)|
...
SAD7 = |A(s1+7)-B(s2+0)| + |A(s1+8)-B(s2+1)| + |A(s1+9)-B(s2+2)| + |A(s1+10)-B(s2+3)|
PHMINPOSUW xmm1, xmm2/m128 — (Packed Horizontal Word Minimum)
Input — { A0, A1,… A7 }
Output — { MinVal, MinPos, 0, 0… }

Поиск среди 16-ти битных беззнаковых полей A0…A7 такого, который имеет минимальное значение (и позицию с меньшим номером, если таких полей несколько). Возвращается 16-ти битное значение и его позиция.
PMOV{SX,ZX}{B,W,D} xmm1, xmm2/m{64,32,16} — (Packed Move with Sign/Zero Extend)

Группа из 12-ти инструкций для расширения формата упакованных полей. Упакованные 8, 16, или 32-х битные поля из младшей части аргумента расширяются (со знаком или без) в 16, 32 или 64-х битные поля результата.
+-------------------------------------------------------+
| Входной формат: | |
+-----------------------------+ Результирующий формат: |
| 8 бит | 16 бит | 32 бита | |
+-----------------------------+-------------------------+
| PMOVSXBW | |
| PMOVZXBW | 16 бит |
+-----------------------------+-------------------------+
| PMOVSXBD PMOVSXWD | |
| PMOVZXBD PMOVZXWD | 32 бита |
+-----------------------------+-------------------------+
| PMOVSXBD PMOVSXWD PMOVSXWQ | |
| PMOVZXBD PMOVZXWD PMOVZXWQ | 64 бита |
+-----------------------------+-------------------------+

Векторные примитивы
P{MIN,MAX}{SB,UW,SD,UD} xmm1, xmm2/m128 — (Minimum/Maximum of Packed Signed/Unsigned Byte/Word/DWord Integers)

Каждое поле результата есть минимальное/максимальное значение соответствующих полей двух аргументов. Байтовые поля рассматриваются только как числа со знаком, 16-ти битные — только как числа без знака. Для 32-х битных упакованных полей предусмотрен вариант как со знаком, так и без.
PMULDQ xmm1, xmm2/m128 — (Multiply Packed Signed Dword Integers)
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B2 }
Output — { A0*B0, A2*B2 }

Перемножение 32-х битных полей со знаком с выдачей полных 64-х бит результата (две операции умножения над 0 и 2 полями аргументов).
PMULLD xmm1, xmm2/m128 — (Multiply Packed Signed Dword Integers and Store Low Result)
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B2 }
Output — { low32(A0*B0), low32(A1*B1), low32(A2*B2), low32(A3*B3) }

Перемножение 32-х битных полей со знаком с выдачей младших 32-х бит результатов (четыре операции умножения над всеми полями аргументов).
PACKUSDW xmm1, xmm2/m128 — (Pack with Unsigned Saturation)

Упаковка 32-х битных полей со знаком в 16-ти битные поля без знака с насыщением.
PCMPEQQ xmm1, xmm2/m128 — (Compare Packed Qword Data for Equal)

Проверка 64-х битных полей на равенство и выдача 64-х битных масок.
[править]
Вставки/извлечения
INSERTPS xmm1, xmm2/m32, imm8 — (Insert Packed Single Precision Floating-Point Value)

Вставка 32-х битного поля из xmm2 (возможно выбрать любой из 4 полей этого регистра) или из 32-х битной ячейки памяти в произвольное поле результата. Кроме того, для каждого из полей результата можно задать сброс его в +0.0.
EXTRACTPS r/m32, xmm, imm8 — (Extract Packed Single Precision Floating-Point Value)

Извлечение 32-х битного поля из xmm регистра, номер поля указывается в младших 2 битах imm8. Если в качестве результата указан 64-х битный регистр, то его старшие 32 бита сбрасываются (расширение без знака).
PINSR{B,D,Q} xmm, r/m*, imm8 — (Insert Byte/Dword/Qword)

Вставка 8, 32, или 64-х битного значения в указанное поле xmm регистра (остальные поля не изменяются).
PEXTR{B,W,D,Q} r/m*, xmm, imm8 — (Extract Byte/Word/Dword/Qword)

Извлечение 8, 16, 32, 64 битного поля из указанного в imm8 поля xmm регистра. Если в качестве результата указан регистр, то его старшая часть сбрасывается (расширение без знака).

Скалярное умножение векторов
DPPS xmm1, xmm2/m128, imm8 — (Dot Product of Packed Single Precision Floating-Point Values)
DPPD xmm1, xmm2/m128, imm8 — (Dot Product of Packed Double Precision Floating-Point Values)

Скалярное умножение векторов (dot product) 32/64 битных полей. Посредством битовой маски в imm8 указывается, какие произведения полей должны суммироваться и что следует прописать в каждое поле результата: сумму указанных произведений или +0.0.
[править]
Смешивания
BLENDV{PS,PD} xmm1, xmm2/m128, <xmm0> — (Variable Blend Packed Single/Double Precision Floating-Point Values)

Выбор каждого 32/64-битного поля результата осуществляется в зависимости от знака такого же поля в неявном аргументе xmm0: либо из первого, либо из второго аргумента.
BLEND{PS,PD} xmm1, xmm2/m128, imm8 — (Blend Packed Single/Double Precision Floating-Point Values)

Битовая маска (4 или 2 бита) в imm8 указывает из какого аргумента следует взять каждое 32/64-битное поле результата.
PBLENDVB xmm1, xmm2/m128, <xmm0> — (Variable Blend Packed Bytes)

Выбор каждого байтового поля результата осуществляется в зависимости от знака байта такого же поля в неявном аргументе xmm0: либо из первого, либо из второго аргумента.
PBLENDW xmm1, xmm2/m128, imm8 — (Blend Packed Words)

Битовая маска (8 бит) в imm8 указывает из какого аргумента следует взять каждое 16-битное поле результата.

Проверки бит
PTEST xmm1, xmm2/m128 — (Logical Compare)

Установить флаг ZF, если только в xmm2/m128 все биты помеченные маской из xmm1 равны нулю. Если все не помеченные биты равны нулю, то установить флаг CF. Остальные флаги (AF, OF, PF, SF) всегда сбрасываются. Инструкция не модифицирует xmm1.
[править]
Округления
ROUND{PS, PD} xmm1, xmm2/m128, imm8 — (Round Packed Single/Double Precision Floating-Point Values)

Округление всех 32/64-х битных полей. Режим округления (4 варианта) выбирается либо из MXCSR.RC, либо задаётся непосредственно в imm8. Также можно подавить генерацию исключения потери точности.
ROUND{SS, SD} xmm1, xmm2/m128, imm8 — (Round Scalar Single/Double Precision Floating-Point Values)

Округление только младшего 32/64-х битного поля (остальные биты остаются неизменными).

Чтение WC памяти
MOVNTDQA xmm1, m128 — (Load Double Quadword Non-Temporal Aligned Hint)

Операция чтения, позволяющая ускорить (до 7.5 раз) работу с write-combining областями памяти.

Новые инструкции SSE4.2

Обработка строк

Эти инструкции выполняют арифметические сравнения между всеми возможными парами полей (64 или 256 сравнений!) из обоих строк, заданных содержимым xmm1 и xmm2/m128. Затем булевые результаты сравнений обрабатываются для получения нужных результатов. Непосредственный аргумент imm8 управляет размером (байтовые или unicode строки, до 16/8 элементов каждая), знаковостью полей (элементов строк), типом сравнения и интерпретацией результатов.

Ими можно производить в строке (области памяти) поиск символов из заданного набора или в заданных диапазонах. Можно сравнивать строки (области памяти) или производить поиск подстрок.

Все они оказывают влияние на флаги процессора: SF устанавливается если в xmm1 не полная строка, ZF — если в xmm2/m128 не полная строка, CF — если результат не нулевой, OF — если младший бит результата не нулевой. Флаги AF и PF сбрасываются.
PCMPESTRI <ecx>, xmm1, xmm2/m128, <eax>, <edx>, imm8 — ()

Явное задание размера строк в <eax>, <edx> (берётся абсолютная величина регистров с насыщение до 8/16, в зависимости от размера элементов строк. Результат в регистре ecx.
PCMPESTRM <xmm0>, xmm1, xmm2/m128, <eax>, <edx>, imm8 — ()

Явное задание размера строк в <eax>, <edx> (берётся абсолютная величина регистров с насыщение до 8/16, в зависимости от размера элементов строк. Результат в регистре xmm0.
PCMPISTRI <ecx>, xmm1, xmm2/m128, imm8 — ()

Неявное задание размера строк (производится поиск нулевых элементов к каждой из строк). Результат в регистре ecx.
PCMPISTRM <xmm0>, xmm1, xmm2/m128, imm8 — ()

Неявное задание размера строк (производится поиск нулевых элементов к каждой из строк). Результат в регистре xmm0.

Подсчет CRC32
CRC32 r32, r/m* — (Подсчет CRC32)

Накопление значения CRC-32C (другие обозначения CRC-32/ISCSI CRC-32/CASTAGNOLI) для 8, 16, 32 или 64 битного аргумента (используется полином 0x11EDC6F41).

Подсчет популяции единичных бит
POPCNT r, r/m* — (Return the Count of Number of Bits Set to 1)

Подсчет числа единичных битов. Три варианта инструкции: для 16, 32 и 64-х битных регистров. Также присутствует в SSE4A от AMD.

Векторные примитивы
PCMPGTQ xmm1, xmm2/m128 — (Compare Packed Qword Data for Greater Than)

Проверка 64-х битных полей на «больше чем» и выдача 64-х битных масок.

Процессоры с SSE4
Семейство Penryn процессоров Intel (ядра Wolfdale, Yorkfield и более новые)
Семейство Nehalem от Intel.

относится к работе с внутренней памятью процессора и выполнению арифметических операций. В SIMD компьютере управление выполняется контроллером, а "арифметика" отдана процессорным элементам.

SIMD процессоры называются также векторными.

SIMD-расширения, используемые в процессорах архитектуры x86
MMX — Multimedia Extensions. Коммерческое название дополнительного набора инструкций, выполняющих характерные для процессов кодирования/декодирования потоковых аудио/видео данных действия за одну машинную инструкцию. Впервые появился в процессорах Pentium MMX.
MMX Extended — расширенный набор инструкций MMX, используемый в процессорах AMD и Cyrix.
3DNow! — расширение набора команд MMX процессоров AMD, начиная с AMD K6-2.
3DNow! Extended — расширение набора команд 3DNow! процессоров AMD, начиная с AMD Athlon.
SSE — набор инструкций, разработанный Intel, и впервые представленный в процессорах серии Pentium III как ответ на аналогичный набор инструкций 3DNow! от AMD, который был представлен годом раньше.
SSE2 — набор инструкций, разработанный Intel, и впервые представленный в процессорах серии Pentium 4.
SSE3 — третья версия SIMD-расширения Intel, потомок SSE, SSE2 и x87. Представлен 2 февраля 2004 года в ядре Prescott процессора Pentium 4.
SSSE3 — набор SIMD-инструкций, используемый в процессорах Intel Core 2 Duo.
SSE4 — новая версия SIMD-расширения Intel. Анонсирован 27 сентября 2006 года. Представлен в 2007 году процессорах серии Penryn.
AVX — анонсированная версия SIMD-расширения Intel, которая будет представлена в 2010 году в процессорах архитектуры Sandy Bridge.

SISD (англ. Single Instruction, Single Data) или ОКОД (Одиночный поток Команд и Одиночный поток Данных) — архитектура компьютера, в которой один процессор выполняет один поток команд, оперируя одним потоком данных. Относится к фон-Неймановской архитектуре.

SISD компьютеры это обычные, "традиционные" последовательные компьютеры, в которых в каждый момент времени выполняется лишь одна операция над одним элементом данных (числовым или каким-либо другим значением). Большинство современных персональных ЭВМ, например, попадает именно в эту категорию. Иногда сюда относят и некоторые типы векторных компьютеров, это зависит от того, что понимать под потоком данных, но обсуждать эти детали здесь мы не будем.

Классификация параллельных архитектур по Флинну (M. Flynn)
Классификация по Флинну Одиночный поток команд
(Single Instruction) Множество потоков команд
(Multiple Instruction)
Одиночный поток данных
(Single Data) SISD MISD
Множество потоков данных
(Multiple Data) SIMD MIMD

ОКОД - Вычислительная система с одиночным потоком команд и одиночным потоком данных
(SISD, Single Instruction stream over a Single Data stream).
ОКМД - Вычислительная система с одиночным потоком команд и множественным потоком данных
(SIMD, Single Instruction, Multiple Data).
МКОД - Вычислительная система со множественным потоком команд и одиночным потоком данных
(MISD, Multiple Instruction Single Data).
МКМД - Вычислительная система со множественным потоком команд и множественным потоком данных
(MIMD, Multiple Instruction Multiple Data).

Типичными представителями SIMD являются векторные архитектуры. К классу MISD ряд исследователей относит конвейерные ЭВМ, однако это не нашло окончательного признания, поэтому можно считать, что реальных систем — представителей данного класса не существует. Класс MIMD включает в себя многопроцессорные системы, где процессоры обрабатывают множественные потоки данных. Отношение конкретных машин к конкретному классу сильно зависит от точки зрения исследователя. Так, конвейерные машины могут быть отнесены и к классу SISD (конвейер — единый процессор), и к классу SIMD (векторный поток данных с конвейерным процессором) и к классу MISD (множество процессоров конвейера обрабатывают один поток данных последовательно), и к классу MIMD — как выполнение последовательности различных команд (операций ступеней конвейера) на множественным скалярным потоком данных (вектором).

Суперскалярные и VLIW машины

Существуют два типа машин (процессоров), выдающих несколько команд за один такт: суперскалярные машины и VLIW-машины. Суперскалярные машины могут выдавать на выполнение в каждом такте переменное число команд, и работа их конвейеров может планироваться как статически с помощью компилятора, так и с помощью аппаратных средств динамической оптимизации. Суперскалярные машины используют параллелизм на уровне команд путем посылки нескольких команд из обычного потока команд в несколько функциональных устройств. Дополнительно, чтобы снять ограничения последовательного выполнения команд, эти машины используют механизмы внеочередной выдачи и внеочередного завершения команд, прогнозирование переходов, кэши целевых адресов переходов и условное (по предположению) выполнение команд. В отличие от суперскалярных машин, VLIW-машины выдают на выполнение фиксированное количество команд, которые сформатированы либо как одна большая команда, либо как пакет команд фиксированного формата. Планирование работы VLIW-машины всегда осуществляется компилятором. В типичной суперскалярной машине аппаратура может осуществлять выдачу от одной до восьми команд в одном такте. Обычно эти команды должны быть независимыми и удовлетворять некоторым ограничениям, например таким, что в каждом такте не может выдаваться более одной команды обращения к памяти. Если какая-либо команда в потоке команд является логически зависимой или не удовлетворяет критериям выдачи, на выполнение будут выданы только команды, предшествующие данной. Поэтому скорость выдачи команд в суперскалярных машинах является переменной. Это отличает их от VLIW-машин, в которых полную ответственность за формирование пакета команд, которые могут выдаваться одновременно, несет компилятор, а аппаратура в динамике не принимает никаких решений относительно выдачи нескольких команд. Использование VLIW приводит в большинстве случаев к быстрому заполнению небольшого объема внутрикристальной памяти командами NOP (no operation), которые предназначены для тех устройств, которые не будут задействованы в текущем цикле. В существующих VLIW разработках был найден большой недостаток, который был устранен делением длинных слов на более мелкие, параллельно поступающие к каждому устройству. Обработка множества команд независимыми устройствами одновременно является главной особенностью суперскалярной процессорной архитектуры.

Классификация Хокни (R. Hockney)

Классификация машин MIMD-архитектуры :
Переключаемые — с общей памятью и с распределённой памятью.
Конвейерные.
Сети — регулярные решётки, гиперкубы, иерархические структуры, изменяющие конфигурацию.

В класс конвейерных архитектур (по Хокни) попадают машины с одним конвейерным устройством обработки, работающим в режиме разделения времени для отдельных потоков. Машины, в которых каждый поток обрабатывается своим собственным устройством Хокни назвал переключаемыми. В класс переключаемых машин попадают машины, в которых возможна связь каждого процессора с каждым, реализуемая с помощью переключателей — машины с распределённой памятью. Если же память есть разделяемый ресурс, машина называется с общей памятью. При рассмотрении машин с сетевой структурой Хокни считал, что все они имеют распределённую память. Дальнейшую классификацию он проводил в соответствии с топологией сети.

Классификация Фенга (T. Feng)

В 1972 году Фенг предложил классифицировать вычислительные системы на основе двух простых характеристик. Первая — число n бит в машинном слове, обрабатываемых параллельно при выполнении машинных инструкций. Практически во всех современных компьютерах это число совпадает с длиной машинного слова. Вторая характеристика равна числу слов m, обрабатываемых одновременно данной ВС. Немного изменив терминологию, функционирование ВС можно представить как параллельную обработку n битовых слоёв, на каждом из которых независимо преобразуются m бит. Каждую вычислительную систему можно описать парой чисел (n, m). Произведение P = n x m определяет интегральную характеристику потенциала параллельности архитектуры, которую Фенг назвал максимальной степенью параллелизма ВС.

Параллельные системы также классифицируют по Хэндлеру (W. Handler), Шнайдеру (L.Snyder), Скилликорну (D. Skillicorn).

Классификация Скилликорна

Классификация Скилликорна (1989) была очередным расширением классификации Флинна. Архитектура любого компьютера в классификации Скилликорна рассматривается в виде комбинации четырёх абстрактных компонентов: процессоров команд (Instruction Processor — интерпретатор команд, может отсутствовать в системе), процессоров данных (Data Processor — преобразователь данных), иерархии памяти (Instruction Memory, Data Memory — память программ и данных), переключателей (связывающих процессоры и память). Переключатели бывают четырёх типов — «1-1» (связывают пару устройств), «n-n» (связывает каждое устройство из одного множества устройств с соответствующим ему устройством из другого множества, то есть фиксирует попарную связь), «n x n» (связь любого устройства одного множества с любым устройством другого множества). Классификация Скилликорна основывается на следующих восьми характеристиках:
Количество процессоров команд IP
Число ЗУ команд IM
Тип переключателя между IP и IM
Количество процессоров данных DP
Число ЗУ данных DM
Тип переключателя между DP и DM
Тип переключателя между IP и DP
Тип переключателя между DP и DP

Extended MMX, так же известное как EMMI (Extended Multi-Media Instructions), это расширение набора инструкций MMX, предложенное компанией Cyrix и внедрившей его в свои процессоры 6x86MX и MII. EMMI расширяет набор инструкций MMX 12-ю новыми командами, полезными при мультимедийной обработке. Это расширение не задействовано по умолчанию, и перед использованием требует включения с помощью BIOS или программно (требуется установить бит EMMX - CCR7 bit 0). EMMI никогда не пользовалось большой поддержкой со стороны производителей ПО или признанием конкурентов Cyrix (некоторые инструкции Intel SSE имеют такие же коды операций, что и инструкции EMMI, и не являются совместимыми с ними). Это расширение больше не включалось в набор инструкций процессоров, планирующихся к выходу после MII.

Набор инструкций EMMI включает команды[1]:
PADDSIW — Packed Add with Saturation, using Implied Destination
PAVEB — Packed Average
PDISTIB — Packed Distance and Accumulate with Implied Register
PMACHRIW — Packed Multiply and Accumulate with Rounding
PMAGW — Packed Magnitude
PMULHRW / PMULHRIW — Packed Multiply High with Rounding
PMVZB / PMVNZB / PMVLZB / PMVGEZB — Packed Conditional Move
PSUBSIW — Packed Subtract with Saturation, using Implied Destination

Supplemental Streaming SIMD Extension 3 (SSSE3) — это обозначение данное Intel’ом четвёртому расширению системы команд. Предыдущее имело обозначение SSE3 и Intel добавил ещё один символ 'S' вместо того, чтобы увеличить номер расширения, возможно потому, что они посчитали SSSE3 простым дополнением к SSE3. Часто, до того как стало использоваться официальное обозначение SSSE3, эти новые команды назывались SSE4. Также их называли кодовыми именами Tejas New Instructions (TNI) и Merom New Instructions (MNI) по названию процессоров, где впервые Intel намеревалась поддержать эти новые команды. Появившись в Intel Core Microarchitecture, SSSE3 доступно в сериях процессоров Xeon 5100 (Server и Workstation версии), а также в процессорах Intel Core 2 (Notebook и Desktop версии) и Intel Atom.

Новыми в SSSE3, по сравнению с SSE3, являются 16 уникальных команд, работающих с упакованными целыми. Каждая из них может работать как с 64-х битными (MMX), так и с 128-ми битными (XMM) регистрами, поэтому Intel в своих материалах ссылается на 32 новые команды.

Новые инструкции

Работа со знаком
PABSB, PABSW, PABSD — (Packed Absolute Value {Bytes/Words/DWords})
Input — { A0, A1… }
Output — { A0 * sign(A0), A1 * sign (A1)… }

Каждое поле результата есть абсолютная величина соответствующего поля из src1. Фактически это те же операции PSIGNB, PSIGNH, PSIGNW у которых оба аргумента один и тот же регистр.
PSIGNB, PSIGNW, PSIGND — (Packed Sign {Bytes/Words/DWords})
Input — { A0, A1… }, { B0, B1… }
Output — { A0 * sign(B0), A1 * sign (B1)… }

Каждое поле результата есть произведение поля из src1 на {-1,0,1} в зависимости от знака соответствующего поля в src2 (умножение на 0 когда поле в src2 равно нулю).

Сдвиги
PALIGNR — (Packed Align Right)
Input — { A0, A1 }, { B0, B1 }, imm8
Output — { B1_B0_A1_A0 >> (imm8 * 8) }

Два регистра операнда рассматривается как одно беззнаковое промежуточное значение удвоенной размерности из которого извлекается 64-х/128-х битное значение начиная с байта указанного в непосредственном аргументе-константе команды.

Перемешивание байт
PSHUFB — (Packed Shuffle Bytes)
Input — { A0, A1, A2,.. A7/A15 }, { B0, B1, B2,.. B7/B15 }
Output — { [AB0 AB1 AB2 …] }

Перестановка байт, каждый байт результата есть некоторый байт из первого аргумента определяемый по соответствующему байту из второго аргумента (если байт отрицательный, то в байт результат прописывается ноль, иначе используются младшие 3 или 4 бита как номер байта в первом аргументе).

Умножения
PMULHRSW — (Packed Multiply High with Round and Scale)
Input — { A0, A1… }, { B0, B1… }
Output — { A0 * B0, A1 * B1… }

Аргументы A и B рассматриваются как вектора 16-ти битных знаковых чисел с фиксированной запятой представленных в диапазоне [-1,+1) (то есть 0x4000 это 0.5, а 0xa000 это −0.75 и т. д.), которые перемножаются друг с другом с корректным округлением.
PMADDUBSW — (Multiply and Add Packed Signed and Unsigned Bytes)
Input — { A0, A1, A2, A3,.. }, { B0, B1, B2, B3,.. }
Output — { (A0*B0+A1*B1), (A2*B2+A3*B3), … }

Производится побайтное перемножение векторов A и B, промежуточные 16-ти битные результаты попарно складываются между собой с насыщением и выдаются как результат.

Горизонтальные сложения/вычитания целых
PHSUBW, PHSUBD — (Packed Horizontal Subtract (16-ти или 32-х битные поля))
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
Output — { A0-A1 A2-A3 … B0-B1 B2-B3 …}

Горизонтальное вычитание целых 16/32 битных полей.
PHSUBSW — (Packed Horizontal Subtract and Saturate Words (16-ти битные поля))
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
Output — { A0-A1 A2-A3 B0-B1 B2-B3 }

Горизонтальное вычитание целых 16 битных полей с насыщением.
PHADDW, PHADDD — (Packed Horizontal Add (16-ти или 32-х битные поля))
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
Output — { A0+A1 A2+A3 … B0+B1 B2+B3 …}

Горизонтальное сложение целых 16/32 битных полей.
PHADDSW — (Packed Horizontal Add and Saturate Words (16-ти битные поля))
Input — { A0, A1, A2, A3 }, { B0, B1, B2, B3 }
Output — { A0+A1 A2+A3 … B0+B1 B2+B3 …}

Горизонтальное сложение целых 16 битных полей с насыщением.

Процессоры поддерживающие SSSE3
Intel:
Xeon 5100 Series
Intel Core 2
Intel Celeron (ядро Conroe-L)
Intel Atom
Intel Dual Core

Advanced Vector Extensions (AVX) — расширение системы команд x86 для микропроцессоров Intel и AMD, предложенное Intel в марте 2008.[1]

AVX предоставляет различные улучшения, новые инструкции и новую схему кодирования машинных кодов.

Улучшения
Размер векторных регистров SIMD увеличивается с 128 (XMM) до 256 бит (регистры YMM0 — YMM15). Существующие 128-битные инструкции будут использовать младшую половину новых YMM регистров. В будущем возможно расширение до 512 или 1024 бит.
Неразрушающие операции. Набор инструкций AVX позволяет использовать любую двухоперандную инструкцию XMM в трёхоперандном виде без модификации двух регистров-источников, с отдельным регистром для результата. Например, вместо a = a + b можно использовать c = a + b, при этом регистр a остаётся неизменённым. AVX не поддерживает неразрушающие формы операций над обычными регистрами общего назначения, такими как EAX, но такая поддержка, возможно, будет добавлена в последующих расширениях.
Требования выравнивания данных для операндов SIMD в памяти ослаблены.

Новая схема кодирования
Основная статья: :en:VEX prefix

Новая система кодирования машинных кодов VEX предоставляет новый набор префиксов кода, которые расширяют пространство возможных машинных кодов. Добавлены инструкции с количеством операндов более трёх. Векторные регистры SIMD могут быть больше 128-ми бит.
Новые иструкцииИнструкция Описание
VBROADCASTSS, VBROADCASTSD, VBROADCASTF128 Копирует 32-х, 64-х или 128-ми битный операнд из памяти во все элементы векторного регистра XMM или YMM.
VINSERTF128 Замещает младшую или старшую половину 256-ти битного регистра YMM значением 128-ми битного операнда. Другая часть регистра-получателя не изменяется.
VEXTRACTF128 Извлекает младшую или страшую половину 256-ти битного регистра YMM и копирует в 128-ми битный операнд-назначение.
VMASKMOVPS, VMASKMOVPD Условно считывает любое количество элементов из векторного операнда из памяти в регистр-получатель, оставляя остальные элементы несчитанными и обнуляя соответствующие им элементы регистра-получателя. Также может условно записывать любое количество элементов из векторного регистра в векторный операнд в памяти, оставляя остальные элементы операнда памяти неизменёнными
VPERMILPS, VPERMILPD Переставляет 32-х или 64-х битные элементы вектора согласно операнду-селектору (из памяти или из регистра).
VPERM2F128 Переставляет 4 128-ми битных элемента двух 256-ти битных регистров в 256-ти битный операнд-назначение с использованием непосредственной константы (imm) в качестве селектора.
VZEROALL Обнуляет все YMM регистры и помечает их как неиспользуемые. Используется при переключении между 128-ми битным режимом и 256-ти битным.
VZEROUPPER Обнуляет старшие половины всех регистров YMM. Используется при переключении между 128-ми битным режимом и 256-ти битным.

Также в спецификации AVX описана группа инструкций PCLMUL (Parallel Carry-Less Multiplication, Parallel CLMUL)
PCLMULLQLQDQ xmmreg,xmmrm [rm: 66 0f 3a 44 /r 00]
PCLMULHQLQDQ xmmreg,xmmrm [rm: 66 0f 3a 44 /r 01]
PCLMULLQHQDQ xmmreg,xmmrm [rm: 66 0f 3a 44 /r 02]
PCLMULHQHQDQ xmmreg,xmmrm [rm: 66 0f 3a 44 /r 03]
PCLMULQDQ xmmreg,xmmrm,imm [rmi: 66 0f 3a 44 /r ib]

Применение

Подходит для интенсивных вычислений с плавающей точкой в мультимедиа, научных и финансовых задачах. Увеличивает степень параллелизма и пропускную способность в вещественных SIMD вычислениях. Уменьшает давление (нагрузку) на регистры благодаря неразрушающим трёхоперандным операциям.

Поддержка в операционных системах

Использование YMM регистров требует поддержки со стороны операционной системы. Следующие системы поддерживают регистры YMM:
Linux: с версии ядра 2.6.30,[2] released on June 9, 2009.[3]
Windows: Windows 7 и Windows Server 2008 R2 (без подтверждений)
BSD: ?
Mac OS X: ?

Микропроцессоры с AVX
Intel
Проектируемая микроархитектура Intel Sandy Bridge, 2010.[4]
AMD:
Планируемый процессор Bulldozer, 2011.[5]

Совместимость между реализациями Intel и AMD обсуждается в XOP instruction set.

Будущие расширения

Схема кодирования машинного кода VEX допускает дальнейшее расширение ширины регистров SIMD.

Различные планируемые дополнения системы команд x86:
AES
CLMUL
Intel FMA3
AMD FMA4
AMD XOP
AMD CVT16

Расширение системы команд AES (Advanced Encryption Standard) — расширение системы команд x86 для микропроцессоров, предложенное компанией Intel в марте 2008[1]. Целью данного расширения является ускорение приложений, использующий шифрование и дешифрование по алгоритму AES. Сходное расширение PadLock engine существует в микропроцессорах от VIA Technologies.

Новые инструкцииИнструкция Описание
AESENC Выполнить один раунд шифрования AES
AESENCLAST Выполнить последний раунд шифрования AES
AESDEC Выполнить один раунд расшифрования AES
AESDECLAST Выполнить последний раунд расшифрования AES
AESKEYGENASSIST Поспособствовать в генерации раундового ключа AES
AESIMC Inverse Mix Columns

Микропроцессоры с расширением команд AES
Intel
Intel Westmere (Nehalem на 32нм техпроцессе).
AMD:
Проектируемый Bulldozer, 2011[2].

См. также
AES
CLMUL instruction set
FMA3
FMA4
AVX
X86

Автор: VASYARU 23.2.2010, 10:15

Спасибо!Но что то я,как то я не все понял.Мне инересно,какой процессор оптимальней,для меня,так как денег лишних нет(в пределах 200 -250 у.е).
Что бы работать в Корел видеостудии х2 и х3,Адобе премьер и афтер, Улеад 3Д коол студио и тд.
Много информации которую я не понимаю,да и она ненужна в обычной жизни.Хочу услышить совет,оптимальный процессор,по цене и скорости обработки видео,а также по возможности немного с преспективой хотя бы на пол года.Именно-с шиной 775 и 1333 Мгц,и частотой 3 Ггц(двух и четырех ядерные).Кто имел возможность сравнить в действии такие процессоры,и может подсказать их вохможности в деле.
А вот инструкции поддерживаемые процессором(MMX, SSE, SSE2 и т.д.),то это мякго скажем,не все понятно.

Автор: ARDI 23.2.2010, 14:15

INTEL CORE2QUADRO

Автор: VASYARU 23.2.2010, 22:21

Все понял,спасибо еще раз!Хорошая нужная тема.Вот если бы и о принтерах кто-то дал совет(там в теме).

Автор: VASYARU 6.3.2010, 15:27

Приоборел процессор Intel Core 2 Quad Q9400(2,66).Конечно нельзя сравнить с моим Пентиумом 4(3 Ггц)
Хотя я думал,что 3 Ггц это лучше чем 2,66Ггц
Так как мой прошлый Селерон2,6 ни шёл ни в какое сравнение с Пентиумом.А тут такая разница!
Я советую всем кто стиоит перед выбором,смены процессора,обязательно берите тот,что четыер ядра и больше(хотя ничего не скажу за два,так как не пользовался им)
Сразу почуствуете себя властелином программ(а то я раньше,пока сведу и применю прилдварительный просмотр в афтере,пока скодирую в Кореле и тд. и тп.(вообщем медленно все было))
Вообщем хоть и цена его как,мой апгрейд всех внутренностей корпуса 2008 года,зато именно для работы с видеомонтажем,это сила!
Это мое субьективное мнение,человека,который купил,то что очень долго хотел.

А тепрь,хочу спросить:так как не все занимаються видеомонтажем,
за сколько можно продать мой старый Пентиум 4?Ведь всетаки 3 Ггц,для домашнего пользования,это нормально,я,так,думаю!

Автор: Yurchik 6.3.2010, 21:00

У нас есть раздел купли-продажи. Там и выставляй. А вообще цена 20% от первоначальной стоимости.

Автор: maded 30.3.2010, 12:15

Обнаружил разззгон Правда греемся. Какой лучше брать кулер?
Присматриваю:

http://www.scythe-eu.com/ru/produkcija/cpu-kulery/katana-3-ru.html; http://www.coolermaster-europe.com/product.php?product_id=2546 или http://www.coolermaster-europe.com/product.php?product_id=2546; http://www.deepcoolglobal.com/Product/ICEWING5_PRO/#.

Почти одна цена... кто может поделится опытом?

Автор: ARDI 31.3.2010, 12:01

судя по тех. характеристикам бери катана, не ошибёшся

Автор: cryin 30.5.2010, 16:25

Друзья-форумчане, помогите советом.
Исходные данные: материнка Asus M2-NE, процессор Athlon X2 4400, 2 планки оперативы по 1 ГБ 800 МГц. Работаю в основном в Premiere Pro 2 (монтаж HDV).

Хочу обновить проц на этот - Phenom II X2 555 Black Edition AM3 либо этот Phenom II X4 (925) либо 945 AM3. Вопрос - какой предпочесть в плане эффективности использования многоядерности, загрузит ли премьер 4 ядра, или лучше 2?
И еще, на офсайте ASUS написано, что данные процессоры поддерживаются, (хоть в мамке АМ2), но с оговоркой "Due to Bios ROM size limitation remove LAN PXE ROM and change Crashfree3 to Crashfree2". Что это такое и с чем его едят.
Спасибо.

Автор: ASDAVD 14.4.2011, 9:29

4ядерный проц на 775 сокет не дороже 6 т. можно http://www.dns-shop.ru/samara/price_detail.php?i=117767. Но вообще Вам лучше поменять всю платформу на 1155 соккет, либо ничего не трогать. Монтаж наверное и так достаточно быстро происходит на этой системе, а для кодирования вместо процессора лучше использовать видеокарту (намного быстрее)- у Вас как раз подходит для технологии CUDA. Программ позволяющих кодировать с помощью видеокарты масса, а если нужда есть и в редактировании и перекодировании (в том числе и с технологией CUDA)- тогда хорошим выбором будет Sony Vegas 10.

Автор: pilligrim1310 14.4.2011, 10:15

Цитата(kub05 @ 14.4.2011, 3:38)

Подскажите 4ядерный проц на 775 сокет не дороже 6 тыщ. У меня ша стоит 2Ядра коре е7500 есть ли смысл переходить. Я монтажом занимаюсь чисто для себя семьи. Ну и игры пара тройка любимых но пока не встречал игр для которых оптимальные требования не соответствовали моей системе.

Честно говоря ASDAVD уже подсказал,но хочется только добавить,переход с 2 ядер на 4,значительного прироста производительности не даст.Если уж что то менять,то менять всю платформу на i(i7,i5 самый минимум i3).Совсем другое дело,новая технология с интеграцией северного моста в проц,явно увеличивает производительность.Плюс возможность увеличения объёма оперативки вплоть до 16 Гб,естественно используя 64 битную систему.
Мое мнение солидарно с ASDAVD-либо оставлять всё как есть,либо менять всё координально на новое,конкретно на платформу i,хотя есть и другие варианты из AMD ряда продуктов,но всё же INTEL,есть INTEL.
Удачи!

Автор: Slavfilm 14.4.2011, 22:19

Цитата(okulval @ 31.3.2010, 17:38)

Утановил себе на проц Залман низкооборотистый максимально большой с медным теплоотводом .Работает очень тихо,и проц не греется.

Я поменял материнку ASUS P6T SE на asus sabertooth x58 - и тоже поставил Zalman CNPS10X Flex - очень доволен, но хотел Zalman CNPS10X Extreme с сервисе отговорили

Автор: SOFARIKS 10.8.2011, 0:16

Решил вот добавить пищу к размышлению о семействе i

Нажмите для просмотра скрытого текста

За краткой формулировкой «Intel представляет Sandy Bridge» скрывается «капитальное» обновление всего рынка процессоров. Модели в конструктиве LGA1155 придут на смену нынешним Core i3/i5/i7, а значит, попадут сразу в несколько сегментов: от доступного (mainstream) до производительного (enthusiast). Разумеется, не остались без внимания Intel и ноутбуки, для которых были разработаны модели процессоров с пониженным энергопотреблением. А для настольных компьютеров были представлены следующие модели процессоров:

Семейство Core i7

Intel Core i7-2600
Intel Core i7-2600K
Intel Core i7-2600S

Семейство Core i5

Intel Core i5-2500
Intel Core i5-2500K
Intel Core i5-2500S
Intel Core i5-2500T
Intel Core i5-2400
Intel Core i5-2400S
Intel Core i5-2390T
Intel Core i5-2300

Семейство Core i3

Intel Core i3-2120
Intel Core i3-2100
Intel Core i3-2100T

Итого целых 14 новых CPU. Самым обширным получилось семейство Core i5 – восемь процессоров, это объяснимо – специалисты Intel уделяют повышенное внимание «среднему классу». В старшей и младшей линейках Core i7 и Core i3 всего по три модели.

Обратите внимание на обилие буквенных обозначений: литеры K, T, S. Если не смотреть на эти буквы, в семействе Core i7 остается всего одна модель c индексом 2600, а линейка Core i5 сокращается до четырех процессоров 2500/2400/2390/2300. Кстати, четырехзначное числовое обозначение указывает на использование новой архитектуры Sandy Bridge, так что, несмотря на сохранение в названии процессоров привычного «Core i3/i5/i7», путаницы не возникает.

Еще один интересный факт – отсутствие среди перечисленных процессоров модели «Extreme». Это логично, ведь даже старшие Core i7-2600 являются четырехъядерными процессорами, в то время как нынешний флагман компании Intel – Core-i7-980X – это априори более производительный шестиядерный CPU.

Теперь самое время представить вашему вниманию подробную таблицу характеристик новых «настольных» процессоров Intel. В этом случае используется разделение по семействам, поскольку процессоров много, и в единой таблице получится «каша», неудобная для восприятия.

Получается очень логичный ряд моделей, где Core i7 четко отделены от Core i5: у старших четырехъядерных CPU есть поддержка Hyper Threading и увеличенный объем Cache-памяти. Разница в стоимости между этими семействами процессоров очень значительна. Если за i5-2300 просят $177, а за старший i5-2500 $205, то за Core i7-2600 придется заплатить уже почти $300. В целом ситуация напоминает таковую для платформы LGA1156, где также наблюдается большой ценовой разрыв между моделями Core-i5 и i7.

Уже упоминавшиеся буквенные обозначения указывают на модели с пониженным энергопотреблением (литеры S и T) и свободным множителем (K).

Семейство Core-i3 представляет собой двухъядерные CPU, один из таких процессоров есть и среди Core i5 – модель i5-2390T, но это скорее маркетинговый ход.

Помимо уменьшенного вдвое количества ядер, процессоры Core i3 отличаются от старших собратьев отсутствием поддержки технологии Turbo Boost. Уже хорошо знакомая по предыдущим поколениям процессоров Intel технология авторазгона была усовершенствована (специалисты Intel называют ее Turbo Boost 2.0). Теперь частоты ядер могут изменяться в более широких пределах, кроме того, для разгона при максимальной загрузке одного, двух и четырех ядер применяются собственные алгоритмы.

Система способна на некоторое время увеличивать частоту и напряжение питания ядер процессора, даже если при этом показатель TDP выходит за пределы, указанные производителем. При этом учитываются данные об энергопотреблении и температуре процессора.

Практика важнее теории, но некоторые ключевые особенности Sandy Bridge я упомяну, проиллюстрировав их слайдами из официальной презентации (предыдущее изображение также взято из этого источника).

Преемственность поколений в рамках стратегии «Tick-Tock» (поочередное обновление архитектуры и техпроцесса) продемонстрирована на следующем изображении:

Интересно, что Intel позиционирует четырехъядерные процессоры Sandy Bridge ниже, чем нынешние Bloomfield и Lynnfield, по крайней мере, так показано на схеме:

Новый 32-нм кристалл процессора включает в себя четыре вычислительных ядра, графическое ядро, контроллер памяти, и так называемый System Agent. Так обозначается блок, содержащий всю «обвязку» вычислительных ядер: двухканальный контроллер памяти DDR3, контроллеры PCI-Express 2.0, модуль управления питанием, блоки, отвечающие за вывод изображения в случае использования встроенного видеоядра и так далее.

Структура ядра:

Схематичное изображение с комментариями:

Все элементы ядра процессора связаны высокопроизводительной кольцевой шиной. Данное решение призвано повысить скорость обмена между компонентами ядра. Что немаловажно, эта технология позволяет легко наращивать количество вычислительных ядер CPU, попросту добавляя их в «кольцо». Шина не однородна, она разделена на «кольца» Acknowledge Ring, Data Ring, Request Ring, Snoop Ring.

Еще одна особенность нового процессора - обязательное наличие встроенного видеоядра, моделей без него не существует. Мне не слишком нравится идея переплачивать за лишний блок ядра, ведь многим пользователям (особенно оверклокерам) он совершенно не нужен.

К примеру, на этом слайде Intel напрямую указывает на пригодность встроенной графики только для «легких» игр, в то время как «энтузиастам» рекомендуется использовать дискретную видеокарту. Более подробно характеристики видеоядра представлены на слайде ниже:

Наряду с процессорами были представлены и новые наборы логики шестидесятой серии. Их перечень включает четыре наименования, о характеристиках которых можно составить представление, ознакомившись со следующим слайдом:

Наибольший интерес представляют наборы логики Intel H67…

… и Intel P67.

Именно они будут использоваться на большинстве материнских плат для новых процессоров. Набор логики Intel H67 обеспечивает работу интегрированного в процессор видеоядра, в то время как P67 лишен это особенности. Зато только он способен обеспечить разгон процессора, у остальных «чипсетов» нет функций Performance Tuning («настройка производительности»).

Автор: Снайп 6.2.2012, 15:07

Нужно ли разгонять процессор? Что это даёт?
На неделе буду покупать. Разгоняемые процы по цене дороже.

Автор: pilligrim1310 6.2.2012, 15:30

Цитата(Снайп @ 6.2.2012, 16:07)

Нужно ли разгонять процессор? Что это даёт?
На неделе буду покупать. Разгоняемые процы по цене дороже.

Для современных процессоров существует встроенная функция турбо буст,которая в автоматическом режиме "разгоняет" процессор..Вот как об этом написано на сайте Intel:
•Технология Intel® Turbo Boost 2.0 автоматически повышает тактовую частоту процессора, когда ресурсоемкие задачи требуют дополнительной производительности, а затем по возможности понижает ее для экономии энергии.
Отсюда делай выводы,взяв проц с такой функцией,не будешь думать о разгоне...техника всё зделает сама по необходимости.

Автор: Снайп 6.2.2012, 15:40

Проц -i5-2500 и i5 - 2400 3,1Ghz - разгоняемые?
Именно из них я буду делать выбор. Как отличить разгоняемый от неразгоняемого?

Автор: pilligrim1310 6.2.2012, 16:03

Цитата(Снайп @ 6.2.2012, 16:40)

Если я правильно понимаю,то под разгоном подразумеваешь,повышение производительности за счёт повышения тактовой частоты,что и делает Turbo Boost 2.0.
Вот http://www.intel.com/ru_RU/consumer/products/processors/comparison-chart.htm

Автор: ODIN 6.2.2012, 19:09

Цитата(Снайп @ 6.2.2012, 17:07)

Нужно ли разгонять процессор?

Дык это вас нужно спросить, надо оно вам или нет? Какой рассчитываете получить прирост от разгона?
Вывод из монтажки в два раза быстрее? Не получится. Прикупить на грош пятаков, тоже вряд ли выйдет.

Цитата(Снайп @ 6.2.2012, 17:40)

Проц -i5-2500 и i5 - 2400 3,1Ghz - разгоняемые?

Да.
Про Turbo Boost pilligrim1310 уже сказал. Могу лишь предложить, что бы вам не париться с разгоном, берите i5-2500К (дороже чем i5-2500 на 5-10 у.е.) у него разблокированный множитель, что позволяет разгонять увеличением множителя, без поднятия напряжения и т.д.

Цитата(Снайп @ 6.2.2012, 17:40)

Как отличить разгоняемый от неразгоняемого?

Читать инфу по процессорам.

Цитата(Снайп @ 6.2.2012, 17:07)

Разгоняемые процы по цене дороже.

Цена зависит не от этого.

Автор: jekaP 11.2.2012, 13:51

Про оперативку не понятно 2х4 или 1х8?

Автор: pavel55555 11.2.2012, 14:31

Цитата(okulval @ 11.2.2012, 22:11)

У меня встал вопрос о приобретении нового компа....Вот примерные наброски.Кто что посоветует.
[attachment=8702:____________0001.jpg]
БП 650W два винта 300 и 500 гб
p.s. На большую сумму не тяну...

Проц берите i7 - 2600K !!!
Если, как молодые балбесы, разгонять комп не будете, что настоятельно не рекомендую, то можете еще съэкономить на кулере!!! Штатного боксовского вполне хватает. У самого такой проц боксовый и прекрасно работает на Win7x64 Adobe CS 5.5.

Автор: pavel55555 11.2.2012, 14:38

Цитата(jekaP @ 11.2.2012, 22:51)

Про оперативку не понятно 2х4 или 1х8?

Чего же не понятно - ясно всё написано: 2 планки по 4 Гига... Я бы рекомендовал до 8 гигов, лишними не будут!!!

Автор: ODIN 11.2.2012, 15:07

Нормальная сборка. Если только кулер на более тихий заменить. Но нужно знать, что за корпус.

Цитата(pavel55555 @ 11.2.2012, 16:31)

Если, как молодые балбесы, разгонять комп не будете, что настоятельно не рекомендую, то можете еще съэкономить на кулере!!! Штатного боксовского вполне хватает.

Конечно хватает. Только темпа и шум....

Комп не вырубало под нагрузкой?
Так бы все и делали. Проц брали мощней, а кулер говённей. Экономия! Это вам не атлон 2хII...

Цитата(pavel55555 @ 11.2.2012, 16:31)

Проц берите i7 - 2600K !!!

Тогда лучше этот - http://market.yandex.ru/model.xml?hid=91019&modelid=7771443&clid=502

материнку, если чё подберем.

Чего же не понятно -

Цитата(okulval @ 11.2.2012, 15:11)

p.s. На большую сумму не тяну..

Автор: pavel55555 11.2.2012, 15:19

Цитата(ODIN @ 12.2.2012, 0:07)

Конечно хватает. Только темпа и шум....

Удивитесь - нифига не вырубало!!! И шума нету!!! Вот незадача!!! Приду - скажу компу, когда буду HD в Афтере рендерить, АНУ ВЫРУБАЙСЯ!!! ,А то народ не понимает, как это так ты преспокойненько можешь сутки молотить и всё нормуль!!!

А насчет кулера - это как сказать... Для Вас может и говёненький... Покупайте какой Вам нравится. А мне и многим друзьям, работающим тоже с HD вполне хватает... Это обычно молодёж любит всякое понавесить на проц да подсветочкой побаловаться...

P.S. Кстати про Атлон. Вы почитайте .... почитайте и сравните. Что я рекомендовал и сколько он потреблинет, да и вообще...

Автор: pavel55555 11.2.2012, 15:28

С любителями AMD в дальнеший спор о процессорах не вступаю. У каждого свой и он лучший!!! ИМХО.

Автор: pavel55555 11.2.2012, 15:28

Пускай человек сам разберется, какая платформа ему подходит...

Цитата(ODIN @ 12.2.2012, 0:07)

Тогда лучше этот - http://market.yandex.ru/model.xml?hid=9101...43&clid=502 материнку, если чё подберем.

Только ехидничать и умничать со мной не надо! Лады??? Я на форуме не для этого...

Автор: ODIN 11.2.2012, 15:39

Цитата(pavel55555 @ 11.2.2012, 17:19)

P.S. Кстати про Атлон. Вы почитайте .... почитайте и сравните.

Ерунда какая-то. Старый и слабый атлон, был приведен для примера. Потому как он не греется выше 60С с боксовым кулером и при любых нагрузах.
Я никому ничего не навязываю. Я сказал - нормальная сборка. А Вы не поняли, и сразу в амбиции. Или не читаете ничего, кроме того что пишете сами.

Цитата(pavel55555 @ 11.2.2012, 17:28)

Только ехидничать и умничать со мной не надо! Лады??? Я на форуме не для этого...

Лады. Да и я не за этим. И веду себя вроде культурно.

Автор: pavel55555 11.2.2012, 15:48

Цитата(ODIN @ 12.2.2012, 0:39)

Уважаемый, давайте не будем оффтопить. Скажу только, что на форум я пришел УЖЕ со своим багажем знаний и практически отсюда "халявой" не пользуюсь, а стараюсь помочь или подсказать людям исходя из свего опыта и знаний. На футажике (не в обиду футажику) я для себя ничего нового не узнал, за исключением некоторых нюансов... Читаю по железу предостаточно! Уж поверьте. Кстати, если Вас задевает, то что я что-то пишу, тогда можете писать своё. Я оспаривать не буду. Просто иногда народ даёт такие советы, что промолчать становится не возможно...

Предлагаю на этом остановиться, во избежание дальнейших споров. Не люблю я это дело... (и выпить мировую...)

Автор: ODIN 11.2.2012, 15:55

Цитата(pavel55555 @ 11.2.2012, 17:48)

Читаю по железу предостаточно! Уж поверьте.

Я сразу это понял.

Цитата(pavel55555 @ 11.2.2012, 17:48)

Кстати, если Вас задевает, то что я пишу, тогда можете писать своё.

Нет. Ничего не задевает. И ерунды я вроде не советовал. Может с кем путаете.

Цитата(pavel55555 @ 11.2.2012, 17:48)

Предлагаю на этом остановиться

Автор: piter64 11.2.2012, 16:06

Ребята кончайте флудить.Давайте жить дружно.
Начинал с Атлона ,но интел больше понравился.

Автор: ODIN 11.2.2012, 16:09

Цитата(okulval @ 11.2.2012, 18:06)

Вот по оперативной что лучше 2 х гиговые или же 4 ???

Сейчас бы, брал 2 или 4 планки по 4гб.

Автор: pavel55555 11.2.2012, 16:19

Если бюджет поджимает - возьмите 2 планки по 4 гига.
Если материнка поддерживает такую память, что у вас в конфигурации, то берите её. Нормальная.

Автор: serj_1 11.2.2012, 18:47

Про процессор-не меняй, нормальный проц. Много машин собрал на нем.
Про память-память ИМХО не ту выбрал, лучше взять как у меня, дешевая, 8Гигов, комплектная, холодная и гонимая(если надо) 2x4Gb KHX1600C9D3X2K2/8GX стоит 1600 рублей:
Про мамку-не самый лучший выбор(хотя нареканий нет). Лучше взять ASUS P8Z68-V LX(B3). Хотя если денег тока-тока.....(я бы не пожалел денег и купил GIGABYTE GA-Z68X-UD3-B3 чуть более 4 килорублей стоит
Про кулер-дороговат, для такого не очень тихого монстра. Я советую кулер Cooler Master Hyper 101 PWM, Socket 775/1156/AM2, RR-H101-30PK-RU и стоит 640 рублей. у самого такой.
Ну, про резак с БлюРеем не спрашиваю для чего. (а ведь еще жестких нет)

Автор: pilligrim1310 11.2.2012, 21:00

Цитата(okulval @ 11.2.2012, 19:57)

Остаются старые, Ну мож ещё один добавлю на 300 или 500

Валентин,я бы посответовал не размениваться и взять 1Тб,в цене разница не велика,а в объёме заметно.Из производителей посоветовал бы WD или Fujitsu.
Процессор-достойный однозначно,а насчет материнки,подумай,serj_1 правильно говорит.Тем более мамка-это основа системника.
Только что то непонятно про корпус и БП,или думаешь старое применить?Для хорошего железа,и корпус хороший нужен-просторный тихий,а главное продуваемый и как минимум с 2 вентиляторами,один на выдувание,другой на всасывание.И с БП вопрос ещё тот,твое железо требует как минимум 500 ваттового БП,старый то потянет или слабее...?

Автор: pilligrim1310 11.2.2012, 22:09

Цитата(okulval @ 11.2.2012, 22:47)

А корпус мне мой нравится.Таких ща не видел, но в крайности конечно поменяю и корпус

Дело то не в том что нравиться,а что бы был "прохладный"!И главным критерием здесь является,минимум 2 вентилятора на продувку и достаточно большой размер самого корпуса...И ещё достаточно "тонкий" вопрос о тишине компьютера.Согласись,достаточно часто юзаем ночи напролёт или оставляем на просчёт фильм на ночь....а тишина...как без неё???Что тут ещё говорить....А тихим комп бывает,только когда корпус крепкий,с большим количеством усилительных пластин внутри,а значит тяжелый...Вот!!!
P.S.Кстати 650 ватового БП вполне должно хватать для твоей сборки...

Автор: commar 25.2.2012, 18:49

Заметил, что древние недорогие, (читай - ширпотребовские) корпуса In-Win крепче и стенками потолще нынешних жестянок за цену в районе 2000.

Автор: pilligrim1310 26.2.2012, 10:41

Цитата(commar @ 25.2.2012, 19:49)

что древние недорогие, (читай - ширпотребовские) корпуса In-Win крепче и стенками потолще нынешних жестянок

Это не самый главный довод в пользу In-Win,гораздо важнее хорошая вентиляция внутри корпуса,а у ширпотребовских(недорогих) корпусов,эта самая вентиляция не на высоте...Крепкость в данном случае будет только доводом в зашиту от грубых контактов с предметами...
Важен вес в совокупности с крепостью

Цитата(pilligrim1310 @ 11.2.2012, 23:09)

когда корпус крепкий,с большим количеством усилительных пластин внутри,а значит тяжелый...

Это более веский довод,хотя бы в пользу устойчивости к вибрациям от вращения вентиляторов...а значит-тишине!

Автор: ODIN 26.2.2012, 12:59

Цитата(pilligrim1310 @ 26.2.2012, 12:41)

гораздо важнее хорошая вентиляция внутри корпуса,а у ширпотребовских(недорогих) корпусов,эта самая вентиляция не на высоте..

На продаваемом уровне = 0. Но если иметь прямые руки, то можно не тратить лишние пару тыр.
У самого http://www.003.ru/product-70399909.html, к стати, правда крепкий, по сравнению с нынешними InWin.

Автор: pilligrim1310 26.2.2012, 13:32

Цитата(ODIN @ 26.2.2012, 13:59)

У самого http://www.003.ru/product-70399909.html, к стати, правда крепкий, по сравнению с нынешними InWin.

Что то я не увидел ни переднего вентилятора,ни места под его установку...о боковом или верхнем вообще речь не идёт...и что?это нормальная вентиляция,выдувать одним ветилятором,который судя по комплектации даже не входит в комплект.Вопросов больше,чем ответов...

Автор: ODIN 26.2.2012, 14:25

Цитата(pilligrim1310 @ 26.2.2012, 15:32)

Вопросов больше,чем ответов...

Говорю же - на продаваемом уровне = 0.
А выглядит так –
Для начала снимается БП и используется в сборке, где его хватает. (в какой нить заказ)
Далее, снимается передняя крышка, на скрине 1 (на пластиковых защелках) и под нее ставится 120мм 900-1200 об/мин на вдув, на скрине 2. Далее удаляется труба (на пластиковых защелках), на скрине 3, и на ее место ставится 92мм на вдув. Ну и соответственно 120мм на заднюю стенку на выдув. Кулеры ставил такие - http://market.yandex.ru/model-spec.xml?modelid=6905587&hid=818965 стоили 200р. Могу сказать, что они лучше, чем те, что идут с корпусом Zalman Z9 Plus. Это сейчас Z9 дешевый, а раньше стоил совсем не 2100р. Про минусы Z9 говорить не буду, хотя есть.

Нажмите для просмотра скрытого текста

Для тех, у кого лишних денег много и не привыкли делать что-то сами, это ни к чему (как и разгон). Можно купить нормально подготовленный корпус за 5тыр и не париться.

Если полезу в кишки, то зафоткаю, чтоб наглядно показать. А пока, судите сами, нормальный охлад или нет

Нажмите для просмотра скрытого текста

при этом, проц разогнан до 3.84ГГц (а TDP у него 125 Вт) и память до 1600МГц, правда все это, без поднятия напряжения.

Автор: МОЗГОЛОМ 26.2.2012, 14:51

У меня наверно самый дешёвый метод решения проблемы с охлаждением,просто снял левую если смотреть от морды корпуса стенку и всё холодное как лёд и пыли меньше сосётся,шуму не намного больше, да и не мешает он мне.

Автор: ODIN 26.2.2012, 15:05

МОЗГОЛОМ
Ну ни знаю. У меня с открытой крышкой температура на 5гр выше. Что говорит, о правильной вентиляции.
А пыли с открытой крышкой всегда больше, т.к. она вся летит туда. Я свой чищу +\- раз в год, после того как темпа поднимается на 7-10.

Вот немного о правильной вентиляции -

Нажмите для просмотра скрытого текста

Главное чтобы количество вдуваемого внутрь воздуха примерно равнялось количеству выдуваемого.
Допускается некоторое избыточное давление внутри корпуса
(т.е. на вдув вентилей больше, или они более производительны, чем вентили на выдув),
иначе в корпусе будет скапливаться пыль.
Ну и не забывать про общее правило потока воздуха - на вдув спереди и снизу,
на выдув - сзади и вверх, чтобы поток воздуха был более прямолинейный.
Боковые вентили должны помогать, а не мешать конвекции, т.е. не создавать
противонаправленных потоков холодного воздуха вверх и горячего воздуха вниз.

Автор: МОЗГОЛОМ 26.2.2012, 15:27

Если правильно организовать систему охлаждения с доп. кулерами ,то конечно будет эффективнее,у меня всё штатное.На счёт пыли не знаю,в узкую трубу скорость потока больше и засасывается как в пылесос,а когда открыто там вообще ни какой скорости засоса нет,но не утверждаю конечно категорично,может и не так.
Конечно спору нет, грамотная вентиляция это лучший и более правильный путь.

Автор: pilligrim1310 27.2.2012, 12:04

Цитата(ODIN @ 26.2.2012, 15:25)

А выглядит так

Ну вот теперь расклад понятен...вообщем то при средненьком корпусе-неплохой обдув(и со слов и со скрина с температурами)...Такую процедуру пробовали со стареньким корпусом,но из-за особенностей корпуса не очень хороший эффект получился.На передней стенке корпуса(зона 2 на скрине),была подштамповка и ветилятор не получилось установить снаружи(лицевая крышка не оделась бы),поставили внутри,но в силу неровности корпуса захват воздуха извне был не на высоте..Ставили ещё и боковой,эффект получше...но всё равно вопросы остались...температуру внутри снизили...но того чего хотели,добиться не смогли...всему виной особенности корпуса!Так что вопрос с доработкой вентиляции внутри корпуса,не всегда разрешим с нужным эффектом!

Автор: commar 27.2.2012, 14:31

pilligrim1310
Не пробовали насверлить маленьких симпатишных дырочек вверху корпуса, прикрыть их внутри мелкой сеткой и поставить тихий вентилятор на 120?
ЗЫ: а боковые дырки\трубы вообще маниакально недолюбливаю..

Автор: pilligrim1310 27.2.2012, 14:42

Цитата(commar @ 27.2.2012, 15:31)

Не пробовали насверлить маленьких симпатишных дырочек вверху корпуса, прикрыть их внутри мелкой сеткой и поставить тихий вентилятор на 120?

Не стали изголяться,комп был клиентский(не для себя),и что бы не возникало вопросов с охлаждением порекомендовали готовый девайс,который и был куплен заказчиком,для своего блага...И мы остались довольными!!!

Автор: Hammer 11.3.2012, 11:46

Подскажите кто нибудь тепловыделение процессора AM3 AMD Phenom II X4 975 (HDZ975FBK4DGM) - 125 Вт. Это много или нормально! Да и вообще что можете сказать о самом процессоре.

Автор: pilligrim1310 11.3.2012, 18:07

Цитата(Hammer @ 11.3.2012, 12:46)

125 Вт. Это много или нормально!

Сейчас производители для современных процессоров заявляют в пределах-95-130Вт!Величается эта цифра-типичное тепловыделение!

Автор: Vatra 11.3.2012, 18:25

Цитата(Hammer @ 11.3.2012, 12:46)

Старый проц, снятый с производства. На эти деньги лучше брать http://fixer.com.ua/PC-Components/Processors/416982_AMD_A8-3870_X4_Socket_FM1_3_0GHz_4MB_100W_box_AD3870WNGXBOX.html. Он со встроенным графическим ядром, то есть видеокарта не понадобится. Да пошустрее намного будет.

Автор: desalb5 11.3.2012, 19:58

Ребята! Выбрал такую конфигурацию. Через 5 дней покупать. Посмотрите какие замечания будут

Нажмите для просмотра скрытого текста

Процессор Intel Core i7 2600K [LGA1155, 3.4GHz, 8MB, Sandy Bridge, 32nm, 95W, GPU 850/1100MHz, OEM]
11 594 руб.

Память DDR3 4Gb Corsair PC3-10600 (1600MHz) XMS3 CMX4GX3M1A1600C9 9-9-9-24
1 030 руб. 4 штуки

MB S1155 ASUS P8H67-M (Rev 3) s1155 /H67/ 4xDDR3, 2xPCI-E,SATA RAID, Dsub, HDMI, GbLAN, mATX
3 689 руб.

Видеокарта ASUS GTX560 1024Mb [ENGTX560/DC/2DI/1GD5 GDDR5/256bit/HDMI/2xDVI/RTL s3D]
6 572 руб.

Жёсткий диск 2TB WD WD20EARX Caviar GP 64Mb 6.0Gb/s
4 690 руб. 2 штуки

Автор: pilligrim1310 11.3.2012, 20:42

Вообщем то сборка неплоха,но есть но:
процессор дороговат(у нас дешевле,но это детали)...не стоит ли поскромнее,не жалко денег.
Модули памяти не списке рекомендованных...да и вообще подходят ли они...мамка поддерживает 1066 и 1333,а эти 1600...непонятно

P.S.Обсуждение продолжается,послушаем что скажут другие...диалог будет продолжен!

Автор: ODIN 11.3.2012, 20:50

Цитата(desalb5 @ 11.3.2012, 21:44)

А нельзя поподробнее об этом.

По вашей просьбе, про процы. Все копипастить смысла нет, да и этого думаю хватит, что бы понять есть ли смысл переплаты за мнимые фенечки.
А за LGA2011, аж вдвое!

Нажмите для просмотра скрытого текста

Цитата(desalb5 @ 11.3.2012, 21:58)

Посмотрите какие замечания будут

Только предложения. По процу думайте. Вот хорошая материнка - http://www.ulmart.ru/goods/230276/?head=1
Память брал бы из этих - Samsung M378B5273CH0-CH9, M378B5273DH0-CH9, Hynix Original HMT351U6BFR8C-H9, HMT351U6CFR8C-H9
http://www.ogo1.ru/market/operativnaya_pamyat/30214-DIMM_4Gb_DDR3_PC10660_1333MHz_Samsung , http://www.ogo1.ru/market/operativnaya_pamyat/39076-DIMM_4Gb_DDR3_PC10660_1333MHz_Hynix
Видео карта, если желаете получше – http://www.ulmart.ru/goods/281066/ но если не для игр, то лишнее, имхо хватит той, что выбрали.
Только DCII, получше будет http://www.nix.ru/autocatalog/asus/asustek_video/PCIE_DDR5_ASUS_ENGTX560_DCII_OC_2DI_1GD5_DualDVI_miniHDMI_SLI_GeForce_GTX560_117673.html
А что с БП, корпусом и кулером, в наличии?

Автор: Vatra 11.3.2012, 21:41

И ещё один график
http://www.radikal.ru

Автор: desalb5 11.3.2012, 22:01

Видеокарта для монтажа. Вообще вся конфигурация нужна из-за того, что крайне неудобно работать с HDV 1440x1080 50i
То рассинхрон видео со звуком идёт, то вообще бывают потерянные кадры при захвате в AP CS5.
Да и в Ater Effect всё крайне медленно. Хочу ускорить работу. Блок питания пока не подбирал. Думал по ходу уже сориентировться. А что и в этом какие то фишки?

Автор: pilligrim1310 11.3.2012, 22:05

Цитата(desalb5 @ 11.3.2012, 23:01)

Вот уже и конкретика появилась,неплохо бы ещё ссылку на сайт магазина,где будет приобретаться железо,и станет проще давать советы,видя что есть в наличии.

Автор: desalb5 11.3.2012, 22:08

Спасибо-это здорово-
Вот http://h9.ru/

Автор: pilligrim1310 11.3.2012, 22:14

Цитата(desalb5 @ 11.3.2012, 23:08)

Спасибо-это здорово-
Вот магазин

Коли уж будем обсуждать сборку компьютера,то лучше нам переехать http://www.futajik.ru/forum/index.php?showtopic=1814&st=360&start=360

Автор: Flash007 11.3.2012, 23:25

А что вы скажете о проце Intel Core i7-2670QM (2.2 ГГц) .

Автор: pilligrim1310 11.3.2012, 23:51

Цитата(Flash007 @ 12.3.2012, 0:25)

А что вы скажете о проце Intel Core i7-2670QM (2.2 ГГц) .

Покопался на сайте Intel,посмотрел таблички http://ark.intel.com/ru/products/53469/intel-core-i7-2670qm-processor-(6m-cache-2_20-ghz) и http://www.intel.com/support/ru/processors/sb/cs-032330.htm?wapkw=(i7-2670QM).Характеристики неплохие,хотя судя по таблице есть и понаряднее...но нужно ли это...ноутбук для монтажа не самая сильная машинка...хотя и такая задача по силам,с определёнными условиями!

Автор: pilligrim1310 14.3.2012, 11:51

Разница в производительности между i5-2500K и i7-2600K,не давала покоя.Понимая разницу в цене,предполагал и большую производительнось...Поштудировал интернет на этот предмет...и вот что интересного нарыл:http://www.nix.ru/hardware-review/cpu-benchmark-performance.html ,http://yoursputnik.ru/best-computer-processor-test/3014 ,http://yoursputnik.ru/computer-adobe-cs5/2491 ,http://yoursputnik.ru/3d-computer-3ds-max-2011/2510.

Вывод:Как и писал ранее,все же i7-2600K оказался производительнее i5-2500K,правда разница не столь разительна...и с учётом более низкой цены на i5-2500K(6500 рублей)*,он все же кажется более привлекательным в соотношении производительность/цена,нежели i7-2600K(9500 рублей)*!В случае когда очень важна производительность(без разгона),не взирая на деньги,свой выбор можно остановить на i7-2600K,или даже i7-2700K(11000 рублей)*!Таково моё мнение!
*Цены даны на момент написания в магазинах Самары.

Автор: ODIN 14.3.2012, 12:18

Цитата(pilligrim1310 @ 14.3.2012, 13:51)

В случае когда очень важна производительность(без разгона),не взирая на деньги,свой выбор можно остановить на i7-2600K,или даже i7-2700K(11000 рублей)*!Таково моё мнение!

Тогда можно и без К (чуть дешевле). А для 3D, лучше Топ и проф. карту. Но все это не новость. По уму, не надо бояться разгона.
У меня нет желания платить производителям за доп. прирост, когда этого можно достичь самому.

Автор: serj_1 14.3.2012, 14:45

Цитата(pilligrim1310 @ 11.3.2012, 22:42)

Действительно, к другой мамке(либо памяти) присмотреться все же стоит. Как основание, плохая поддержка питания памяти,которая хоть и выставляется в ручную в БИОСе,все же чревата синькой!!! Сам имел не осторожность иметь такой опыт.
По памяти-берите, но лучше по штудировать по ней, все таки брать 1,5 вольтовые лучше, чем 1,65В, только потому, что первые можно разогнать(если надо) слегка повысив при том температуру, чем со вторым видом, шевелить БИОС, который будет перестраивать всю структуру целиком. При этом еще работать кое-как не при своей частоте(эт уж мои выводы, к которым пришел сам, почитав кое что).
По процу-если есть возможность вложить лишние 100$ -вложите в i7(в Афтере потом увиде 8потоковую разницу). Про видяху позже. Извините-работа.

Автор: ODIN 14.3.2012, 15:42

Цитата(Hammer @ 11.3.2012, 13:46)

Подскажите кто нибудь тепловыделение процессора AM3 AMD Phenom II X4 975 - 125 Вт. Это много или нормально! Да и вообще что можете сказать о самом процессоре.

TDP - 125W для Phenom II X4 это норм. Нормальный проц. У меня 965 в разгоне, проблем не знаю.

Цитата(Vatra @ 11.3.2012, 20:25)

Старый проц, снятый с производства. На эти деньги лучше брать AMD A8-3870 X4 Socket FM1 3.0GHz 4MB 100W. Он со встроенным графическим ядром, то есть видеокарта не понадобится. Да пошустрее намного будет.

Чушь какая то. Llano везде проигрывает Phenom II X4 975.

Нажмите для просмотра скрытого текста

А на встроенном графическом ядре, только по сети лазить.
То вы материнку LGA 2011 предлагали, когда подбор шел на 1155. Здесь - http://www.futajik.ru/forum/index.php?s=&showtopic=1814&view=findpost&p=116308

Автор: serj_1 14.3.2012, 19:33

Цитата

А на встроенном графическом ядре, только по сети лазить.

Если мамка имеет поддержку встроенного видео.Верный ответ, подтверждаю. Есть такая фурня. Но если мамка поддерживает программное обеспечение (помощи при кодировании), то это не большой, но прирост к работе. Хотя как альтернатива к накоплению на нормальную видяху.

Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)