• Добро пожаловать на компьютерный форум Tehnari.ru. Здесь разбираемся с проблемами ПК и ноутбуков: Windows, драйверы, «железо», сборка и апгрейд, софт и безопасность. Форум работает много лет, сейчас он переехал на новый движок, но старые темы и аккаунты мы постарались сохранить максимально аккуратно.

    Форум не связан с магазинами и сервисами – мы ничего не продаём и не даём «рекламу под видом совета». Отвечают обычные участники и модераторы, которые следят за порядком и качеством подсказок.

    Если вы у нас впервые, загляните на страницу о проекте, чтобы узнать больше. Чтобы создавать темы и писать сообщения, сначала зарегистрируйтесь, а затем войдите под своим логином.

    Не знаете, с чего начать? Создайте тему с описанием проблемы – подскажем и при необходимости перенесём её в подходящий раздел.
    Задать вопрос Новые сообщения Как правильно спросить
    Если пришли по ссылке со старого Tehnari.ru – вы на нужном месте, просто продолжайте обсуждение.

SSE перемножение матриц

  • Автор темы Автор темы Abraziv
  • Дата начала Дата начала

Abraziv

Ученик
Почётный участник
Регистрация
28 Июл 2011
Сообщения
275
Реакции
2
Баллы
0
SSE перемножение матриц

Все привет, есть код перемножения матриц на с++:

for(int j = 0; j < SIZE ; j++)
{
for(int i = 0; i < SIZE; i++)
{
for(int t = 0; t < SIZE; t++)
{
temp += A[j][t]*B[t];
}
file_result << temp;
file_result << " ";
temp = 0;
}
file_result << endl;
}

Подскажите пожалуйста, как оптимизировать с помощью SSE .
Прочитал про саму концепцию , про функции intrinsics , но в упор не вижу как это оптимизировать. Есть 8 регистров XMM по 128 бит , возможно загрузить 4 данных в 4 части ( по 32 бита) в один из MMX и как то работать. Для матрицы 4*4 всё понятно, загружаем один раз и перемножаем с чем угодно сколько потребуется. А тут как ? Хотя бы на пальцах объясните.
 
Назад
Сверху