Энтузиаст состоит в различных чатах в Telegram и как-то недавно наткнулся на канал по процессорам Loongson (там одни говорящие на китайском, но, к счастью, админ понимает английский), поэтому он попросил SSH-доступ и провёл различные тесты данного процессора.
Сперва рассмотрим характеристики процессора Loongson 3A5000 и его предыдущую модель Loongson 3A4000.
Характеристики процессоров Loongson 3A5000 и Loongson 3A4000:
Бали проведены следующие тесты:
- 7zip встроенный бенчмарк
- Dhrystone, Whetsone
- Coremark
- Scimark 2
- Mp MFLOPS
- Stream
- Готовые результаты в SPEC 2006 (1 поток)
Переходим к результатам
Результаты
По результатам можно сделать вывод, что процессор примерно сравним с процессором Core i7 4700 HQ и немного не дотягивает до Core i7-2600, хотя обгоняет его по GFLops'ам.
Немного об архитектуре LoongArch
LoongArch является сильно переработанной архитектурой MIPS64, часть ненужных команд MIPS64 было удалено и добавлено большое число расширений (SIMD, шифрование, бинарная трансляция, виртуализация),
всего порядка 2000+ инструкций.
Loongson 3A5000 (LS3A5000)
Loongson 3A5000 — процессор на основе 64 разрядной RISC сильно переработанной архитектуре MIPS64 (loongarch64), имеет 4 ядра, которые работают на частоте 2.5 ГГц.
Architecture: loongarch64
Byte Order: Little Endian
CPU(s): 4
On-line CPU(s) list: 0-3
Thread(s) per core: 1
Core(s) per socket: 4
Socket(s): 1
NUMA node(s): 1
Model name: Loongson-3A5000
CPU max MHz: 2500.0000
CPU min MHz: 225.0000
BogoMIPS: 4992.00
L1d cache: 64K
L1i cache: 64K
L2 cache: 256K
L3 cache: 16384K
NUMA node0 CPU(s): 0-3
Особенности процессора Loongson 3A5000:
- 64 битная архитектура loongarch64
- 128 битные SIMD расширения Loongson SIMD EXtension (LSX)
- 256 битные SIMD расширения Loongson Advanced SIMD EXtension (LASX)
- Внеочередное исполнение
- Предсказание ветвлений
- Поддержка виртуализации (LVZ)
- Поддержка бинарной трансляции (LBT) архитектур MIPS, ARM, x86
- 4 АЛУ
- 2 SIMD блока
- Кеши
- 64 КБ L1 кэш команд на ядро
- 64 КБ L1 кэш данных на ядро
- 256 КБ L2 кэш на ядро
- 16 МБ L3 кэш
Разбираем результаты
Dhrystone
Dhrystone достаточно древний тест 80х годов, написан на C. Тестирует целочисленную арифметику и работу со строками. Результаты измеряются в Dhrystone/s и DMIPS. (DMIPS = Dhrystone/s делить на 1757).
Whetstone
Тестирует арифметику с плавающей/фиксированной запятой, математические функции, ветвления, вызовов функций, присваиваний, работы с числами с фиксированной запятой, ветвлений. Результаты измеряются в MMIPS.
Современный тест, который должен заменить Dhrystone и Whetstone. Написан на C. Считает различные массивы, матрицы, сортировка и т. д. Предназначался для запуска на всём: от микроконтроллеров до мощных процессоров.
MP MFLOPS
Выполняет операции с плавающей запятой на векторах.
7zip
Встроенный тест архиватора 7z.
Запускается так:
7z b
7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=zh_CN.UTF-8,Utf16=on,HugeFiles=on,64 bits,4 CPUs LE)
LE
CPU Freq: 64000000 - - - - - - - -
RAM size: 16165 MB, # CPU hardware threads: 4
RAM usage: 882 MB, # Benchmark threads: 4
Compressing | Decompressing
Dict Speed Usage R/U Rating | Speed Usage R/U Rating
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS
22: 11279 327 3352 10973 | 130124 396 2803 11102
23: 10681 325 3346 10883 | 127682 393 2810 11048
24: 11183 353 3406 12025 | 126626 395 2815 11116
25: 11099 360 3525 12673 | 124248 394 2805 11058
---------------------------------- | ------------------------------
Avr: 341 3407 11638 | 395 2808 11081
Tot: 368 3108 11360
STREAM
Тест производительности ОЗУ.
Function Best Rate MB/s Avg time Min time Max time
Copy: 16748.3 0.009969 0.009553 0.010576
Scale: 18735.0 0.009437 0.008540 0.010660
Add: 16333.2 0.015492 0.014694 0.016449
Triad: 17796.0 0.014789 0.013486 0.015294
Версия компилятора, ядра Linux
Ядро Linux:
Linux 4.19.167-rc5.lnd.1-loongson-3 #1 SMP Sat Apr 17 07:32:32 UTC 2021 loongarch64 loongarch64 loongarch64 GNU/Linux
Версия компилятора: gcc version 8.3.0 (Debian 8.3.0-6.lnd.vec.20)
.
Выводы
Loongson 3A5000 вышел достаточно неплохим процессором, который уже сейчас может применяться в различных десктопных решениях, а процессоры с низкими частотами могут применяться в ноутбуках (с TDP порядка 30 Вт.)
Очень хотелось бы попробовать в работе такие компьютеры, а учитывая то, что они поддерживают видеокарты от AMD, то можно запускать и игры с открытым исходным кодом. Будем надеяться, что такие процессоры получат широкое применение.
Другие результаты для сравнения:
Комментариев нет:
Отправить комментарий