Георгий |
Отправлено: 11.04.2004, 02:48 |
|
Почетный железнодорожник
Группа: Модератор
Сообщений: 874

|
полночи ковырялся — переделывал и тестил рассчётную функцию с типа double на фиксированную точку 16.16 и получил такие времена:
фиксированная — 97 нан на функцию
double — 86 нан на такуюже функцию
что за свинство? неужели fpu на современных машинах работает быстрее целочисленных блоков??? |
 |
Asher |
Отправлено: 12.04.2004, 08:38 |
|

Мастер участка
Группа: Модератор
Сообщений: 550

|
Привет.
На spec.org находиш в результатах тестирования машину с таким же процом и смотриш на SpecInt и SpecFp. Кто больше — тот и быстрее. 
А если серьезно, то это-же и от количества конвейеров зависит, и от их загрузки и т.д. и т.п.
Там сейчас измерять достаточно сложно — все предельно асинхронно, и достоверно можно говорить только о темпе выдачи инструкций, но не о времени исполнения отдельной.
Измерял ты наверно в цикле — значит загружал переменной цикла те же целочисленные ветки конвейера, что и собственно вычисление. А в случае double они шли в параллель. Хотя если регистров хватало, то это пофиг.
Регистров на все хватало? Перекладывать не приходилось?
P.S. Какой проц?
|
 |
Asher |
Отправлено: 12.04.2004, 08:52 |
|

Мастер участка
Группа: Модератор
Сообщений: 550

|
Во нарыл How to optimize for the Pentium family of microprocessors
|
 |
Георгий |
Отправлено: 13.04.2004, 22:06 |
|
Почетный железнодорожник
Группа: Модератор
Сообщений: 874

|
за мануал спасибо — как говорилось на wasm.ru — "над ним надо помедитировать" 
но 5й точкой чую, что фиксированная точка была хороша во времена трёшек, а сейчас... |
 |