Сравнение скоростей gaussian'а на машинах с IA32 и EM64T
Сравнение скоростей gaussian'а на машинах с IA32 и EM64T
Скорость грамотно оттранслированного Gaussian'а g03 на Core 2 Duo E6700 под EM64T в 6 раз превышает скорость его распространяемой версии под Windows на P4 3.6 GHz под IA32. Почему такая большая разница? Одной многоядерностью и большей скоростью процессора этого не объяснить. У меня одно предположение: они транслировали его без оптимизции кода. В exchange выложены расчеты димера C120 (B3LYP/6-31g и rhf/6-311g*) на Core 2 Duo. Конфигурацию железа см.: http://www.thesa-store.com/products/
Юрий, когда вы говорите о сборках, следует указывать не только архитектуру процессоров, но и компилятор (название и версию), использованные ключи оптимизации и использованные библиотеки. Только обладая этой информацией (это самый минимум) можно пытаться сравнивать производительность.
Не важно, что о вас говорят современники, важно что о вас скажут потомки
Для Win нет исходного кода, и gaussian не пишет, что, как и почему (правда, один умелец переделал линуксовый код под Win).Nord писал(а):Юрий, когда вы говорите о сборках, следует указывать не только архитектуру процессоров, но и компилятор (название и версию), использованные ключи оптимизации и использованные библиотеки. Только обладая этой информацией (это самый минимум) можно пытаться сравнивать производительность.
По крайней мере, для меня это не проблема - я сижу под Linux. И процессор у меня тоже C2D, только пропроще - E4300 (1.8 ГГц).Yurii писал(а):Для Win нет исходного кода, и gaussian не пишет, что, как и почему (правда, один умелец переделал линуксовый код под Win).Nord писал(а):Юрий, когда вы говорите о сборках, следует указывать не только архитектуру процессоров, но и компилятор (название и версию), использованные ключи оптимизации и использованные библиотеки. Только обладая этой информацией (это самый минимум) можно пытаться сравнивать производительность.
Не важно, что о вас говорят современники, важно что о вас скажут потомки
Отвечаю на содержательную часть ответа. Раз у Вас C2D, то и поставьте C120, а то Yu/2 занимается чистой спекуляцией (на коей его местичковый рейтинг стремительно вырос) на различии в железе. У меня еще будет ему ответ по этому поводу. Пока я вижу, что для него 6-311G* для pc gamess и gaussian - одно и тоже.Nord писал(а):По крайней мере, для меня это не проблема - я сижу под Linux. И процессор у меня тоже C2D, только пропроще - E4300 (1.8 ГГц).Yurii писал(а):Для Win нет исходного кода, и gaussian не пишет, что, как и почему (правда, один умелец переделал линуксовый код под Win).Nord писал(а):Юрий, когда вы говорите о сборках, следует указывать не только архитектуру процессоров, но и компилятор (название и версию), использованные ключи оптимизации и использованные библиотеки. Только обладая этой информацией (это самый минимум) можно пытаться сравнивать производительность.
Я поставил и давно уже результаты получил, о чём Вам сообщил. Но Вы не изволили мне поверить.Yurii писал(а):Отвечаю на содержательную часть ответа. Раз у Вас C2D, то и поставьте C120, а то Yu/2 занимается чистой спекуляцией (на коей его местичковый рейтинг стремительно вырос) на различии в железе. У меня еще будет ему ответ по этому поводу. Пока я вижу, что для него 6-311G* для pc gamess и gaussian - одно и тоже.
Мой gamess считает медленнее, причём существенно, но не на порядки, причём на обычно десктопной машинке с 1Gb оперативной памяти. Но сборка у меня под IA32, gcc/gfortran (а не icc/ifort) и без оптимизованных blas/lapack от Интела.
Не важно, что о вас говорят современники, важно что о вас скажут потомки
-
- Сообщения: 426
- Зарегистрирован: Чт май 24, 2007 1:54 pm
-
- Сообщения: 426
- Зарегистрирован: Чт май 24, 2007 1:54 pm
Честно - леньDarth Vasya писал(а):Вам поможет ACML от AMD, а также GotoBLASNord писал(а):и без оптимизованных blas/lapack от Интела.
Когда-то мне нравилось собирать с предельной оптимизацией. А сейчас хочется побыстрее заняться своим делом. Да и тестировать - утомительное занятие.
Не важно, что о вас говорят современники, важно что о вас скажут потомки
-
- Сообщения: 426
- Зарегистрирован: Чт май 24, 2007 1:54 pm
ACML и компилировать не надо: http://developer.amd.com/acml.jsp - выбираете свою битность и вперёд! Для IA32 Вам, наверное, лучше всего подойдёт вот это: http://developer.amd.com/devDownloadPro ... §ion=5. Да и оттестирована она вдоль и поперёк. Сам её использую на Интеловских машинах. Сравнивал на EM64T с MKL 10 - разница совсем небольшая.
Плохо зная грамматику, сложные конструкции должны употребляться с осторожностью.
Дело не в вере, а в том, что Вы отказались показать свой расчет, чтобы пользователь gamess осознал роль внешних носителей на десктопе(сборка и оптимизированные библиотеки здесь отходят на 2 план). А то, что Вы отважились на такой расчет - честь Вам и хвала. У меня терпенья не хватило даже на pc gamess.Nord писал(а):Я поставил и давно уже результаты получил, о чём Вам сообщил. Но Вы не изволили мне поверить.Yurii писал(а):Отвечаю на содержательную часть ответа. Раз у Вас C2D, то и поставьте C120, а то Yu/2 занимается чистой спекуляцией (на коей его местичковый рейтинг стремительно вырос) на различии в железе. У меня еще будет ему ответ по этому поводу. Пока я вижу, что для него 6-311G* для pc gamess и gaussian - одно и тоже.
Мой gamess считает медленнее, причём существенно, но не на порядки, причём на обычно десктопной машинке с 1Gb оперативной памяти. Но сборка у меня под IA32, gcc/gfortran (а не icc/ifort) и без оптимизованных blas/lapack от Интела.
Я сразу считал в direct варианте, потому что у меня действительно медленный диск 5-летней давности. И как раз здесь всё упиралось в процессор и оптимизацию.Yurii писал(а):Дело не в вере, а в том, что Вы отказались показать свой расчет, чтобы пользователь gamess осознал роль внешних носителей на десктопе(сборка и оптимизированные библиотеки здесь отходят на 2 план)
Да, я ещё считал не pc-gamess'ом, а оригинальным gamess-us
Не важно, что о вас говорят современники, важно что о вас скажут потомки
Дело не в этом. Думаю, что смеяться не будут, а с интересом ознакомятся с Вашим расчетом.Nord писал(а):Я сразу считал в direct варианте, потому что у меня действительно медленный диск 5-летней давности. И как раз здесь всё упиралось в процессор и оптимизацию.Yurii писал(а):Дело не в вере, а в том, что Вы отказались показать свой расчет, чтобы пользователь gamess осознал роль внешних носителей на десктопе(сборка и оптимизированные библиотеки здесь отходят на 2 план)
Да, я ещё считал не pc-gamess'ом, а оригинальным gamess-us
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя