Автор Тема: Расширенный тест на производительность. (Прочитано 121369 раз)

vlad · « **Ответ #135 :** Декабрь 07, 2016, 04:24:06 am »

Цитата: valexey_u от Декабрь 07, 2016, 03:26:51 am

Да, а многопоточное решение по производительности не отличимо в этом тесте от однопоточного.

Что очень странно. Единственное объяснение, которое я могу придумать - все уперлось в диск. А наблюдаемая разница на моем нетбуке - это потому что проц совсем дохлый.

trurl · « **Ответ #136 :** Декабрь 07, 2016, 05:24:34 am »

Цитата: valexey_u от Декабрь 06, 2016, 03:44:05 pm

То есть выходит, что чтобы и читать и писать, нужно использовать openedforrandom. Т.е., вероятно, использовать не SeqFile, а RndFile.

Я надеялся, что SeqFile как-то оптимизирван для последовательного чтения. Но похоже, там банально вызывается какой-нибудь fread/fwrite без буфферизации. Попробовал еще на аде. Там та же петрушка, только ещё медленнее раза в 2-3.

trurl · « **Ответ #137 :** Декабрь 07, 2016, 05:30:00 am »

Цитата: vlad от Декабрь 07, 2016, 04:24:06 am

Цитата: valexey_u от Декабрь 07, 2016, 03:26:51 am
Да, а многопоточное решение по производительности не отличимо в этом тесте от однопоточного.

Что очень странно. Единственное объяснение, которое я могу придумать - все уперлось в диск. А наблюдаемая разница на моем нетбуке - это потому что проц совсем дохлый.

Для внешней сортировки всегда полезнее иметь несколько дисков, чем несколько процессоров.

valexey_u · « **Ответ #138 :** Декабрь 07, 2016, 01:48:13 pm »

Цитата: vlad от Декабрь 07, 2016, 04:24:06 am

Цитата: valexey_u от Декабрь 07, 2016, 03:26:51 am
Да, а многопоточное решение по производительности не отличимо в этом тесте от однопоточного.

Что очень странно. Единственное объяснение, которое я могу придумать - все уперлось в диск. А наблюдаемая разница на моем нетбуке - это потому что проц совсем дохлый.

Открыта тайна третьей планеты!

В смысле, я нашел в чем была засада - многопоточное решение не смогло слинковаться, в итоге вместо него тестировалось обычное fast (да, скрипты тестирования писал я, и у меня крайне кривые руки). Сейчас пофикшу.

valexey_u · « **Ответ #139 :** Декабрь 07, 2016, 02:53:17 pm »

А после того как собрали, многопоточка выходила за ограничения по памяти, а после фикса этого выдает не верный результат (размер файла не верен).

vlad · « **Ответ #140 :** Декабрь 08, 2016, 07:55:41 am »

Цитата: valexey_u от Декабрь 07, 2016, 02:53:17 pm

А после того как собрали, многопоточка выходила за ограничения по памяти, а после фикса этого выдает не верный результат (размер файла не верен).

Фикснул. Как я и предполагал - непрваильно поток прибивался, до того как он успел файлик записать

С памятью интереснее - у меня не получилось выставить ограничение (процесс не прибивается, если много отжирает).

valexey_u · « **Ответ #141 :** Декабрь 08, 2016, 02:17:48 pm »

Цитата: vlad от Декабрь 08, 2016, 07:55:41 am

Цитата: valexey_u от Декабрь 07, 2016, 02:53:17 pm
А после того как собрали, многопоточка выходила за ограничения по памяти, а после фикса этого выдает не верный результат (размер файла не верен).

Фикснул. Как я и предполагал - непрваильно поток прибивался, до того как он успел файлик записать
С памятью интереснее - у меня не получилось выставить ограничение (процесс не прибивается, если много отжирает).

Через час-два будут результаты очередного быстрого прогона.

valexey_u · « **Ответ #142 :** Декабрь 08, 2016, 03:37:37 pm »

Результаты готовы.

trurl · « **Ответ #143 :** Декабрь 08, 2016, 06:53:39 pm »

Интересно, а срди тестов есть распределения с малой дисперсией?

valexey_u · « **Ответ #144 :** Декабрь 08, 2016, 07:38:51 pm »

Цитата: trurl от Декабрь 08, 2016, 06:53:39 pm

Интересно, а срди тестов есть распределения с малой дисперсией?

скорее всего пока что нет. но всё будет :-) если для вашего алгоритма существует наихудший набор данных, то он будет среди тестов. :-)

trurl · « **Ответ #145 :** Декабрь 08, 2016, 08:38:41 pm »

Это не для моего :-). Мне кажется bucketsort с фиксированными корзинами должен на таких задачах страдать.

valexey_u · « **Ответ #146 :** Декабрь 08, 2016, 08:57:44 pm »

Цитата: trurl от Декабрь 08, 2016, 08:38:41 pm

Это не для моего :-). Мне кажется bucketsort с фиксированными корзинами должен на таких задачах страдать.

Ну, это я отвлеченно говорил :-)

valexey_u · « **Ответ #147 :** Декабрь 08, 2016, 10:00:17 pm »

Ну вот тест на 2Гб файле, первая колонка - с большой дисперсией, вторая колонка - с малой (массив одинаковых значений).

Код: [Выделить]

comdiv hardcore:
2048 458.21    32.54
comdiv hardcore-single-temp:
2048 127.72    74.92
elektrybalt merge_qs:
2048 failed    failed
elena files_merge:
2048 588.93    481.45
elena linux_mmap:
2048 194.04    104.73
valexey sortix:
2048 285.63    30.70
vlad fast:
2048 141.40    66.23
vlad simple:
2048 606.04    499.26
vlad multi-threaded:
2048 279.11    147.41

valexey_u · « **Ответ #148 :** Декабрь 08, 2016, 11:17:15 pm »

В общем, дальше планы такие: я сейчас запущу пятикратный прогон теста. Потом, если кто-то будет обновлять/исправлять/добавлять решения я буду делать новые прогоны. С системе тестирования по крайней мере до понедельника никаких изменений не будет, не будет и каких-то решений от меня.

На следующей неделе (а если не уложусь, то и через неделю) я хочу допилить визуализацию результатов тестирования (очевидно, что текущий вариант не достаточно нагляден для случая когда у нас много разных решений), плюс добавлю дополнительные тесты а также модифицирую своё решение и добавлю ещё одно своё.

Потом хочу попробовать так или иначе найти ещё участников соревнования :-) Если никого больше не найдется, то будет финальное тестирование и подготовка к фазе 2.

Valery Solovey · « **Ответ #149 :** Декабрь 09, 2016, 09:17:02 am »

А как насчёт сделать показ не абсолютных значений, а относительных?
Самый быстрый вариант - это 100%, а все остальные больше (или меньше) этой величины.

В таком случае можно будет прм обновлении одного варианта прогонять только самый быстрый и обновлённый варианты. Полный прогон, конечно, можно считать более точным, но его не обязательно делать ежедневно: нам же интересен порядок величин для оценки работы алгоритмов. То есть, если одно решение быстрее другого, то этого будет достаточно.

И ещё: сильно ли различаются результаты тестов, проведённых над одними и теми же алгоритмами в разные дни? Есть ли смысл перезапускать уже проведённые тесты?

Oberon space

Новости:

Автор Тема: Расширенный тест на производительность. (Прочитано 121369 раз)

vlad

Re: Расширенный тест на производительность.

trurl

Re: Расширенный тест на производительность.

trurl

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

vlad

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

trurl

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

trurl

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

valexey_u

Re: Расширенный тест на производительность.

Valery Solovey

Re: Расширенный тест на производительность.