Автор Тема: Предложите альтернативный алгоритм (Прочитано 9444 раз)

vlad · « : Февраль 27, 2012, 01:52:27 pm »

В продолжении темы о частных велосипедах против стандартных решений.

Строится дерево. У него встречаются подобные узлы (с одинаковым атрибутом, например, именем). Эти узлы надо связать между собой.

Стандартное решение: строим дерево, потом бежим по нему и заносим ссылки на все узлы в отсортированную последовательность. Если очередной узел подобен найденному - связываем узлы.

Я подумал, что может я мыслю слишком шаблонно и есть более эффективный велосипед...

Peter Almazov · « **Ответ #1 :** Февраль 27, 2012, 02:23:06 pm »

Сразу возникает 2 вопроса.
1. Почему это не делается сразу в процессе построения дерева.
2. Почему "в отсортированную последовательность", а не в хеш-таблицу.

vlad · « **Ответ #2 :** Февраль 27, 2012, 03:18:42 pm »

Цитата: Peter Almazov от Февраль 27, 2012, 02:23:06 pm

Сразу возникает 2 вопроса.
1. Почему это не делается сразу в процессе построения дерева.

Дерево строится как "побочный эффект" в процессе некоторого вычисления (через механизм коллбэков). Специфика такова, что чем меньше времени будет потрачено в коллбэках - тем лучше (иначе это время придется учитывать, что создаст дополнительную сложность). Т.е., все дополнительные действия, не связанные напрямую с постройкой дерева лучше отложить на потом. Но можно попробовать игнорировать это ограничение, если оно сильно мешает хорошему (простому и быстрому) решению.

Цитата: Peter Almazov от Февраль 27, 2012, 02:23:06 pm

2. Почему "в отсортированную последовательность", а не в хеш-таблицу.

А есть принципиальная разница?

Peter Almazov · « **Ответ #3 :** Февраль 27, 2012, 03:26:27 pm »

Цитата: vlad от Февраль 27, 2012, 03:18:42 pm

А есть принципиальная разница?

Хеш быстрее работает.

valexey · « **Ответ #4 :** Февраль 27, 2012, 03:30:34 pm »

Цитата: Peter Almazov от Февраль 27, 2012, 03:26:27 pm

Цитата: vlad от Февраль 27, 2012, 03:18:42 pm
А есть принципиальная разница?
Хеш быстрее работает.

Не всегда.

vlad · « **Ответ #5 :** Февраль 27, 2012, 03:32:07 pm »

Цитата: Peter Almazov от Февраль 27, 2012, 03:26:27 pm

Цитата: vlad от Февраль 27, 2012, 03:18:42 pm
А есть принципиальная разница?
Хеш быстрее работает.

Быстрее когда? При построении (вставке), при поиске? Например, применительно к данной задаче - вставок будет много (все дерево, которое достаточно большое > 1000 узлов), одинаковых элементов мало, поиска много (опять же - на каждый элемент).

DIzer · « **Ответ #6 :** Февраль 27, 2012, 03:44:38 pm »

1.) А какое дерево создается?
2.)Правильно ли я понял, что структура произвольного узла может изменяться?

DIzer · « **Ответ #7 :** Февраль 27, 2012, 03:49:06 pm »

И, наконец, какие операции вы определяете над деревом

vlad · « **Ответ #8 :** Февраль 27, 2012, 03:51:08 pm »

Цитата: DIzer от Февраль 27, 2012, 03:44:38 pm

1.) А какое дерево создается?

В смысле? Обычное дерево. С произвольным количеством листьев/веток в узле.

Цитата: DIzer от Февраль 27, 2012, 03:44:38 pm

2.)Правильно ли я понял, что структура произвольного узла может изменяться?

Да, узел можно сделать каким угодно.

vlad · « **Ответ #9 :** Февраль 27, 2012, 03:57:44 pm »

Цитата: DIzer от Февраль 27, 2012, 03:49:06 pm

И, наконец, какие операции вы определяете над деревом

После построения? Оно обходится и по нему строится еще одно дерево

С игнорированием некоторых узлов (оказавшихся ненужными). И подсчетом статистики для подобных узлов (для такого узла есть столько-то подобных и сума их атрибутов вот такая). Да, потом уже в линейном виде все это будет еще раз сортироваться уже согласно статистике

DIzer · « **Ответ #10 :** Февраль 27, 2012, 04:12:03 pm »

Цитата: vlad от Февраль 27, 2012, 03:57:44 pm

После построения? Оно обходится и по нему строится еще одно дерево С игнорированием некоторых узлов (оказавшихся ненужными). И подсчетом статистики для подобных узлов (для такого узла есть столько-то подобных и сума их атрибутов вот такая). Да, потом уже в линейном виде все это будет еще раз сортироваться уже согласно статистике

Правильно ли я понимаю задачу
1. есть дерево - набор узлов , с количеством ребер m принадлежащем интервалу 1..M
2. каждый узел МОЖЕТ содержать вариативную составляющую (набор полей) по которой ведется поиска.
Требуется оптимизировать поиск?

DIzer · « **Ответ #11 :** Февраль 27, 2012, 04:20:23 pm »

Если это так, то целесообразно помещать (при создании дерева) узел в структуру с доступом O(1) - массив, хэш таблица
Если дополнительно известно, что поиск будет вестись СТРОГО по одному ключу - рассмотреть возможность использования BST- сбалансированный вариант, (либо красно черный) либо запихивать отсортированные данные

DIzer · « **Ответ #12 :** Февраль 27, 2012, 04:38:22 pm »

Вообще говоря общее решение нам дает гаранированное время поиска O(n) - так что можно использовать в качестве контейнера обычный односвязанный список и не заморачиваться.
Частные решения могут дать поиск O( log2(n))

DIzer · « **Ответ #13 :** Февраль 27, 2012, 05:20:54 pm »

Таким образом в стандартном случае наша система описывается :

TYPE

TNodeDesc=RECORD (* описание узла*)
.....
END;

PListNnode = POINTER TO TLISTNODE;

TLISTNODE = RECORD
TreeNode:TNodeDesc;
Next: PListNnode;
END:

(*Ключ поиска*)
TSearchKey =RECORD
....
END;

(*Поиск*)
PROCEDURE SearchList(aList :PListNnode, Akey:TSearchKey ):PListNnode;

Губанов Сергей Юрьевич · « **Ответ #14 :** Февраль 27, 2012, 08:47:15 pm »

А имеет ли значение тот факт, что где-то там дерево? Может быть проще забыть о нём и сформулировать задачу иначе: Есть множество из N>1000 объектов, требуется найти все подобные (функция вычисляющая подобие двух объектов дана). Правда в таком общем виде потребуется полный перебор O(N^2), что для N>1000 считается неприемлемым. Чтобы ускорить вычисления надо знать детали функции подобия. Если она допускает сортировку, то да, сортировать надо, в отсортированном виде все подобные окажутся рядышком.

Oberon space

Новости:

Автор Тема: Предложите альтернативный алгоритм (Прочитано 9444 раз)

vlad

Предложите альтернативный алгоритм

Peter Almazov

Re: Предложите альтернативный алгоритм

vlad

Re: Предложите альтернативный алгоритм

Peter Almazov

Re: Предложите альтернативный алгоритм

valexey

Re: Предложите альтернативный алгоритм

vlad

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

vlad

Re: Предложите альтернативный алгоритм

vlad

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

DIzer

Re: Предложите альтернативный алгоритм

Губанов Сергей Юрьевич

Re: Предложите альтернативный алгоритм