Tiefensuche

Tiefensuche in einem Baum

Tiefensuche (englisch depth-first search, DFS) ist in der Informatik ein Verfahren zum Suchen von Knoten in einem Graphen. Sie zählt zu den uninformierten Suchalgorithmen. Im Gegensatz zur Breitensuche wird bei der Tiefensuche zunächst ein Pfad vollständig in die Tiefe beschritten, bevor abzweigende Pfade beschritten werden. Dabei sollen alle erreichbaren Knoten des Graphen besucht werden. Für Graphen mit potentiell wenigen, langen Pfaden bietet sich die beschränkte Tiefensuche an, bei der jeder Pfad nur bis zu einer bestimmten Tiefe beschritten wird.

Eine Verbesserung der Tiefensuche ist die iterative Tiefensuche.

Allgemeines

Die Tiefensuche ist eine uninformierte Suche, welche durch Expansion des jeweils ersten auftretenden Nachfolgeknotens im Graph nach und nach vom Startknoten aus weiter in die Tiefe sucht. In welcher Reihenfolge die Nachfolger eines Knotens dabei bestimmt werden, hängt von der Repräsentation der Nachfolger ab. Bei der Repräsentation über eine Adjazenzliste mittels einer verketteten Liste werden beispielsweise die Knoten in der Reihenfolge ihres Eintrags in dieser Liste durchlaufen. Im oben angegebenen Bild wird implizit davon ausgegangen, dass die Nachfolger "von links nach rechts" ausgewählt werden.

Für ungerichtete Graphen sieht das Verfahren wie folgt aus: Zuerst wird ein Startknoten $\left.u\right.$ ausgewählt. Von diesem Knoten aus wird nun die erste Kante $\left(u,v\right)$ betrachtet und getestet, ob der gegenüberliegende Knoten $\left.v\right.$ schon entdeckt wurde bzw. das gesuchte Element ist. Ist dies noch nicht der Fall, so wird rekursiv für diesen Knoten die Tiefensuche aufgerufen, wodurch wieder der erste Nachfolger dieses Knotens expandiert wird. Diese Art der Suche wird solange fortgesetzt, bis das gesuchte Element entweder gefunden wurde oder die Suche bei einer Senke im Graphen angekommen ist und somit keine weiteren Nachfolgeknoten mehr untersuchen kann. An dieser Stelle kehrt der Algorithmus nun zum zuletzt expandierten Knoten $\left.u\right.$ zurück und untersucht den nächsten Nachfolger des Knotens. Sollte es hier keine weiteren Nachfolger mehr geben, geht der Algorithmus wieder Schritt für Schritt zum jeweiligen Vorgänger zurück und versucht es dort erneut. Ein Beispiel für die Anwendung der Tiefensuche auf einem Baum findet man im oben stehenden Bild.

Die Kanten des Graphen, die vom Tiefensuche-Algorithmus zum Durchlaufen des Graphen benutzt werden, werden als Baumkanten bezeichnet. Diejenigen Kanten, die nicht benutzt werden und von einem Knoten zu einem anderen Knoten im selben Teilbaum führen, der bei der Tiefensuche später besucht wird, heißen Vorwärtskanten. Diejenigen Kanten, die nicht benutzt werden und von einem Knoten zu einem anderen Knoten im selben Teilbaum führen, der bei der Tiefensuche bereits vorher besucht wurde, heißen Rückwärtskanten. Diejenigen Kanten, die „quer“ von einem Teilbaum zu einem anderen Teilbaum verlaufen, heißen Querkanten. Innerhalb des Tiefensuchbaums würde der Pfad zwischen zwei über eine Querkante verbundenen Knoten zunächst ein Auf- und dann ein Absteigen im Baum erfordern. Vorwärtskanten, Rückwärtskanten, Querkanten und Baumkanten ergeben insgesamt die Kantenmenge des Graphen.

Algorithmus (informell)

Bestimme den Knoten, an dem die Suche beginnen soll
Expandiere den Knoten und speichere der Reihenfolge nach den kleinsten/größten (optional) noch nicht erschlossenen Nachfolger in einem Stack
Rufe rekursiv für jeden der Knoten in dem Stack DFS (depth first search oder Tiefensuche) auf
- Falls das gesuchte Element gefunden wurde, brich die Suche ab und liefere ein Ergebnis
- Falls es keine nicht erschlossenen Nachfolger mehr gibt, lösche den obersten Knoten aus dem Stack und rufe für den jetzt oberen Knoten im Stack DFS (depth first search oder Tiefensuche) auf

Algorithmus (formal)

DFS(node, goal) {
  if (node == goal) {
    return node;
  } else {
    stack := expand (node)
    while (stack is not empty) {
      node' := pop(stack);
      DFS(node', goal);
    }
  }
}

Algorithmusbeispiel: Erzeugen des Tiefensuchwaldes (rekursiv)

Der folgende rekursive Algorithmus erzeugt den Tiefensuchwald eines Graphen G mittels Setzen von Discovery- und Finishing-Times und Färben der Knoten. In Anlehnung an Thomas H. Cormen et al. werden zunächst alle Knoten weiß gefärbt. Anschließend startet die Tiefensuche per Definition beim alphabetisch kleinsten Knoten und färbt diesen grau. Danach wird, wie oben beschrieben rekursiv dessen weißer Nachbar betrachtet und grau gefärbt. Existiert kein weißer Nachbar mehr, kommt es zum Backtracking, während dessen alle durchwanderten Knoten schwarz gefärbt werden.

DFS(G)
1   for each v of G {        // Alle Knoten weiß färben, Vorgänger auf nil setzen
2      col[v] = 'w';
3      pi[v] = nil;
4   }
5   time = 0;
6   for each u of G          // Für alle weißen Knoten: DFS-visit aufrufen
7      if col[u] == 'w'
8         DFS-visit(u);

DFS-visit(u)
1   col[u] = 'g';            // Aktuellen Knoten grau färben
2   time++;                  // Zeitzähler erhöhen
3   d[u] = time;             // Entdeckzeit des aktuellen Knotens setzen
4   for each v of Adj[u] {   // Für alle weißen Nachbarn des aktuellen Knotens
5       if col[v] == 'w' {
6          pi[v] = u;         // Vorgänger auf aktuellen Knoten setzen
7          DFS-visit(v);      // DFS-visit aufrufen
8       }
9       if col[v] == 'g'{
10         // Zyklus entdeckt
11      }
12    }
13   col[u] = 's';           // Aktuellen Knoten schwarz färben
14   time++;
15   f[u] = time;            // Finishing-Time des aktuellen Knotens setzen

Den Zeitstempel (Z. 2,14,15) kann man weiterhin für eine topologische Sortierung verwenden. Nachdem ein Knoten schwarz gefärbt wurde, wird er einer Liste, absteigend nach f[u]-Werten, hinzugefügt und man erhält eine topologische Reihenfolge. Wird ein Zyklus (Zeile 9) entdeckt, ist dies nicht mehr möglich.

Eigenschaften

Im Folgenden werden Speicherplatzverbrauch und Laufzeit des Algorithmus in Landau-Notation angegeben. Wir gehen außerdem von einem gerichteten Graphen aus.

Speicherplatz

Der Speicherplatzverbrauch des Algorithmus wird ohne den Speicherplatz für den Graphen, wie er übergeben wird, angegeben, denn dieser kann in verschiedenen Formen mit unterschiedlichem Speicherverbrauch vorliegen, z.B. als verkettete Liste, als Adjazenzmatrix oder als Inzidenzmatrix.

Für die oben beschriebene Prozedur DFS(G) werden zunächst alle Knoten weiß gefärbt und deren Eltern auf Nil gesetzt. Diese Informationen benötigt also für jeden Knoten konstanten Speicherplatz, also ${\mathcal {O}}(1)$ . Insgesamt ergibt sich ein linearer Speicherverbrauch von ${\mathcal {O}}(\vert V\vert )$ , abhängig von der Anzahl der Knoten $\vert V\vert$ (englisch vertices). Der Speicherplatzverbrauch der Variable time ist mit konstantem ${\mathcal {O}}(1)$ gegenüber ${\mathcal {O}}(\vert V\vert )$ vernachlässigbar. Anschließend wird für jeden Knoten u die Prozedur DFS-visit(u) aufgerufen. Da es sich hierbei nur um Kontrollstrukturen handelt, tragen sie nicht zum Speicherplatzverbrauch bei.

Die Prozedur DFS-visit(u) arbeitet auf der bereits aufgebauten Speicherstruktur in der alle Knoten abgelegt sind und erweitert diese pro Knoten noch um die Entdeckzeit und die Finishing-Time, jeweils konstant ${\mathcal {O}}(1)$ . Das ändert nichts am bisherigen linearen Speicherplatzverbrauch ${\mathcal {O}}(\vert V\vert )$ . Da sonst in DFS-visit(u) keine weiteren Variablen mehr eingeführt werden, hat die Tiefensuche einen Speicherplatzverbrauch von ${\mathcal {O}}(\vert V\vert )$ .

Laufzeit

Falls der Graph als Adjazenzliste gespeichert wurde, müssen im schlimmsten Fall alle möglichen Pfade zu allen möglichen Knoten betrachtet werden. Damit beträgt die Laufzeit von Tiefensuche ${\mathcal {O}}(\vert V\vert +\vert E\vert )$ , wobei $\vert V\vert$ für die Anzahl der Knoten und $\vert E\vert$ für die Anzahl der Kanten im Graph stehen.

Vollständigkeit

Falls ein Graph unendlich groß ist oder kein Test auf Zyklen durchgeführt wird, so ist die Tiefensuche nicht vollständig. Es kann also sein, dass ein Ergebnis – obwohl es existiert – nicht gefunden wird.

Optimalität

Tiefensuche ist insbesondere bei monoton steigenden Pfadkosten nicht optimal, da eventuell ein Ergebnis gefunden wird, zu welchem ein sehr viel längerer Pfad führt als zu einem alternativen Ergebnis. Dafür wird ein solches Ergebnis i.A. deutlich schneller gefunden als bei der (in diesem Fall optimalen, aber sehr viel speicheraufwendigeren) Breitensuche. Als Kombination von Tiefen- und Breitensuche gibt es die iterative Tiefensuche.

Anwendung

Die Tiefensuche ist indirekt an vielen komplexeren Algorithmen für Graphen beteiligt. Ein Beispiel ist das Auffinden aller starken Zusammenhangskomponenten eines Graphen.
Bei einem Abhängigkeits-Baum ergeben die sortierten finish-Zeiten (siehe Pseudocode oben) eine invers-topologische Sortierung.
Mit der Tiefensuche kann man Graphen in Laufzeit ${\mathcal {O}}(\vert V\vert +\vert E\vert )$ auf Kreise testen und im Falle von Kreisen die dazugehörige Kantenfolge ausgeben.
Ein kreisfreier Graph kann mit der Tiefensuche in Laufzeit ${\mathcal {O}}(\vert V\vert +\vert E\vert )$ topologisch sortiert werden.

Basierend auf einem Artikel in:

Wikipedia.de