Kapitel 12 Sudoku: Backtracking-Algorithmus

In diesem Kapitel werden wir erneut am Sudoku arbeiten, diesmal jedoch einen effizienteren Backtracking-Algorithmus verwenden. Im Gegensatz zum völlig stochastischen Brute-Force-Algorithmus, der versucht, das gesamte Spielbrett auf einmal zu “erraten”, macht der Backtracking-Algorithmus eine fundierte Vermutung über jeweils eine Zelle zur Zeit. Wie in den vorherigen Kapiteln werden wir das Programm Schritt für Schritt aufbauen, aber die gute Nachricht ist, dass du fast alles, was du zur Implementierung brauchst, bereits kennst: Matrizen, Slicing und rekursive Funktionen. Zusätzlich werden wir es als Gelegenheit nutzen, um mehr über Listen und NumPy zu lernen. Schnapp dir das Übungs-Notebook und lies weiter.

12.1 Kapitelkonzepte

Wiederholung von Listen
Entpacken von Tupeln und Listen
Seeding des Zufallsgenerators
Umformen von Arrays
Ausnahmen Auslösen und Behandeln

12.2 Backtracking-Algorithmus

Dieser Algorithmus ist sehr intuitiv, wenn man ihn sich als Erforschung eines Baumes vorstellt. Jeder Knoten ist eine Zelle, und unser Baum ist 82 Ebenen tief (beginnend mit einem leeren Gitter und durchgehend durch alle 81 Zellen). Jeder Knoten hat bis zu neun mögliche Kanten, die von ihm ausgehen. Warum bis zu neun? Wir können die Zahlen 1 bis 9 verwenden (also maximal neun Kanten), aber es sei denn, eine Zelle befindet sich in einer völlig leeren Reihe, Spalte und Block, werden einige Werte bereits vergeben sein, was die gültigen Kanten einschränkt.

Ein Beispiel für einen solchen Baum für \(4\times4\) Sudoku wird in der Abbildung unten illustriert. Du beginnst oben mit einem leeren Raster und du hast vier mögliche Wege, um die erste Zelle (in Rot markiert) auszufüllen. Wenn du jedoch zu einer anderen Zelle wechselst (eine Ebene tiefer gehst), sind deine Wahlmöglichkeiten eingeschränkt, da beide Zellen zur selben Reihe gehören. Das bedeutet, wenn du \(1\) gewählt hast, hast du drei Möglichkeiten bis auf die \(1\), und wenn du \(3\) gewählt hast, hast du drei Möglichkeiten bis auf die \(3\). Sobald du eine der verfügbaren Optionen gewählt hast, gehst du zur nächsten Zelle. Es kann jedoch vorkommen, dass du in eine Sackgasse gerätst, wie unten rechts gezeigt: Alle vier Zahlen wurden bereits verwendet, also gibt es keinen gültigen Wert für die Zelle und dieser Weg durch den Baum ist ungültig. Die Lösung ist, ein Stück zurückzugehen: Eine Ebene nach oben gehen, eine andere Zahl für die Zelle anstelle von \(4\) wählen. Hier könntest du mit sowohl \(1\) als auch \(2\) ein vollständiges Brett enden. Dies ist wichtig, da der Baum alle möglichen Wege und daher alle möglichen \(4\times4\) gültigen Sudoku-Matrizen definiert!

Sudoku erstellen durch das Erforschen eines Baumes

Wenn du geduldig genug bist, alle Pfade in diesem Baum systematisch zu erkunden, wirst du alle gültigen Sudoku-Matrizen finden. Jedoch wollen wir nicht alle, sondern genau eine. Gleichzeitig möchten wir, dass unser Programm bei jedem Durchlauf eine andere Matrix generiert. Wenn wir unseren Erkundungsweg festlegen (immer durch die Zellen in derselben Reihenfolge gehen) und unsere Wahlmöglichkeiten festlegen (wir gehen immer durch verfügbare Zahlen in aufsteigender Reihenfolge), werden wir immer mit der gleichen Matrix enden. Daher wird unsere Erkundungsstrategie Zufälligkeit beinhalten. Zunächst werden wir mit kleineren \(4\times4\) Matrizen arbeiten, aber sobald der Algorithmus funktioniert, wird es einfach sein, ihn so anzupassen, dass er die richtigen \(9\times9\) Matrizen erzeugt.

12.3 Leere Matrix (voller Nullen)

Die allererste Matrix in unserem Baum ist leer. Zur Vereinfachung bezeichnen wir Leerstellen mit \(0\), daher musst du eine \(4\times4\) Matrix erzeugen, die mit Nullen gefüllt ist. Schreibe den Code dafür unter Verwendung von NumPy: Es gibt eine Funktion, über die du das letzte Mal gelernt hast, die genau diese Aufgabe erledigt. Ein wichtiges Detail, definiere die Größe der Matrix (\(4\)) als eine KONSTANTE (nennen wir sie SUDOKU_SIZE). Diese Zahl definiert sowohl die Größe der Matrix als auch den Bereich der Zahlen, sodass dies die einzige Änderung sein wird, die erforderlich ist, um Sudoku unterschiedlicher Größe zu erzeugen.

Mache Übung #1.

12.4 Empty matrix but via list repetitions

12.5 Leere Matrix, aber durch List-Wiederholungen

Die NumPy-Lösung erfüllt ihren Zweck, es gibt jedoch auch eine alternative Methode zur Erstellung über Wiederholungen von Listen. Das vereinfacht die Dinge hier zwar nicht, aber es ist ein netter Trick, der hilfreich sein kann, wenn man mit Listen arbeitet. Nämlich, du kannst eine Liste \(N\)-mal wiederholen mit <Liste> * N, wobei * N bedeutet “N-mal wiederholen”. Hier ist ein Beispiel für die viermalige Wiederholung eines Arrays mit drei Elementen.

[1, 2, 3] * 4
#> [1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

Angesichts der Tatsache, dass du eine Liste von Listen wiederholen kannst, erzeuge eine \(4\times4\) Liste von Listen, die alle Nullen enthält (diese kann in eine \(4\times4\) Matrix mittels np.array umgewandelt werden). Dafür benötigst du nur eine Zeile Code, du darfst die \(0\) nicht von Hand wiederholen (also nur eine \(0\) in deinem Code!) und verwende die Konstante SUDOKU_SIZE.

#> [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]

Mache Übung #2.

Ein wichtiger Hinweis zum Gebrauch von * für Listen im Vergleich zu NumPy-Arrays. Im letzteren Fall bedeutet * “multiplizieren mit”, also selbst wenn die Dinge ähnlich aussehen, werden sie sich sehr unterschiedlich verhalten!

a_list = [1, 2, 3]
an_array = np.array(a_list)

# Wiederholung für Listen
a_list * 2
#> [1, 2, 3, 1, 2, 3]

# Multiplikation für NumPy-Arrays
an_array * 2
#> array([2, 4, 6])

12.6 Zellenreihe und -spalte aus Index

Es gibt verschiedene Möglichkeiten, einen zufälligen Weg durch die Zellen zu definieren. In der Matrix wird jede Zelle durch ihre Reihe und Spalte identifiziert, aber wir können auch davon ausgehen, dass die Zellen einen eindeutigen Index haben, der von 0 bis SUDOKU_SIZE * SUDOKU_SIZE - 1 geht (warum minus eins?). Hier ist eine Illustration von dem, was ich meine. Der Index geht von der Zelle oben links nach rechts und unten, also wenn du die Zellenreihe und -spalte kennst, kannst du ihren Index berechnen. Umgekehrt, wenn du den Zellenindex kennst, kannst du berechnen, in welcher Reihe und Spalte sie sich befindet. Zum Beispiel befindet sich die hervorgehobene Zelle mit Index \(9\) in Reihe \(2\) und Spalte \(1\). Das Gleiche gilt für die Reihe und Spalte des Blocks, zu dem die Zelle gehört.

Zellenindex sowie Reihen- und Spaltenindizes.

Deine Aufgabe ist es, eine Funktion zu schreiben, die einen Zellenindex und die Reihenbreite als Parameter nimmt und ein Tupel (eine unveränderliche Liste) mit (Reihe, Spalte) zurückgibt. Um einen Gesamtindex in Reihe und Spalte umzuwandeln, solltest du zwei spezielle Division-Operatoren verwenden: den Ganzzahl-Division-Operator // und den Modulo, Rest-Division-Operator %. Der erste gibt nur den ganzzahligen Teil der Division zurück, sodass 4 // 3 gleich 1 ist (weil 4/3 gleich 1.33333 ist) und 1 // 4 gleich 0 ist (weil 1/4 gleich 0.25 ist). Der letztere gibt die verbleibenden Ganzzahlen zurück, so dass 4 % 3 gleich 1 und 1 % 4 gleich 0 ist. Diese beiden Operatoren reichen aus, um die Indizes für Reihe und Spalte zu berechnen.

Schreibe die Funktion und teste sie, indem du die zurückgegebenen Werte überprüfst. Zur Erinnerung, du solltest ein Tupel mit zwei Werten erhalten (return (Reihe, Spalte)), also sollte deine Ausgabe für den Index \(9\) wie folgt aussehen:

row_col_from_index(9, SUDOKU_SIZE)
#> (2, 1)

Füge row_col_from_index in utils.py ein Teste es in code01.py

12.7 Zellenblock (Reihe und Spalte) aus Index

Unsere Zelle gehört auch zu einem Block, der durch ihre Reihen- und Spaltenindizes definiert werden kann, wie in der folgenden Abbildung dargestellt.

Zellenindex sowie Block-Reihen- und Spaltenindizes.

Du kannst den Block-Reihen- und Spaltenindex aus der Reihe und Spalte berechnen, die du zuvor ermittelt hast. Denke darüber nach, welchen Operator du dafür benötigst, und du wirst auch die Blockbreite benötigen, die du leicht aus der Reihenbreite berechnen kannst: Überlege dir, wie du dies entweder mit Python oder NumPy tun kannst, wenn du bedenkst, dass du bei einem \(4\times4\) Gitter 2 Blöcke, bei einem \(9\times9\) — 3, bei einem \(16\times16\) — 4 usw. hast. Beachte, dass die Blockbreite zwingend eine ganze Zahl sein muss, also stelle sicher, dass du den Wert umwandelst. Erweitere deine vorherige Funktion (ich habe sie coords_from_index genannt), sodass sie ein Vierer-Tupel (Reihe, Spalte, Blockreihe, Blockspalte) wie im untenstehenden Ausgabebeispiel zurückgibt. Teste sie für verschiedene Zellenindizes, wobei du die obige Abbildung als Referenz verwendest.

coords_from_index(9, SUDOKU_SIZE)
#> (2, 1, 1, 0)

Füge coords_from_index in utils.py ein Teste den Code in code02.py

12.8 Tupel entpacken

Unsere Funktion gibt ein Tupel der Form (Reihe, Spalte, Blockreihe, Blockspalte) zurück. Theoretisch könnten wir es über Indizes verwenden, sodass row_col[0] die Reihe und row_col[1] die Spalte usw. bedeutet, aber das ist schwer lesbar. Es gibt eine bessere Lösung durch sogenanntes “Entpacken” (“unpacking”). Wenn du ein Tupel erstellst, “verpackst” du vier Werte darin, das “Entpacken” kehrt diesen Vorgang um⁴⁷.

row, col, block_row, block_col = coords_from_index(9, SUDOKU_SIZE)

print("Row: %d, column %d, block row %d, block column %d"%(row, col, block_row, block_col))
#> Row: 2, column 1, block row 1, block column 0

Dieser Trick funktioniert nur, wenn die Anzahl der Elemente und Variablen übereinstimmt, also nur geeignet, wenn zurückgegebene Tupel in ihrer Größe fest sind. Beachte, dass derselbe Trick auch bei einer Liste funktioniert, aber dies bricht die Semantik. Es ist okay für Tupel, weil sie unveränderlich sind und ihre Verwendung dem Leser anzeigt, dass ihre Größe zumindest konzeptionell festgelegt ist. Im Gegensatz dazu sind Listen veränderlich, sodass ihre Verwendung darauf hinweist, dass sie beliebig lang sein können. Nochmals, es macht keinen tatsächlichen Unterschied im Programm für ein Tupel oder eine Liste von identischer Größe, aber diese Unterscheidung dient dazu, den Leser über deine Absichten zu informieren, und jegliche Hilfe beim Lesen von Code sollte willkommen sein.

# zu wenige Werte (oder zu viele Variablen)
row, col, depth = row_col_from_index(9, SUDOKU_SIZE)
#> not enough values to unpack (expected 3, got 2)

# zu viele Werte (oder zu wenige Variablen)
row, col, depth = coords_from_index(9, SUDOKU_SIZE)
#> too many values to unpack (expected 3)

12.9 Reihenfolge des Pfades zufällig gestalten

Jetzt, wo du die Funktion hast, lass uns einen zufälligen Pfad generieren und ihn visualisieren. Dafür:

erzeuge eine leere (Nullen) Matrix
erzeuge eine Sequenz aller gültigen Zellenindizes (du kannst entweder die Python- oder die NumPy-Lösung dafür verwenden, je nachdem, was du bevorzugst)
mische die Reihenfolge der Sequenz durch
iteriere über die Sequenz und trage für jeden Index den Besuchsreihenfolge-Index in die Zelle ein (z.B. bekommt die erste besuchte Zelle \(1\), die zweite \(2\), …, die letzte \(16\)). Hinweis!
drucke die Matrix wie unten aus

#> [[ 1.  2.  9. 15.]
#>  [11.  3. 16. 12.]
#>  [ 7.  8. 13.  6.]
#>  [14.  5.  4. 10.]]

Teste den Code in code03.py

12.10 Zufallsgenerator seeden

Die Wahrscheinlichkeit ist hoch, dass deine Matrix anders aussieht als meine. Das macht Sinn, wir wollten, dass die Dinge zufällig sind, also ist es höchst unwahrscheinlich, genau dieselbe Reihenfolge des Zellenbesuchs zu erhalten. Manchmal benötigst du jedoch ein Paradoxon: Zufällige Zahlen, die gleich sind. D.h., du möchtest zwar zufällige Zahlen, aber du möchtest dieselben zufälligen Zahlen wie jemand anders. Das klingt seltsam, wird aber häufig benötigt, wenn du Zufälligkeit verwenden und jemand anders in der Lage sein möchtest, deine Ergebnisse genau zu replizieren. Zum Beispiel bestimmen die anfänglich zufälligen Gewichte eines künstlichen neuronalen Netzwerks letztendlich dessen finalen Zustand. Wenn du also genau dasselbe NN wie ich haben willst, sollten wir die gleichen zufälligen Gewichte verwenden (und natürlich alles andere auf genau die gleiche Weise tun).

Du kannst dies erreichen, indem du den Pseudo-Zufallszahlengenerator mit einer beliebigen Zahl seedest (es gibt natürlich auch das NumPy-Pendant mit dem gleichen Namen). Dadurch startet ein Pseudo-Zufallszahlengenerator bei einem bestimmten Wert, der durch den Seed bestimmt wird (aber nicht gleich diesem ist), sodass wir, wenn wir beide den gleichen Seed verwenden, genau dieselbe zufällige Sequenz erhalten. Wie kann eine Sequenz sowohl zufällig als auch gleich sein? Dies liegt daran, dass von einem Computer erzeugte Sequenzen “pseudo”-zufällig sind: Es gibt keine Korrelation zwischen aufeinanderfolgenden Zahlen, die er generiert, sodass du nicht leicht vorhersagen kannst, welche Zahl als Nächstes kommt, wenn du dir die Sequenz ansiehst, die du bereits hast. Die Zahlen werden jedoch nach einem Algorithmus generiert, sodass du, wenn du den Algorithmus und seinen internen Zustand kennst (oder diesen Zustand über einen Seed bestimmst), genau die gleiche Sequenz erhältst wie ich und scheinbar “zufällig” vorhersagen kannst, was ich tue. Diese “pseudo”-zufällige Natur von Computern generierter Zufallszahlen ist für uns hier und in vielen anderen Fällen (Probenahme in der Bayes-Statistik, Generierung von Anfangsgewichten für neuronale Netzwerke usw.) kein Dealbreaker, ist aber kritisch, wenn das Wissen um deine “zufälligen” Zahlen mir erlaubt, dich auszunutzen. Cybersicherheit ist ein offensichtliches Beispiel für einen Bereich, in dem der Unterschied zwischen wirklich zufällig und pseudo-zufällig den Unterschied zwischen sicher und gehackt bedeutet. In diesem Fall nutzen Unternehmen sogar tatsächliche physikalische Systeme mit chaotischer Dynamik, um Zufallszahlen zu generieren.

Aktualisiere code03.py unter Verwendung des Seeds 42.

Sobald wir wissen, an welcher Zelle wir arbeiten, müssen wir unsere Optionen kennen: Welche Zahlen sind noch verfügbar (falls überhaupt). Überlege, wie du das lösen würdest, bevor du weiterliest⁴⁸.

Die Antwort sollte ziemlich offensichtlich sein: Sets: Ziehe einfach eine Menge von bereits verwendeten Werten von der Menge aller möglichen Werte ab, und der Unterschied sind die verfügbaren Optionen. Eine leere Menge würde einen ungültigen Pfad bedeuten. Das Generieren eines kompletten Sets ist einfach, da du die SUDOKU_SIZE kennst. Die Menge der bereits verwendeten Werte besteht aus Werten, die in der Reihe, der Spalte und dem Block verwendet werden, zu dem die Zelle gehört. Du weißt bereits, wie du eine Menge einzigartiger Werte für Reihe und Spalte/Block extrahieren kannst (das brauchen wir, wenn wir die Matrix im vorherigen Kapitel validiert haben). Sobald du diese drei Arrays hast, kannst du dir die Vereinigung ihrer eindeutigen Werte ansehen. Beachte, dass du drei Arrays und keine zwei hast, also denke darüber nach, wie du das machen kannst. Implementiere den Code und teste ihn, indem du eine \(4\times4\) Matrix per Hand definierst (du kannst die verwenden, die ich unten erstellt habe).

example_matrix = np.zeros((SUDOKU_SIZE, SUDOKU_SIZE))
example_matrix[1, 1] = 1
example_matrix[2, 2] = 2
example_matrix[3, 1] = 2
example_matrix[3, 0] = 4
example_matrix
#> array([[0., 0., 0., 0.],
#>        [0., 1., 0., 0.],
#>        [0., 0., 2., 0.],
#>        [4., 2., 0., 0.]])

Das Finden einzigartiger bereits verwendeter Werte für Zelle #9 unter Verwendung der obigen Matrix sollte dir die folgenden Ergebnisse liefern (2 für die Reihe, 1 und 2 für die Spalte, 2 und 4 für den Block):

#> array([0., 1., 2., 4.])

Jetzt bleibt nur noch, alle möglichen gültigen Zahlen zu generieren, die bereits verwendeten abzuziehen und zu sehen, was übrig bleibt.

np.setdiff1d(np.arange(SUDOKU_SIZE + 1), already_used)
#> array([3])

Teste in code04.py .

12.11 Arrays umformen

In unserer vorherigen Implementierung haben wir zunächst ein 1D-Array von einzigartigen Werten berechnet und dann deren Vereinigung bestimmt. Eine alternative (wenn auch weniger effiziente) Methode wäre, zuerst alle drei Arrays zu (verknüpfen)[https://numpy.org/doc/stable/reference/generated/numpy.concatenate.html] und dann die eindeutigen Werte zu finden. Es gibt allerdings einen Haken, alle deine Arrays haben eine unterschiedliche Form: Reihen- und Spaltenvektoren sind (4, ) (eindimensional), während ein quadratischer Block die Form (2, 2) hat. Du musst entweder beide Reihen-/Spaltenvektoren in eine (2, 2) Form umformen oder nur die Blockmatrix auf (4, ). Mache es auf beide Arten, aber stelle sicher, dass du die Form der Blockmatrix zur Umformung der Reihen-/Spaltenvektoren anstelle von hartkodierten Werten verwendest. Ebenso verwende die Form des Reihen-/Spaltenvektors, um die Blockmatrix umzuformen. Mache es ein drittes Mal, indem du die Blockmatrix in ein 1D-Array umformst, indem du ihre eigene Größe benutzt. Schließlich gibt es noch eine andere Möglichkeit, jedes Array/Matrix/Tensor in ein 1D-Array umzuwandeln, indem man es abflacht.

Mache Übung #3.

Sobald du herausgefunden hast, wie du Arrays umformen kannst, forme die Blockmatrix in einen 1D-Vektor um, verknüpfe alle, finde eindeutige Werte, subtrahiere sie von einer vollständigen Menge und du solltest die gleichen Werte wie zuvor erhalten.

Teste in code05.py .

12.12 Funktion `get_available_values`

Verpacke einfach den Code aus code04 (den effizienteren) in eine Funktion. Ihre Eingaben sollten die Matrix selbst, der Zellenindex, die Größe des Sudoku (kein heimlicher Zugriff auf globale Konstanten oder Variablen!) und wahrscheinlich die Größe des Blocks sein. Du könntest es on-the-fly berechnen, aber wir werden diese Funktion sehr oft aufrufen, also ist es besser, es einmal zu berechnen. Sie sollte ein Array von einzigartigen Werten zurückgeben, die du berechnet hast. Schreibe, dokumentiere und teste!

Füge get_available_values in utils.py ein
Teste den Code in code06.py

12.13 Nur eine Zelle

Wir haben fast alle Teile, die wir brauchen, um das Programm zu schreiben. Lass uns langsam beginnen, indem wir den Code erstellen, der einen zufälligen Wert in nur eine zufällige Zelle setzt. Du musst eine Funktion schreiben (nennen wir sie add_one_cell), die eine erweiterte Version der get_available_values Funktion sein wird. Zusätzlich zum Finden der verfügbaren Werte sollte sie diese mischen und den ersten Wert (aus dem gemischten Array) in die Zelle einfügen. Da Arrays veränderbar sind, brauchen wir uns keine Gedanken über Rückgabewerte zu machen. Teste die Funktion, indem du sie mehrmals ausführst (die Zelle sollte dieselbe sein, aber die Werte sollten unterschiedlich sein), aber denke daran, wenn du deinen Zufallszahlengenerator mit 42 seedest, wirst du die gleiche Matrix erhalten wie ich.

#> array([[4., 0., 0., 0.],
#>        [0., 0., 0., 0.],
#>        [0., 0., 0., 0.],
#>        [0., 0., 0., 0.]])

Füge add_one_cell in utils.py ein
Teste den Code in code07.py

12.14 Ausnahmen

Unser Programm wird den Baum erkunden, bis es die erforderliche Lösung findet, und dann sollte die Ausführung zum Hauptskript zurückkehren. Die Frage ist, wie können wir dieses “sobald die gültige Lösung gefunden wurde, Ausführung abbrechen und zur obersten Ebene zurückkehren” Verhalten implementieren? Im Spiel Ratet das Tier hatten wir dieses Problem nicht, weil wir einen Weg durch den Baum verfolgt haben, bis wir das Endknoten (Blatt) erreichten. Sobald die notwendigen Aktualisierungen am Blattknoten durchgeführt wurden, kehrte die Funktion einfach zur vorherigen Ebene zurück, die zur vorherigen Ebene zurückkehrte usw., da keine weiteren Maßnahmen erforderlich waren und die Tatsache, dass die Funktion ihre Aktion abgeschlossen hatte, bedeutete, dass wir den Baum vollständig durchforscht hatten. Im Falle von Sudoku bedeutet jedoch die Tatsache, dass die Funktion eine Ebene nach oben zurückkehren muss, entweder 1) dass sie die letzte Zelle erreicht und gefüllt hat oder 2) dass sie keine Möglichkeit hat, sie auf gültige Weise zu vervollständigen und die vorherige Ebene (Funktion) sich anpassen muss. Um dies zu handhaben, könnten wir das Verhalten der Funktion so implementieren, dass es von einem Rückgabewert abhängt (.z.B. null bedeutet “kann die Zelle nicht füllen”, nicht null bedeutet “Erfolg”). Es gibt jedoch einen alternativen Ansatz, der zwei verschiedene Mechanismen verwendet, um diese beiden Situationen zu behandeln. Die Funktion wird zurückkehren zur oberen Ebene, wenn sie die Zelle nicht füllen kann, aber sie wird den Mechanismus von Ausnahmen nutzen, um direkt zur obersten Ebene zurückzukehren, sobald die Matrix komplett ist. Dies macht unseren Code einfacher und verständlicher und gibt uns die Möglichkeit, über Ausnahmen zu lernen.

Manchmal, wenn du ein Programm ausführst, passieren schlechte Dinge — Fehler. In einigen Fällen ist ein abstürzendes Programm einfach nur ärgerlich, aber in anderen Fällen kann es bedeuten, dass du verloren hast, welche Daten du gesammelt oder welche Berechnungen du in der Zwischenzeit durchgeführt hast. Denke nur an unser Spiel Ratet das Tier, das du lange gespielt hast und das abgestürzt ist, ohne den aktualisierten Entscheidungsbaum zu speichern. Gut für uns, dass Python, wie andere Sprachen, spezielle Mechanismen hat, um Ausnahmen zu behandeln, die während der Codeausführung auftreten. Immer wenn ein Fehler zur Laufzeit auftritt, wird eine Ausnahme ausgelöst: Es wird ein Objekt einer speziellen Klasse erstellt, das Informationen enthält, die das Problem beschreiben. Zum Beispiel wird ein ZeroDivisionError ausgelöst, wenn du versuchst, durch Null zu teilen, z.B. 1 / 0 (du kannst dies in einem Jupyter-Notebook ausprobieren). Ein KeyError wird ausgelöst, wenn du ein Wörterbuch mit einem falschen Schlüssel benutzt; der folgende Code wird ihn auslösen:

a_dict = {"a_key" : 1}
a_dict["b_key"]
#> 'b_key'

Ebenso wird ein IndexError ausgelöst, wenn du versuchst, einen ungültigen Index für eine Liste zu verwenden, ein NameError, wenn du versuchst, auf eine Variable zuzugreifen, die nicht existiert, ein AttributeError, wenn ein Objekt nicht über ein Attribut verfügt, das du zu verwenden versuchst, usw.

In Python verwendest du die Operatoren try: ... except:...finally:, um Ausnahmen vorherzusehen und zu behandeln:

try:
    # einige Codezeilen, die einen Laufzeitfehler erzeugen könnten
except:  
    # Code, der ausgeführt wird, wenn etwas Schlechtes passiert
finally:
    # Code, der sowohl mit als auch ohne Ausnahme ausgeführt wird
    
Code, der NUR ausgeführt wird, wenn keine Ausnahmen auftraten oder wenn eine Ausnahme behandelt wurde

Im einfachsten Fall benötigst du nur die ersten beiden Operatoren: try und except. Schreibe im Jupyter-Notebook einen Code, der einen Division-durch-Null-Fehler erzeugt, der aber mit try...except... abgefangen wird. Gib im except einfach eine Nachricht aus, damit du weißt, dass sie ausgeführt wurde. Erstelle eine weitere Zelle, kopiere den Code und prüfe nun, dass der Code zur Ausnahmebehandlung nicht ausgeführt wird, wenn der Fehler nicht generiert wird (d.h. teile durch eine von Null verschiedene Zahl).

Mache Übung #4.

Die Verwendung von except: fängt alle Ausnahmen ab. Das wird jedoch als schlechter Stil angesehen (zu allgemein) und ein Linter wird sich beschweren. Stattdessen kannst du spezifischer sein und Ausnahmen basierend auf ihrer Klasse behandeln.

try:
    #  einige Codezeilen, die einen Laufzeitfehler erzeugen könnten
except KeyError as key_error:
# Code, der nur ausgeführt wird, wenn die KeyError-Ausnahme ausgelöst wurde, 
    # wobei die Ausnahmeinformationen im key_error-Objekt gespeichert werden
except ZeroDivisionError as zero_division_error:  
   # Code, der nur ausgeführt wird, wenn die ZeroDivisionError-Ausnahme ausgelöst wurde,
    # wobei die Ausnahmeinformationen im zero_division_error-Objekt gespeichert werden
except:
   # Code, der ausgeführt wird, wenn irgendeine ANDERE Ausnahme ausgelöst wird.

Implementiere die Behandlung für KeyError und ZeroDivisionError; sie sollten unterschiedliche Nachrichten ausgeben, um zu überprüfen, ob es funktioniert. Teste es, indem du mit deinem Code diese Laufzeitfehler erzeugst.

Mache Übung #5.

Bisher hast du Ausnahmen erzeugt, indem du Laufzeitfehler im Code verursacht hast, aber du kannst diese Ausnahmen auch selbst auslösen, indem du den raise-Operator verwendest. Statt beispielsweise durch Null zu dividieren, kannst du raise ZeroDivisionError benutzen. Verwende dies mit deinem vorherigen Code, anstelle einer tatsächlichen Division durch Null. Probiere andere Ausnahmen auszulösen und zu sehen, wie dein Code sie behandelt. Überprüfe auch, was passiert, wenn du die ersten beiden spezifischen Ausnahmebehandler hast, aber keinen allgemeinen except:, und löse einen NameError aus?

Mache Übung #6.

Bisher habe ich von Ausnahmen als einer Möglichkeit gesprochen, über Laufzeitfehler zu informieren. Sie können jedoch auf eine allgemeinere Weise verwendet werden, um den Ausführungsfluss zu steuern. Stelle dir zum Beispiel eine Situation mit geschachtelten Schleifen vor, ähnlich den “Spiel wiederholen - Runde mit Spiel wiederholen” Schleifen, die du zuvor implementiert hast. Bisher gab es keine Möglichkeit für einen Spieler, das Spiel vorzeitig zu beenden, aber was wäre, wenn wir ihnen diese Option geben würden?

# Spiel wiederholen
while want_to_play:
    ...
    
    # Runden des Spiels wiederholen
    while not game_over:
      ...
      
      → Benutzer möchte das Spiel hier abbrechen ←

Dies ist eine sehr ähnliche Situation wie verschachtelte rekursive Aufrufe für unseren Sudoku-Algorithmus. Hier reicht es nicht einfach aus, mit einem einfachen break aus der inneren Schleife auszusteigen oder game_over = True einzustellen, da du auch die äußere Schleife berücksichtigen musst. Du könntest eine zusätzliche Variable erstellen oder eine flexiblere game_over-Variable mit verschiedenen “Game Over”-Zuständen (Erfolg, Misserfolg, Benutzerabbruch usw.) und dann überprüfen, ob du den Benutzer fragen musst, ob er noch einmal spielen möchte. Sonst könntest du direkt nach einem “willst du noch mal spielen?” fragen, gleich nachdem er “aufhören” gesagt hat. Diese zusätzlichen Zustände und Überprüfungen machen den Code jedoch schwerer lesbar, besonders wenn du weitere Verschachtelungen hast, Funktionsaufrufe in Funktionsaufrufen usw. Ein alternativer Weg ist die Implementierung einer benutzerdefinierten Ausnahme, die signalisiert, dass der Benutzer beschlossen hat, das Spiel zu beenden.

Du definierst eine benutzerdefinierte Ausnahme, indem du von einer Basis-Klasse Exception erbst. Da du noch nichts über objektorientierte Programmierung gelernt hast, klingt das jetzt vielleicht wie Kauderwelsch, aber hier ist der einzige Code, den du benötigst⁴⁹(https://docs.python.org/3/reference/simple_stmts.html#the-pass-statement) bedeutet “nichts tun” und wird in Fällen verwendet, in denen du aufgrund der Syntax eine Anweisung benötigst, aber nichts zu tun hast.]:

class QuitTheGame(Exception):
    pass

Als Übung implementiere den Code mit einer einfachen endlosen while-Schleife, in der du fragst, ob weitergefahren oder aufgehört werden soll (entscheide selbst, wie du die Eingabe behandeln willst). Sobald du dich schließlich dafür entscheidest, das Spiel zu beenden, wirf eine QuitTheGame-Ausnahme, die vom try except-Code, der um die Schleife gewickelt ist, behandelt werden soll. Verwende Code, um die QuitTheGame-Ausnahme spezifisch zu behandeln und gib eine Nachricht aus, um zu zeigen, wie traurig du bist, dass der Spieler geht.

Mache Übung #7.

12.15 Das Rätsel ist gelöst, sobald keine Zellen mehr zum Überprüfen vorhanden sind

Unsere Funktion add_one_cell hat nur eine Zelle hinzugefügt und konnte nicht weitermachen, selbst wenn sie wollte, da sie keinen Index der nächsten Zelle hatte. Lassen Sie uns diese Funktion erweitern und die neue Version add_few_cells nennen, sodass sie anstelle eines einzelnen Zellenindex eine Liste dieser nimmt (ich habe den Parameter in remaining_cells umbenannt). Wenn die Liste leer ist, sollte sie die Ausnahme GridComplete auslösen, die im Hauptskript behandelt wird (das Gitter wird ausgegeben). Wenn die Liste noch Elemente enthält, sollte die Funktion das erste als Index der aktuellen Zelle verwenden. Nachdem sie die aktuelle Zelle mit dem ersten zufällig verfügbaren Wert gefüllt hat (Code, den Sie bereits implementiert haben), ruft sie sich selbst auf (Rekursion!) und übergibt die verbleibende Liste (ohne das erste Element).

Erstelle GridComplete mit dem Code für die QuitTheGame-Ausnahme, aber denke über wo du den Code platzieren sollst, da du beide in der Funktion, die sich in utils.py befindet, und im Hauptskript verwendest. Überlege, in welcher Datei du sie definieren solltest und in welcher du sie importieren solltest (Hinweis: Das Vorhandensein von kreisförmigen Abhängigkeiten ist keine gute Idee). Du importierst eine Ausnahmeklasse ähnlich wie das Verwenden einer Funktion: from <file-you-decided-on> import GridComplete.

Es gibt noch keinen Backtracking-Mechanismus, daher wird unsere Funktion abstürzen (warum?), wenn wir ihr eine vollständige Liste von Zellen geben. Testen Sie sie also nur mit den ersten vier Zellen. Diese sind garantiert ausgefüllt (wiederum, warum?) und unser Code sollte eine Matrix wie unten ausgeben (Seed immer noch 42). Unsere Matrix ist nicht vollständig, aber das ist einfach, um unsere Testmechanismen für den Abschluss zu überprüfen. Hier ist die Verwendung eines Debuggers zum Nachverfolgen der Aufrufebenen sehr hilfreich, um den Mechanismus der Rekursion zu verstehen.

#> array([[4., 1., 0., 0.],
#>        [0., 2., 0., 0.],
#>        [0., 0., 0., 0.],
#>        [0., 0., 2., 0.]])

Füge add_few_cells in utils.py ein.
Teste den Code in code08.py

12.16 Hinzufügen des Backtracking-Mechanismus

Das letzte Puzzleteil, das wir brauchen, ist der Backtracking-Mechanismus. Derzeit verwendet unsere Funktion nur den ersten Wert aus der zufällig sortierten Liste verfügbarer Werte. Dieser erste Wert kann jedoch nicht zu einem gültigen Raster führen, also muss die Funktion diese Werte durchlaufen und sich selbst aufrufen. Hier bedeutet es, wenn der innere Funktionsaufruf einen Rückgabewert liefert, dass der aktuelle Zellenwert in eine Sackgasse führt und wir den nächsten Wert ausprobieren müssen – daher die Schleife (denke daran, wenn der Pfad ein vollständiges Raster erzeugt, springt er direkt zur obersten Ebene, ohne jemals return zu verwenden). Wenn du jedoch die For-Schleife vollständig durchlaufen hast, bedeutet das, dass die innere Funktion jedes Mal einen Rückgabewert geliefert hat und es keinen möglichen Wert für die aktuelle Zelle gibt, der die Sackgasse auflösen kann, und du musst den Wert auf null zurücksetzen (zurück zum ursprünglichen leeren Zustand!), und zurück zur übergeordneten Ebene gehen, um zu versuchen, die vorherige Zelle zu korrigieren.

Rufe die Funktion add_cell auf und verwende sie anstelle von add_few_cells, sowohl im Hauptskript als auch in der Funktion selbst. Verwende zuerst nur die ersten vier Indizes als einen Realitätscheck: Die Ausgabe sollte genau die gleiche sein wie für den Code, der add_few_cells verwendet hat. Verwende dann alle Indizes und wenn du den Seed auf 42 einstellst, solltest du genau die gleiche Sudoku-Lösung erhalten.

#> array([[4, 1, 3, 2],
#>        [3, 2, 4, 1],
#>        [2, 4, 1, 3],
#>        [1, 3, 2, 4]])

Füge add_cell in utils.py ein.
Teste den Code in code09.py.

12.17 Zusammenfassung

Nun hast du eine alternative, effizientere Version des Algorithmus, der ein Sudoku generieren kann. Beim nächsten Mal werden wir fortfahren, indem wir eine vollständige Sudoku-Lösung in ein Rätsel verwandeln und lernen, wie man es mithilfe von Dateiein- und -ausgabe für die Nachwelt speichert.

11 Sudoku: Brute-Force-Algorithmus

13 Minesweeper