Microsoft, Excel und Windows sind eingetragene Marken der Microsoft Corporation.
IBM ist eine eingetragene Marke von International Business Machines, Inc.
Palisade, TopRank, BestFit und RISKview sind eingetragene Marken der
Palisade Corporation.
Willkommen in NeuralTools für
Excel
Willkommen
Durch NeuralTools erhält Microsoft Excel, das den Industrienormen
entsprechende Daten- und Analysen-Modellierungswerkzeug, einen
neuen und leistungsfähigen Werkzeugsatz! NeuralTools ist ein AddIn für die Neuronalnetze in Microsoft Excel. Dadurch können Sie in
Excel-Arbeitsblättern Daten analysieren, während Sie in der Ihnen
bekannten Microsoft Office-Umgebung arbeiten. Durch das
Kombinieren einer leistungsfähigen Datenverwaltung mit
hochmodernen Neuronalnetz-Algorithmen, erhalten Sie beiderseits
das beste: mühelose, Microsoft Office entsprechende Verwendung
und Berichte sowie auch robuste und genaue neuronale
Netzprognosen.
Arbeiten Sie bequem
Wenn Sie mit Excel vertraut sind, kennen Sie auch bereits
NeuralTools! NeuralTools funktioniert genau wie Excel, d.h. mit
Symbolleisten, Menüs und benutzerdefinierten
Arbeitsblattfunktionen – und dies alles direkt in Excel. Im Gegensatz
zu eigenständiger Neuronalnetz-Software gibt es in NeuralTools
keine steile Lernkurve und auch keine im voraus zu zahlenden
Trainingskosten, da Sie wie gewohnt direkt in Excel arbeiten. Ihre
Daten und Variablen befinden sich in den Excel-Kalkulationstabellen.
Mit anderen Worten, Sie können die standardmäßigen Formeln und
Berechnungen sowie auch Excel-Sortierung und Pivot-Tabellen
verwenden. Die sich aus Ihren Analysen ergebenden Berichte und
Diagramme befinden sich im standardmäßigen Excel-Format und
können in Zusammenhang mit allen in Excel integrierten
Formatierungsfähigkeiten verwendet werden.
Willkommen in NeuralTools für Excel i
NeuralTools-Analysen
Neuronale Netzwerke sind in der Lage, komplexe Datenbeziehungen
zu erlernen. Durch Nachahmung der Gehirnfunktionen können diese
Netze bestimmte Datenstrukturen erkennen und dann entsprechende
Prognosen extrapolieren, sobald neue Daten verfügbar werden.
Neuronale Netzwerke werden für Probleme verwendet, die in zwei
generelle Gruppen unterteilt werden können:
•Klassifizierungsprobleme: Probleme, bei denen festgestellt
werden muss, in welche Kategorie ein unbekanntes Element
fällt Beispiele hierfür sind z. B. medizinische Diagnosen und
Prognosen in Bezug auf Kreditzückzahlungsfähigkeit
•Numerische Probleme: Situationen, in denen ein bestimmtes
Zahlenergebnis vorausgesagt werden muss Beispiele hierfür
sind z. B. Aktienkursprognosen und Umsatzvoraussagen für
eine zukünftige Zeitperiode
Neuronalnetze werden u.a. in folgenden Anwendungen eingesetzt:
Börsenprognosen, Zuweisungen von Kredit- und Darlehensrisiken,
Aufdeckung von Kreditbetrug, Umsatzprognosen, allgemeinen
Geschäftsprognosen, Investitionsrisiken, medizinischen Diagnosen,
wissenschaftlichen Untersuchungen und Kontrollsystemen.
NeuralTools ist mit den neuesten Neuronalnetz-Algorithmen
ausgestattet, um die besten Prognosen bei numerischen und
Klassifizierungsproblemen vornehmen zu können
(Klassifizierungsprobleme werden in NeuralTools Kategorieprognosen
genannt).
ii Willkommen
Datenverwaltung in NeuralTools
NeuralTools stellt direkt in Excel einen umfangreichen Datensatz und
auch die entsprechende Datenverwaltung zur Verfügung. Das
entspricht ungefähr der Vorrichtung in StatTools, dem durch Palisade
verfügbaren Statistik-Add-In für Excel. Sie können in Excel direkt von
den Daten aus die Anzahl der Datensätze nebst Variablen definieren,
die analysiert werden sollen. NeuralTools wertet dann auf intelligente
Weise Ihren Datenblock aus und schlägt gleichzeitig die
Variablennamen und -typen sowie auch die Datenspeicherorte vor.
Ihre Datensätze und Variablen können sich in verschiedenen
Arbeitsmappen und Arbeitsblättern befinden. Mit anderen Worten,
Sie können Ihre Daten wie gewünscht einrichten. Anschließend setzen
Sie Neuronalnetze dafür ein, automatisch auf Ihre Variablen zu
verweisen, damit diese in Excel nicht immer wieder erneut
ausgewählt werden müssen. In NeuralTools sind die Variablen
außerdem auch nicht nur auf eine einzelne Datenspalte in einem
Excel-Arbeitsblatt beschränkt. Sie können für eine Variable dieselbe
Spalte in bis zu 255 Arbeitsblättern verwenden!
NeuralTools-Berichte
Excel kann besonders gut für Berichte und Diagramme verwendet
werden und NeuralTools macht sich das sehr zu Nutze. In
NeuralTools werden Diagramme im Excel-Format verwendet, die
mühelos neuen Farben, Schriftarten und zusätzlichem Text angepasst
werden können. Berichtstitel, Zahlenformate und Texte können genau
wie in jedem standardmäßigen Excel-Arbeitsblatt mühelos geändert
werden. Auch können Tabellen und Diagramme aus den
NeuralTools-Berichten direkt in Ihre in anderen Anwendungen
befindlichen Dokumente gezogen und dort abgelegt werden.
NeuralTools Industrial enthält außerdem Echtzeit-Prognosen, was die
Berechnung von vorausgesagten Werten ermöglicht, während neue
Daten in Ihr Excel-Arbeitsblatt eingegeben werden. Diese EchzeitBerechnung wird ganz automatisch vorgenommen, genau wie das bei
anderen Neuberechnungen in Excel der Fall ist.
Willkommen in NeuralTools für Excel iii
Datenzugriff und -freigabe
Excel bietet ausgezeichnete Importfunktionen. Ihre bereits
vorhandenen Daten können daher mühelos in NeuralTools importiert
werden! Über die standardmäßigen Excel-Funktionen können daher
Daten aus Microsoft SQL Server, Oracle, Microsoft Access oder
irgendeiner anderen mit ODBC konform gehenden Datenbank
eingelesen werden. Daten können aus Textdateien oder auch anderen
Anwendungen geladen werden. Mit anderen Worten, solange ein
Einlesen der Daten in Excel möglich ist, können sie auch in
NeuralTools verwendet werden!
Alle Ergebnisse und Daten aus NeuralTools werden in ExcelArbeitsmappen gespeichert. Sie können Ihre Ergebnisse und
Netzwerke aus NeuralTools direkt an andere Kollegen oder
Mitarbeiter senden, genauso wie das bei anderen Excel-Dateien der
Fall ist. Freigeben ist praktisch Kinderspiel!
NeuralTools Professional und Industrial
Es sind zwei Version von NeuralTools verfügbar – Professional und
Industrial. Zwischen diesen beiden Versionen bestehen folgende
Unterschiede:
•In NeuralTools Professional werden maximal 1000 Vorfälle
unterstützt, während in NeuralTools Industrial mit bis zu
16.777.216 Fällen gearbeitet werden kann.
•Echtzeit-Prognosen, die die Berechnung von vorausgesagten
Werten ermöglichen, während neue Daten in das ExcelArbeitsblatt eingegeben werden, sind nur in NeuralTools
Industrial verfügbar. Diese Echtzeit-Berechnung wird ganz
automatisch vorgenommen, genau wie das bei anderen
Neuberechnungen in Excel der Fall ist.
In dieser Einführung wird der Inhalt des NeuralTools-Paketes
beschrieben und Ihnen gezeigt, wie NeuralTools installiert und mit
Microsoft Excel 2000 für Windows 2000 oder höher verknüpft werden
kann.
Überprüfung des Pakets
Das NeuralTools-Paket sollte folgendes enthalten:
Die NeuralTools oder DecisionTools Suite enthaltende CD-ROM
einschließlich:
• NeuralTools-Programm
• NeuralTools-Lernprogramm
• NeuralTools-Benutzerhandbuch (dieses Handbuch) in PDF-Format
• NeuralTools-Lizenzvertrag
Sollte das Paket nicht vollständig sein, rufen Sie bitte sofort Ihren
NeuralTools-Fachhändler oder -Lieferanten an oder setzen Sie sich
direkt mit Palisade Corporation unter der Telefonnummer +1-607277-8000 in Verbindung.
Inhalt des NeuralTools-Pakets
NeuralTools ist als Einzelprogramm verfügbar, kann aber auch als
Programmkomponente von DecisionTools Suite Professional oder
DecisionTools Suite Industrial geliefert werden. Wenn NeuralTools
als Einzelprogramm gekauft wird, enthält die CD-ROM das
NeuralTools-Add-In für Excel sowie mehrere NeuralTools-Beispiele
und ein vollkommen indexiertes Online-Hilfesystem für NeuralTools.
DecisionTools Suite Professional und DecisionTools Suite Industrial
enthalten dagegen alle vorstehend genannten Komponenten plus
zusätzliche Anwendungen.
Info zu dieser Version
Diese NeuralTools-Version kann als 32-Bit-Programm für Microsoft
Excel 2000 oder höher installiert werden.
Kapitel 1: Erste Schritte 3
Bevor Sie anrufen…
Die Betriebssystemumgebung
Dieses Benutzerhandbuch geht davon aus, dass Sie allgemein mit
dem Windows-Betriebssystem und mit Excel vertraut sind. Das heißt,
es wird angenommen:
• dass Sie sich mit dem Computer und der Maus auskennen
• dass Ihnen Begriffe wie Symbol, Klicken, Doppelklicken, Menü, Fenster,
Befehl und Objekt bekannt sind
•dass Sie grundlegende Konzepte wie Verzeichnisstruktur und
Dateibenennung verstehen
Unterstützung
Allen registrierten NeuralTools-Benutzern mit gültigem
Wartungsplan steht unser technischer Support kostenlos zur
Verfügung. Benutzer ohne Wartungsplan können unseren
technischen Support gegen Berechnung per Vorfall in Anspruch
nehmen. Um sicherzustellen, dass Sie als NeuralTools-Benutzer
registriert sind, sollten Sie die Registrierung online über unsere Website http://www.palisade.com/support/register.asp vornehmen.
Wenn Sie sich telefonisch mit uns in Verbindung setzen, sollten Sie
immer die Seriennummer und das Benutzerhandbuch parat haben.
Außerdem können wir Sie technisch besser unterstützen, wenn Sie
vor dem Computer sitzen und arbeitsbereit sind.
Bevor Sie unseren technischen Support anrufen, ist es angebracht,
folgende Prüfliste nochmals abzuhaken:
• Haben Sie sich die Online-Hilfe angesehen?
• Haben Sie in diesem Benutzerhandbuch nachgeschlagen und auch das
Multimedia-Lernprogramm online durchgearbeitet?
•Haben Sie die Datei README.WRI gelesen? Sie enthält aktuelle
NeuralTools-Informationen, die evtl. bei Drucklegung des Handbuchs
noch nicht zur Verfügung standen.
•Können Sie das Problem nachvollziehen? Kann das Problem auch auf
einem anderen Computer oder bei einem anderen Modell nachvollzogen
werden?
4 Einführung
Kontaktieren von
Palisade
•Haben Sie sich bereits unsere Web-Seite (http://www.palisade.com)
angesehen? Sie enthält die neueste FAQ (eine durchsuchbare Datenbank
mit Fragen und Antworten, welche den technischen Support betreffen)
sowie NeuralTools-Patches (Korrekturprogramme), die unter „Technical
Support“ zu finden sind. Wir empfehlen Ihnen, regelmäßig unsere WebSeite aufzusuchen, damit Sie sich laufend über die neuesten
NeuralTools-Informationen sowie über anderweitige Palisade-Software
informiert halten können.
Palisade Corporation ist dankbar für alle Fragen, Bemerkungen oder
Vorschläge, die mit NeuralTools zu tun haben. Es gibt viele
Möglichkeiten, sich mit unserer technischen Abteilung in Verbindung
zu setzen, zum Beispiel:
• senden Sie Ihre E-Mail an support@palisade.com
• rufen Sie uns unter der Nummer +1-607-277-8000 an, und zwar
montags bis freitags zwischen 9.00 und 17.00 Uhr US-Ostküstenzeit.
Lassen Sie sich dabei zum „Technical Support“ durchschalten
• faxen Sie uns unter der Nummer +1-607-277-8001.
• senden Sie einen Brief an:
Technischer Support
Palisade Corporation
798 Cascadilla St.
Ithaca, NY 14850
USA
Palisade Europe ist wie folgt zu erreichen:
• senden Sie Ihre E-Mail an support@palisade-europe.com
• rufen Sie unter der Telefonnummer +44 1895425050 (GB) an.
• faxen Sie unter der Nummer +44-1895 425051 (GB)
• senden Sie einen Brief an:
Palisade Europe
31 The Green
West Drayton
Middlesex
UB7 7PN
Großbritannien
Kapitel 1: Erste Schritte 5
Versionen für
Studenten
Palisade Asia Pacific ist wie folgt zu erreichen:
• senden Sie Ihre E-Mail an support@palisade.com.au
• rufen Sie unter der Telefonnummer +61-2 9929 9799 (AU) an
• faxen Sie unter der Nummer +61-2 9954 3882 (AU)
• senden Sie einen Brief an:
Palisade Asia-Pacific Pty Limited
Suite 101, Level 1
8 Cliff Street
Milsons Point NSW 2061
Australien
Es ist wichtig, dass Sie uns bei jeder Kommunikation den
Produktnamen, die Version sowie die Seriennummer nennen. Sie
können die Versionsnummer herausfinden, indem Sie in Excel im
NeuralTools-Menü auf Hilfe über klicken.
Für die Studentenversion von NeuralTools steht kein telefonischer
Support zur Verfügung. Wenn Sie bei dieser Version Hilfe benötigen,
sollten Sie eine der folgenden Alternativen versuchen:
♦ fragen Sie Ihren Professor bzw. Lehrbeauftragten.
♦ sehen Sie auf unserer Website http://www.palisade.com unter
„Answers to Frequently Asked Questions“ (Antworten auf häufig
gestellte Fragen) nach
♦ wenden Sie sich per E-Mail oder Fax an unsere Abteilung
„Technical Support“
Systemanforderungen von NeuralTools
Bei NeuralTools 5.5für Microsoft Excel für Windows sind folgende
Systemanforderungen zu berücksichtigen:
• PC mit Pentium-Prozessor(oder schneller) und Festplatte
• Microsoft Windows 2000 SP4, Windows XP oder höher
• Microsoft Excel, Version 2000 oder höher
6 Einführung
Installationsanleitung
Allgemeine Installationsanleitung
Durch das Setup-Programm werden die NeuralTools-Systemdateien
in das Verzeichnis kopiert, das Sie auf der Festplatte angegeben
haben.
So wird das Setup-Programm unter Windows 2000 oder höher
ausgeführt:
1) Legen Sie die NeuralTools oder DecisonTools Suite enthaltende CD-
ROM in das CD-ROM-Laufwerk ein.
2) Klicken Sie auf Start, dann auf Einstellungen und schließlich auf
Systemsteuerung.
3) Doppelklicken Sie auf das Symbol Software.
4) Klicken Sie auf der Registerkarte Installieren/Deinstallieren auf die
Schaltfläche Installieren.
5) Folgen Sie den auf dem Bildschirm erscheinenden
Installationsanweisungen.
Falls Sie bei der Installation von NeuralTools auf Probleme stoßen,
sollten Sie nachsehen, ob genügend Speicherplatz auf dem Laufwerk
verfügbar ist, auf dem NeuralTools installiert werden soll. Versuchen
Sie dann die Installation erneut, nachdem Sie ausreichend
Speicherplatz freigemacht haben.
Deinstallieren von
NeuralTools
Falls Sie NeuralTools entfernen möchten, sollten Sie in der
Systemsteuerung das Dienstprogramm Software verwenden und
dann den Eintrag für NeuralTools auswählen.
Kapitel 1: Erste Schritte 7
Erstellung der
Verknüpfung in der
Windows TaskLeiste
Konfiguration der NeuralTools-Symbole oder
Verknüpfungen
In Windows wird durch das Setup-Programm automatisch ein
NeuralTools-Befehl im Start-Menü (Programme) erstellt. Sollten
jedoch während der Installation Probleme auftreten, oder aber wenn
Sie das Konfigurieren der Programmgruppe und Symbole zu einer
anderen Zeit manuell vornehmen möchten, gehen Sie bitte wie folgt
vor. Bei den nachstehenden Gebrauchsanweisungen wird von
Windows XP Professional ausgegangen. Bei anderen
Betriebssystemen muss evtl. etwas anders vorgegangen werden.
1) Klicken Sie auf Start und zeigen Sie dann auf Einstellungen.
2) Klicken Sie auf Taskleiste und Startmenü und anschließend auf
die Registerkarte Startmenü.
3) Klicken Sie auf Anpassen, dann auf Hinzufügen und danach auf
Durchsuchen.
4) Stellen Sie fest, wo sich die Datei NeuralTools.EXE befindet und
doppelklicken Sie dann auf diese Datei.
5) Klicken Sie auf Weiter und doppelklicken Sie anschließend auf das
Menü, in dem das Programm erscheinen soll.
6) Geben Sie den Namen NeuralTools ein und klicken Sie schließlich
auf Beenden.
7) Klicken Sie in allen geöffneten Dialogfeldern auf OK.
8 Installationsanleitung
DecisionTools Suite
NeuralTools ist eine Komponente der DecisionTools Suite, bei der es
sich um einen Satz von Produkten für die Risiko- und
Entscheidungsanalyse handelt, die von Palisade Corporation
erhältlich sind. Normalerweise wird NeuralTools in einem
Unterverzeichnis von „Programme\Palisade“ installiert. Das ist so
ähnlich, wie z. B. Excel oft in einem Unterverzeichnis von „Microsoft
Office“ installiert wird.
Eines der Unterverzeichnisse von „Programme\Palisade“ ist somit
das Evolver-Verzeichnis, das gewöhnlich die Bezeichnung
NeuralTools5 hat. Dieses Verzeichnis enthält dann die NeuralToolsAdd-In-Programmdatei (NEURALTOOLS.XLA) sowie auch
Beispielmodelle und andere zur Ausführung von NeuralTools
erforderliche Dateien. Ein anderes Unterverzeichnis von
„Programme\Palisade“ ist das Verzeichnis SYSTEM, in dem sich die
Dateien befinden, die von den einzelnen Programmen der
„DecisionTools Suite“ benötigt werden (einschließlich Hilfedateien
und Programmbibliotheken).
Kapitel 1: Erste Schritte 9
10 Installationsanleitung
Aktivierung der Software
Bei der Aktivierung handelt es sich um einen einmaligen
Lizenzprüfprozess, der erforderlich ist, um die NeuralTools-Software
als vollkommen lizenziertes Produkt ausführen zu können. Auf Ihrer
gedruckten oder per E-Mail erhaltenen Rechnung ist ein
Aktivierungscode zu sehen, der so ähnlich wie „19a0-c7c1-15ef-1be04d7f-cd“ aussehen kann. Wenn Sie diesen Aktivierungscode während
der Installation eingeben, ist die Software bereits bei erster
Ausführung aktiviert und daher keine weitere Aktivierung durch Sie
erforderlich. Falls Sie jedoch die Software erst nach Installation
aktivieren möchten, müssen Sie im Hilfe-Menü von NeuralTools den
Befehl Lizenzaktivierung wählen und dann den Aktivierungscode in
das angezeigte Dialogfeld Palisade-Lizenzaktivierung eingeben.
Häufig gestellte
Fragen
Kapitel 1: Erste Schritte 11
1) Was passiert bei nicht aktivierter Software?
Wenn Sie während der Installation keinen Aktivierungscode eingeben
oder eine Auswertungs- bzw. Demoversion installieren, kann die
Software nur bestimmte Zeit ausgeführt werden, bevor sie mittels
Aktivierungscode aktiviert werden muss, um als vollständig
lizenziertes Produkt verwendet werden zu können.
2) Wie lange kann ich das Produkt verwenden, bevor es aktiviert
werden muss?
Die Software kann 15 Tage lang ohne Aktivierung ausgeführt werden.
Während dieser Zeit stehen alle Funktionen des Produkts zur
Verfügung, aber das Dialogfeld Lizenzaktivierung wird bei jedem
Start der Software angezeigt, um Sie erneut zur Aktivierung
aufzufordern. Auch wird jedesmal gezeigt, wie lange die Software
noch ohne Aktivierung ausgeführt werden kann. Nach Ablauf der 15tägigen Demoperiode kann die Software dann nur noch bei erfolgter
Aktivierung ausgeführt werden.
3) Wie kann ich den Aktivierungsstatus überprüfen?
Das Dialogfeld Lizenzaktivierung kann über den Befehl
Lizenzaktivierung aus dem NeuralTools-Hilfemenü angezeigt
werden. Bei aktivierter Software ist in diesem Dialogfeld der Status
Aktiviert und bei Demoversion der Status Nicht aktiviert zu sehen.
Bei noch nicht aktivierter Software wird auch die noch verbleibende
Demozeit angezeigt.
4) Wie aktiviere ich meine Software?
Falls Sie noch keinen Aktivierungscode erhalten haben, sollten Sie im
Dialogfeld Lizenzaktivierung auf „Kaufen“ klicken. Bei einem Kauf
online erhalten Sie sofort einen Aktivierungscode zusammen mit
einem Link zum Installationsprogramm, für den Fall, dass erneut
installiert werden muss. Wenn Sie per Telefon kaufen möchten,
sollten Sie das über das in diesem Kapitel unter Kontaktieren von Palisade angegebene örtliche Büro der Palisade Corporation
vornehmen.
Die Aktivierung kann wie folgt über das Internet oder auch per EMail erfolgen:
• Aktivierung über das Internet
Geben Sie den Aktivierungscode in das Dialogfeld PalisadeLizenzaktivierung ein und klicken Sie dann auf „Automatische
Aktivierung“. Nach einigen Sekunden sollte dann eine
Erfolgsmeldung erscheinen und im Dialogfeld Lizenzaktivierung zu
erkennen sein, dass die Software erfolgreich aktiviert ist.
12 Aktivierung der Software
• Aktivierung per E-Mail
Wenn keine Internetverbindung vorhanden ist, erfordert die
automatische Aktivierung über E-Mail einige zusätzliche Schritte:
1. Klicken Sie auf „Manuelle Aktivierung“, um die Datei
„request.xml“ anzuzeigen, die Sie dann auf der Festplatte
speichern oder in die Windows-Zwischenablage kopieren
können. (Sie sollten sich notieren, wo sich die Datei
„request.xml“ auf dem Computer befindet.)
2. Kopieren Sie die XML-Datei in eine E-Mail-Nachricht oder
fügen Sie die Datei der E-Mail an und senden Sie diese dann
an activation@palisade.com. Sie sollten daraufhin sehr bald
automatisch eine Antwort auf die E-Mail erhalten.
3. Speichern Sie die der Antwort angefügte „response.xml“
auf Ihrer Festplatte.
4. Klicken Sie auf „Verarbeiten“, die jetzt im Dialogfeld
Palisade-Lizenzaktivierung zu sehen ist, und navigieren Sie
dann zur Datei „response.xml“. Wählen Sie die Datei und
klicken Sie anschließend auf OK.
Es sollte dann eine Erfolgsmeldung erscheinen und im Dialogfeld
Lizenzaktivierung zu erkennen sein, dass die Software erfolgreich
aktiviert ist.
Kapitel 1: Erste Schritte 13
5) Wie kann ich meine Softwarelizenz auf einen anderen PC
übertragen?
Die Übertragung einer Lizenz kann über das Dialogfeld PalisadeLizenzaktivierung vorgenommen werden, und zwar sind dazu zwei
Schritte erforderlich, Nämlich Deaktivierung auf dem einen und
Aktivierung auf dem anderen PC oder Laptop. Gewöhnlich wird die
NeuralTools-Lizenz nämlich von einem PC auf einen Laptop
übertragen. Dabei ist jedoch darauf zu achten, dass auf beiden
Geräten die Software installiert ist, und dass auch beide Geräte
während der vorzunehmenden Deaktivierung/Aktivierung an das
Internet angeschlossen sind.
1. Klicken Sie auf Computer1 im Dialogfeld Lizenzaktivierung
auf „Automatische Aktivierung“. Warten Sie, bis die
Erfolgsmeldung erscheint.
2. Klicken Sie auf Computer2 im Dialogfeld Lizenzaktivierung
auf „Automatische Aktivierung“. Warten Sie, bis die
Erfolgsmeldung erscheint.
Falls die beiden Computer nicht aufs Internet zugreifen können, kann
nach ähnlichen Anweisungen durch einen automatischen E-MailProzess übertragen werden.
6) Ich bin zwar ans Internet angeschlossen, kann aber trotzdem
nicht automatisch aktivieren/deaktivieren.
Ihre Firewall muss so eingestellt sein, dass das TCP auf den
lizenzierenden Server zugreifen kann. Bei Einzelbenutzer-Installation
(d. h. wenn es sich um keine Netzwerkinstallation handelt) geschieht
dies über http://service.palisade.com:8888 (TCP-Anschluss 8888 bei
http://service.palisade.com).
und Evolver .............................................................................................31
Kapitel 2: Überblick über NeuralTools 15
16
Überblick
NeuralTools bietet Ihnen leistungsstarke neuronale
Netzwerkfähigkeiten in einer Ihnen bekannten Umgebung – dem
Microsoft Excel-Programm. Die NeuralTools-Verfahren, wie z. B. das
Definieren von Datensätzen, Training und Testen von neuronalen
Netzwerken und Voraussagen von Werten mittels entsprechend
trainierter Netzwerke, können in Excel an Ihren Daten ausgeführt
werden, und die Berichte und Diagramme aus Ihren Analysen
werden ebenfalls in Excel erstellt.
Warum neuronale Netzwerke?
Neuronale Netzwerke sind in der Lage, komplexe Datenbeziehungen
zu erkennen. Durch Nachahmung der Gehirnfunktionen können
diese Netze bestimmte Datenstrukturen erkennen und dann
entsprechende Prognosen extrapolieren, wenn neue Daten verfügbar
werden. Neuronale Netzwerke werden für Probleme verwendet, die
in zwei allgemeine Gruppen unterteilt werden können:
•Klassifizierungsprobleme: Probleme, bei denen festgestellt
werden muss, in welche Kategorie ein unbekanntes Element
fällt Beispiele hierfür sind z. B. medizinische Diagnosen und
Prognosen in Bezug auf Kreditzückzahlungsfähigkeit
•Numerische Probleme: Situationen, in denen ein bestimmtes
Zahlenergebnis vorausgesagt werden muss Beispiele hierfür
sind z. B. Aktienkursprognosen und Umsatzvoraussagen für
eine zukünftige Zeitperiode
Im NeuralTools-Programm werden Beispiele dafür gegeben, wie
Neuronalnetze auf verschiedene Prognosenprobleme angewendet
werden können. Der Ordner NeuralTools\Beispiele enthält diese
Beispiele in Form von Excel-Arbeitsmappen.
Kapitel 2: Überblick über NeuralTools 17
NeuralTools und neuronale Netzwerke
Bei Verwendung von NeuralTools werden Neuronalnetze mithilfe
von vier Schritten entwickelt und verwendet:
•Datenvorbereitung – Die in NeuralTools zu verwendenden
Daten werden in Datensätzen definiert. Ein
Datensatzmanager wird dazu verwendet, die Datensätze so
einzurichten, dass sie in den Neuronalnetzen immer erneut
wieder verwendet werden können.
•Training – Durch Training wird ein neuronales Netzwerk aus
einem Datensatz erstellt, der sich aus bereits bekannten
Ausgabewerten zusammensetzt.. Diese Daten stammen oft
aus alten Fällen, für die die Ausgabewerte/abhängigen
Variablen bekannt sind.
•Testen – Durch Testen wird festgestellt, wie gut ein
entsprechend trainiertes neuronales Netz bereits bekannte
Ausgabewerte voraussagen kann. Bei den zum Testen
verwendeten Daten handelt es sich meistens um eine
Untermenge Ihrer Verlaufsdaten. Diese Untermenge wurde
jedoch nicht zum Training des neuronalen Netzwerks
verwendet. Nach dem Testen wird die Leistung des
Neuronalnetzes mithilfe von Statistiken gemessen. Es wird
beispielsweise überprüft, welcher Prozentsatz an bekannten
Lösungen richtig vorausgesagt wurde.
•Prognose – Ein entsprechend trainiertes neuronales Netzwerk
wird dazu verwendet, unbekannte Ausgabewerte
vorauszusagen. Nach dem Trainieren und Testen kann dieses
neuronale Netz dann wie gewünscht dazu verwendet
werden, die Ausgaben für neue Falldaten vorauszusagen.
Das Training und Testen ist ein sich wiederholender und mitunter
zeitraubender Prozess. Meistens sollte mehrere Male mit
unterschiedlichen Einstellungen trainiert werden, um das
bestmögliche neuronale Netzwerk zu erstellen. Sobald Sie das „beste
Netz“ ausgearbeitet haben, können Sie es sofort für Ihre Prognosen
verwenden.
Nach Nächstes wollen wir uns ansehen, wie NeuralTools in Excel
funktioniert und wie Datensätze definiert werden, mit deren Hilfe
neuronale Netzwerke trainiert und getestet werden können.
Anschließend werden wir dann mithilfe von trainierten Netzwerken
unbekannte Ausgabewerte voraussagen.
18 Überblick
NeuralTools-Menü und NeuralTools-Symbolleiste
Sobald NeuralTools installiert ist, werden das Menü und die Befehle
des Programms in Excel 2003 und früheren Versionen als Teil der
Excel-Menüleiste angezeigt. Es ist aber auch eine NeutralToolsSymbolleiste zu sehen. Das Menü zeigt Befehle, über die 1) die Daten
in Datensätzen definiert, 2) neuronale Netzwerke trainiert und
getestet und 3) Werte mithilfe dieser trainierten neuronalen
Netzwerke vorausgesagt werden können. In Excel 2007 sind alle
Befehle über die NeuralTools-Befehlsleiste verfügbar.
Datensätze und Datensatzmanager
In NeuralTools sind die Daten den Fällen und Variablen gemäß
strukturiert. Sie arbeiten mit einem Datensatz oder einem Satz von
statistischen Variablen, die sich in zusammenhängenden Spalten mit
verschiedenen Namen befinden. Die Namen der Variablen sind in der
ersten Zeile des Datensatzes zu sehen. Bei jeder Zeile im Datensatz
handelt es sich um einen Fall. Jeder Fall ist mit einem Satz von
unabhängigen Variablenwerten und entweder einem bekannten oder
nicht bekannten (fehlenden) Wert für die abhängige Ausgabevariable
versehen. Es ist die Aufgabe von NeuralTools, Werte für
Ausgabevariablen vorauszusagen, und zwar in allen Fällen, in denen
diese unbekannt sind.
Kapitel 2: Überblick über NeuralTools 19
In NeuralTools ermöglicht Ihnen der Datensatzmanager die
gewünschten Datensätze, Variablen und Fälle zu definieren. Diese
vordefinierten Variablen können dann zum Trainieren und Testen
von neuronalen Netzwerken verwendet werden, und zwar ohne dass
die zu analysierenden Daten immer wieder neu ausgewählt werden
müssen. Sie können alle bekannten historischen Fälle in einem und
alle anderen Fälle, für die die Ergebnisse vorausgesagt werden
müssen, in einem anderen Datensatz platzieren. Es ist aber auch
möglich, alle Daten (d.h. Verlaufs- und vorauszusagende Daten) in
nur einem Datensatz zu kombinieren.
Jede in einem Datensatz befindliche Variable hat einen Namen und ist
in Excel mit einem bestimmten Zellenbereich verknüpft. Jede Spalte in
diesem Bereich enthält Daten für eine andere Variable. Ein Datensatz
kann aus mehreren Zellblöcken bestehen, wodurch Sie dann Daten in
verschiedene Blätter derselben Arbeitsmappe eingeben können.
Wenn Sie einen Datensatz definieren, versucht NeuralTools, in Excel
die Variablen zu identifizieren, die sich in dem Zellblock befinden,
der die aktuelle Auswahl umgibt. Dadurch kann schnell und mühelos
ein Datensatz eingerichtet werden, und zwar mit den Variablen in
Spalten und den entsprechenden Namen der Variablen jeweils in der
obersten Zeile.
20 Überblick
Variablentypen
Daten aus mehreren
Zellbereichen
In NeuralTools können die Variablen unabhängig oder abhängig und
numerisch oder kategorisch sein (z. B. Ja oder Nein bzw. Rot, Grün
oder Blau). Der Datensatzmanager versucht, in Ihrem Datensatz den
Typ der einzelnen Variablen zu identifizieren, aber Sie können diesen
Vorgang übergehen und Ihre eigenen Auswahlen treffen.
In Excel 2003 (oder einer frühren Version) können in nur einer Spalte
bis zu 65.536 Datenpunkte für eine Variable vorhanden sein. Falls Ihre
Variablen noch mehr als 65.536 Datenwerte enthalten und Sie nicht
mit Excel 2007 arbeiten möchten, gibt Ihnen NeuralTools die
Möglichkeit, einem Datensatz Daten aus mehreren Zellbereichen
zuzuweisen. Mit anderen Worten, Sie können einen Datensatz in
mehreren Arbeitsblättern „wiederholen“, indem Sie in verschiedenen
Arbeitsblättern die gleichen Spalten verwenden, um alle Werte für
einen Datensatz aufzunehmen.
Training eines neuronalen Netzwerks
Nach Definition eines Datensatzes, der Fälle mit bekannten
Verlaufswerten enthält, können Sie diese dazu verwenden, ein
neuronales Netzwerk entsprechend zu trainieren. Durch verschiedene
Optionen kann festgelegt werden, welche Art von Netzwerk durch
NeuralTools erstellt werden soll. Je nach Art der Daten, können
mithilfe von bestimmten Netzwerkoptionen bessere Leistungen durch
trainierte Netzwerke erzielt werden (d.h. die Netzwerke sind dann
effizienter im Voraussagen von Ausgabewerten). Durch das Testen,
das nach dem Training vorgenommen wird, ist klar zu erkennen, wie
leistungsfähig Ihr trainiertes Netzwerk im Voraussagen von
Ausgabewerten ist.
Kapitel 2: Überblick über NeuralTools 21
Kombinieren,
Trainieren,
Testen und
Voraussagen
Konfigurationen des
Netzes
Das Training eines neuronalen Netzwerks, zusammen mit dem Testen
und der Prognose, macht es erforderlich, dass Sie ein Datensatz
angeben, dessen Daten zum Training verwendet werden sollen. Das
trainierte Netzwerk wird durch NeuralTools entweder direkt in Ihrer
Arbeitsmappe gespeichert oder (falls Sie möchten) in einer Datei auf
der Festplatte.
Wenn sich alle Ihre Daten in nur einem Datensatz befinden
(einschließlich der bekannten Verlaufsdaten und der neuen Daten,
deren Ausgabewerte Sie nicht kennen), ermöglicht NeuralTools
Ihnen, ein Netzwerk zu trainieren und zu testen, bevor dieses dann
die Ausgabewerte voraussagt (und das alles in einem einzigen
Schritt). Sie halten einen gewissen Prozentsatz der Verlaufsdaten zum
Testen zurück (auf der vorherigen Seite werden 20 % zu diesem
Zweck genannt) und sagen dann anschließend automatisch die
Ausgabewerte für Fälle voraus, bei denen die abhängigen Werte
fehlen. Durch diesen Prozess erhalten Sie schnell die benötigten
Antworten in nur einem Schritt.
In NeuralTools werden verschiedene neuronale
Netzwerkkonfigurationen unterstützt, um die bestmöglichen
Voraussagen vorzunehmen. Bei Klassifizierung/Kategorieprognosen
(bei denen die abhängige Variable vom Typ Kategorie ist), sind zwei
Arten von Netzwerken verfügbar: neuronale
Wahrscheinlichkeitsnetzwerke (PNN) und mehrschichtige
Feedforward-Netzwerke (MLF). Numerische Prognose kann mithilfe von MLF- und auch mit verallgemeinerten neuronalen
Regressionsnetzwerken (GRNN) ausgeführt werden, die so ähnlich
wie PNN-Netzwerke sind.
22 Überblick
Trainings-Vorschau
In NeuralTools ist die Auswahl einer Netzwerkkonfiguration nicht
sehr kompliziert, da die Suchoption Bestes Netz verwendet werden
kann. Bei Auswahl von Bestes Netz werden durch NeuralTools
verschiedene Neuronalnetz-Konfigurationen trainiert und getestet,
um das Netzwerk zu erstellen, aus dem sich die besten Prognosen für
Ihre Daten ergeben. Die beste Konfiguration wird durch das Testen
der Daten herausgefunden. Für die Suche mittels Bestes Netz muss
daher auf der Registerkarte Trainieren die Option Autom. testen
ausgewählt werden.
Sobald die Optionen für Training und Netzwerkkonfiguration
ausgewählt sind, wird in NeuralTools eine Vorschau darüber
angezeigt, was während des Netzwerk-Trainings ausgeführt wird. Da
das Training der zeitraubendste Vorgang beim Modellieren des
neuronalen Netzwerks ist, lohnt es sich, diese Vorschau vor dem
Weitermachen genau anzusehen. Durch NeuralTools werden alle
Probleme identifiziert, die möglicherweise in Ihren Daten vorhanden
sind, sodass diese berichtigt werden können, bevor mit dem Training
begonnen wird.
Kapitel 2: Überblick über NeuralTools 23
Trainings-Prozess
Während NeuralTools damit beschäftigt ist, ein neuronales Netz
Ihren Daten gemäß zu trainieren, berichtet dieses Programm darüber,
wie erfolgreich es bei dieser Aufgabe ist. Gewöhnlich wird das Netz
während des Trainings immer besser, da NeuralTools während dieses
Vorgangs laufend neue Netzwerke erstellt, die bessere (d.h. weniger
fehlerhafte) Prognosen in Bezug auf Ihre Daten stellen. Durch
Diagramme wird angezeigt, wie erfolgreich NeuralTools während
dieses Trainings-Prozesses ist.
Das Training wird angehalten, sobald irgendwelche von Ihnen
eingestellte Anhaltebedingungen, wie z. B. in Bezug auf maximale
Trainierzeit, erfüllt sind. Falls Sie für Ihr Netz Autom. testen oder
Fehlende Ausgabewerte voraussagen im Datensatz ausgewählt
haben, wird diese Aufgabe nach dem Training ausgeführt.
24 Überblick
Trainings-Berichte
Aus den Trainings-Berichten geht hervor, wie gut Ihr trainiertes Netz
funktioniert. In den Statistiken, wie z. B. in % schlechter Prognosen,
ist die Anzahl von Fällen im Trainingssatz zu sehen, in denen das
Netzwerk einen Ausgabewert voraussagte, der nicht dem aktuellen
bekannten Wert entsprach.
Kapitel 2: Überblick über NeuralTools 25
Testen eines Netzwerks
Während des Testens wird festgestellt, wie gut ein entsprechend
trainiertes neuronales Netz bereits bekannte Ausgabewerte
voraussagen kann. Bei den Testdaten handelt es sich gewöhnlich um
eine Untermenge Ihrer Verlaufsdaten, für die die Ausgabewerte
bereits bekannt sind. Diese Untermenge wurde jedoch nicht zum
Training des neuronalen Netzes verwendet.
Wenn das Testen von Daten in einem separaten Datensatz
vorgenommen wird, versucht NeuralTools, die Variablen im
Testdatensatz denen im Trainingsdatensatz anzupassen. Genau wie
beim Training, wird NeuralTools auch beim Testprogramm vor dem
Ausführen eine Vorschau anzeigen.
26 Überblick
Testberichte
Das Testen (zusammen mit Prognose) kann viel schneller als das
Training ausgeführt werden. In NeuralTools wird berichtet, wie
erfolgreich das Programm die bekannten Datenwerte in den
Testdaten voraussagen konnte. Daraus können Sie erkennen, ob das
Netzwerk ein guter Prädiktor sein wird, wenn es auf Fälle mit
unbekannten Ausgabewerten angewendet wird.
Kapitel 2: Überblick über NeuralTools 27
Prognose
Der Verwendungszweck eines neuronalen Netzwerks ist die
Prognose. Sie wenden ein trainiertes Netzwerk auf neue Fälle an, in
denen die Ausgabewerte nicht bekannt sind, Sie diese aber
voraussagen möchten. In NeuralTools stehen zur Prognose zwei
Methoden zur Verfügung – 1) eine befehlsgesteuerte Methode zum
Voraussagen von Werten für Fälle in einem Datensatz und 2) eine
Echtzeit-Prognose (nur in der Industrial-Version), bei der die
unabhängigen Variablenwerte für einen Fall in das Arbeitsblatt
eingegeben werden können und NeuralTools berechnet dann
automatisch den vorausgesagten Ausgabewert.
Falls Sie die Werte für eine Gruppe von Fällen in einem Datensatz
voraussagen möchten, können Sie über das Dialogfeld Prognose den
Prognoseprozess einrichten. Sie können beispielsweise die Prognose
nur für Fälle mit fehlenden Ausgabewerten ausführen und dann
optional die Echtzeit-Prognose aktivieren, um Änderungen an den
Daten vornehmen und beobachten zu können, wie sich das auf die
Prognosen auswirkt. Auch können verschiedene trainierte Netze
verwendet werden, um zu sehen, wie sich die vorausgesagten Werte
dadurch verändern.
Genau wie beim Training und Testen wird NeuralTools erst eine
Vorschau von Daten und Einrichtung anzeigen, bevor diese zur
Prognose verwendet werden. Anschließend sind diese Prognosen in
Excel in Ihrem Arbeitsblatt zu sehen.
28 Überblick
Prognoseergebnisse
Echtzeit-Prognose
Die vorausgesagten Ausgabewerte sind neben den Fällen zu sehen,
für die die Prognose ausgeführt wurde. Im folgenden Bildschirm sind
die vorausgesagten Werte in Violett angezeigt.
Wenn Echtzeit-Prognose aktiviert ist, wird durch NeuralTools der
Zelle, in der der vorausgesagte Wert zu sehen sein soll, automatisch
eine Excel-Formel hinzugefügt. Durch diese Formel wird der
vorausgesagte Wert erzeugt. Mit anderen Worten, wenn Sie die
unabhängigen Variablenwerte für einen Fall ändern, wird der
vorausgesagte Wert automatisch entsprechend neu berechnet.
Mithilfe von Echtzeit-Prognose können Sie die Daten für neue Fälle
einfach direkt in Excel eingeben und automatisch eine neue Prognose
erstellen, ohne zu diesem Zweck über das Dialogfeld Prognose sehen
zu müssen. Wenn im vorstehenden Arbeitsblatt die unabhängigen
Werte für den Fall in Zeile 7 sich wie gezeigt ändern, wird der
vorausgesagte Wert automatisch entsprechend aktualisiert. Genau
wie in jeder anderen Arbeitsblattzelle können Sie auch hier in jeder
beliebigen Excel-Formel auf eine Echtzeit-Prognosezelle verweisen.
(Hinweis: Echtzeit-Prognose ist nur in der Version Industrial
verfügbar.)
Kapitel 2: Überblick über NeuralTools 29
Berichte und Diagramme in NeuralTools
In NeuralTools werden für das Training und Testen sowie für die
Prognose sowohl Übersichten als auch Detailberichte erstellt. Für
Übersichtsberichte ist ein eigenes Arbeitsblatt vorgesehen und diese
Berichte enthalten zusammenfassende Informationen über das Testen
und Training. Ein Detailbericht gibt dagegen Einzelheiten zu den
einzelnen Berichten und ist neben den Daten zu sehen, über die
berichtet wird. Auch sind die meisten Informationen aus dem
Übersichtsbericht ebenfalls im Detailbericht zu sehen, und zwar als
ein zur Titelzelle hinzugefügter Kommentar. Solch eine Version des
Übersichtsberichts wird Schnellübersicht genannt.
Wenn durch NeuralTools irgendwelche Diagramme erstellt werden,
sind diese bei den Berichten zu sehen. Diagramme werden im ExcelFormat erstellt und können über die standardmäßigen ExcelDiagrammbefehle Ihren Wünschen angepasst werden.
30 Überblick
NeuralTools-Dienstprogramme
Es sind zwei Dienstprogramme vorhanden, über die in NeuralTools
das Modellieren von neuronalen Netzwerken verwaltet werden kann.
Ein Neuronalnetzmanager ermöglicht Ihnen, trainierte neuronale
Netzwerke zu kopieren oder zwischen Arbeitsmappen und Dateien
hin und her zu schieben. Mithilfe des Dienstprogramms Fehlende Daten können Sie in Ihren Datensätzen Fälle mit fehlenden Daten
identifizieren und entsprechend korrigieren.
Verwendung von NeuralTools mit StatTools,
Solver und Evolver
NeuralTools ist dafür vorgesehen, zusammen mit StatTools, dem
über Palisade verfügbaren Statistik-Add-In für Excel, verwendet zu
werden. Beide Produkte arbeiten mit demselben Datensatzmanager.
In NeuralTools definierte Datensätze können in StatTools analysiert
werden (und auch umgekehrt). Mithilfe von StatTools können Sie für
in NeuralTools definierte Datensätze verschiedene Statistiken über
Variablen berechnen, und zwar zusammen mit Statistiken über in
NeuralTools erstellte Prognosen.
In NeuralTools erstellte Detailberichte sind sofort zur Analyse in
StatTools verfügbar. Diese Berichte sind in StatTools automatisch in
der Datensatzliste des Datensatzmanagers zu sehen. Dadurch ist es
möglich, mittels StatTools statistische Ergebnisse zu erhalten, die über
die Übersichtsberichte hinausgehen, die in NeuralTools verfügbar
sind. Ein Übersichtsbericht über die Testvorgänge enthält
beispielsweise ein Histogramm der Residualwerte (bei denen es sich
um die Unterschiede zwischen aktuellen und vorausgesagten Werten
handelt). Im Histogramm könnte es vielleicht so aussehen, als ob die
Residualwerte ungefähr normal verteilt sind. Um diese Hypothese
der Normalverteilung zu überprüfen, kann im Detailbericht einer der
Normalitätstests von StatTools auf die Residualwertvariable
angewendet werden. Ein Beispiel hierfür befindet sich in der Datei
„Seeohr-Altersprognose mit StatTools-Analyse.xls“.
Durch die NeuralTools-Funktion Echtzeit-Prognose ist leichter zu
erkennen, wie sich Änderungen in unabhängigen Werten auf die
Prognose auswirken. Mithilfe der Echtzeit-Prognose können andere in
Excel verfügbare Tools dazu verwendet werden, die Beziehung
zwischen unabhängigen und abhängigen Variablen zu untersuchen.
Kapitel 2: Überblick über NeuralTools 31
Solver – Dieses in Excel integrierte Optimierungsprogramm kann
zusammen mit der NeuralTools-Funktion Echtzeit-Zukunftsprognose
dazu verwendet werden, für in NeuralTools ausgeführte Prognosen
die optimalen Entscheidungswerte zu berechnen. Die Datei
„Autokredite mittels Solver.xls“ ist dafür ein guten Beispiel. In
diesem Beispiel wird ein neuronales Netz verwendet, um
vorauszusagen, ob ein Kreditnehmer pünktlich zurückzahlen wird
oder nicht. Das Netzwerk gibt Ihnen aber u.U. nur eine 60 %ige
statistische Sicherheit. In solchen Fällen könnte der Solver von Excel
dazu verwendet werden, einen Kreditbetrag zu bestimmen, bei dem
die statistische Sicherheit, dass der Kredit pünktlich durch den
Kreditnehmer zurückgezahlt wird, dann z.B. 90 % sein würde. In
diesem Fall würde das Optimierungsprogramm verschiedene
Darlehens- oder Kreditbeträge ausprobieren, während NeuralTools
jeweils automatisch den Wahrscheinlichkeitswert aktualisiert.
Evolver, das gentechnische, auf Algorithmen basierende
Optimierungsprogramm von Palisade, kann anstelle von Solver
verwendet werden, um die Antwort zu finden. Im Unterschied zu
Solver kann Evolver auch mit Optimierungsproblemen fertig werden,
bei denen mehrere lokale Bestwerte vorhanden sind.
Befehl Dienstprogramm zum Ersetzen fehlender Daten ...............81
Weitere Info über neuronale Netzwerke 85
Kapitel 3: NeuralTools-Referenzhandbuch 33
34
Einführung
In diesem Kapitel werden die in NeuralTools verwendeten Symbole,
Befehle und Statistikfunktionen beschrieben. Das Kapitel ist in zwei
Abschnitte unterteilt:
1) Referenz: NeuralTools-Symbole
2) Referenz: NeuralTools-Menübefehle
Kapitel 3: NeuralTools-Referenzhandbuch 35
36
Referenz: NeuralTools-Symbole
NeuralTools-Symbolleiste
Die NeuralTools-Symbole werden dazu verwendet, Datensätze mit
Fällen und Variablen zu definieren und dann neuronale Netzwerke
zu erstellen und auf diese Daten anzuwenden. NeuralTools-Symbole
sind in der Excel-Symbolleiste (d.h. in einer vom Benutzer definierten
Symbolleiste in Excel 2003 und früher) bzw. in einer Befehlsleiste in
Excel 2007 zu finden. In diesem Abschnitt wird jedes Symbol kurz
beschrieben und werden dabei die Funktionen, die dadurch
ausgeführt werden, dargelegt. Auch werden die entsprechenden
Menübefehle beschrieben. In Excel 2007 sind alle Befehle über die
NeuralTools-Befehlsleiste verfügbar.
Folgende Symbole sind in Excel 2003 und früheren Versionen in der
NeuralTools-Symbolleiste und/oder in den NeuralToolsDialogfeldern zu sehen.
SymbolSymbolfunktion und entsprechender Befehl
Datensatz und Variablen definieren oder einen
bestehenden Datensatz nebst Variablen bearbeiten
bzw. löschen
Entsprechender Befehl: Datensatzmanager
Neuronales Netzwerk trainieren
Entsprechender Befehl: Trainieren
Neuronales Netzwerk testen
Entsprechender Befehl: Testen
Werte mithilfe eines trainierten Netzwerks
voraussagen
Entsprechender Befehl: Voraussagen
Dienstprogramme des neuronalen Netzwerks
ausführen
Entsprechender Befehl: Dienstprogramme
NeuralTools-Hilfedatei anzeigen
Entsprechender Befehl: Hilfe
Referenz: NeuralTools-Symbole 37
In Excel 2007 sind in der NeuralTools-Befehlsleiste folgende Symbole
zu sehen.
SymbolSymbolfunktion und entsprechender Befehl
Datensatz und Variablen definieren oder einen
bestehenden Datensatz nebst Variablen
bearbeiten bzw. löschen
Entsprechender Befehl: Datensatzmanager
Neuronales Netzwerk trainieren
Entsprechender Befehl: Trainieren
Neuronales Netzwerk testen
Entsprechender Befehl: Testen
Werte mithilfe eines trainierten Netzwerks
voraussagen
Entsprechender Befehl: Voraussagen
Dienstprogramme des neuronalen Netzwerks
ausführen
Entsprechender Befehl: Dienstprogramme
NeuralTools-Hilfedatei anzeigen
Entsprechender Befehl: Hilfe
38 NeuralTools-Symbolleiste
Referenz: NeuralToolsMenübefehle
Einführung
Dieser Abschnitt des Referenzhandbuchs enthält detaillierte
Informationen über die NeuralTools-Befehle, die in Excel im
NeuralTools-Menü oder in der Befehlsleiste verfügbar sind. Die
Befehle werden in der Reihenfolge erörtert, in der sie in der
Menüleiste erscheinen, d. h. angefangen mit dem Befehl
Datensatzmanager und von da aus nach rechts gehend. Viele der
verfügbaren Befehle können auch über die NeuralTools-Symbole
ausgeführt werden. Im Abschnitt Referenz: NeuralTools-Symbole in
diesem Kapitel sind die Befehle aufgeführt, die den einzelnen
NeuralTools-Symbolen entsprechen.
Referenz: NeuralTools-Menübefehle 39
Symbole in Dialogfeldern
In den einzelnen NeuralTools-Dialogfeldern können bis zu zwei
Symbole (Symbol für Hilfe und Symbol für
Anwendungseinstellungen) zu sehen sein. Über das Symbol für Hilfe
können Sie im betreffenden Dialogfeld schnell auf die Hilfethemen
zugreifen. Hithilfe von Symbols für Anwendungseinstellungen kann
das Dialogfeld Anwendungseinstellungen angezeigt werden, in das
Sie Einstellungen für NeuralTools-Berichte eingeben und diese
Einstellungen auch bearbeiten können. Das gleiche ist bei
Standardeinstellungen für Training, Prognose und Ausführungszeit
möglich.
40 Einführung
Befehlsreferenz
Befehl Datensatzmanager
Definiert NeuralTools-Datensätze und -Variablen oder bearbeitet
bzw. löscht einen bestehenden Datensatz nebst Variablen
Der Befehl Datensatzmanager ermöglicht Ihnen, die gewünschten
Datensätze, Fälle und Variablen zu definieren. Sobald die Datensätze
definiert sind, können sie für das Training und Testen von neuronalen
Netzen sowie für die Prognose verwendet werden. Über das
Dialogfeld Datensatzmanager können Sie Datensätze hinzufügen
oder entfernen sowie auch einen Datensatz benennen oder das Layout
der Variablen in einem Datensatz angeben und diese Variablen wie
gewünscht bezeichnen.
Was sind
Datensätze und
Variablen?
In NeuralTools sind die Daten den Fällen und Variablen gemäß
strukturiert. Sie arbeiten mit einem Datensatz oder einem Satz von
statistischen Variablen, die sich in einem Excel-Arbeitsblatt in
zusammenhängenden Spalten mit verschiedenen Namen befinden.
Die Namen der Variablen sind in der ersten Zeile des Datensatzes zu
sehen. Bei jeder Zeile im Datensatz handelt es sich um einen Fall.
Jeder Fall ist mit einem Satz von unabhängigen Variablenwerten und
entweder einem bekannten oder fehlenden Wert für die abhängige
Ausgabevariable versehen.
Jede in einem Datensatz befindliche Variable hat einen Namen und ist
in Excel mit einem bestimmten Zellenbereich verknüpft. Ein
Datensatz kann aus mehreren Zellblöcken bestehen, wodurch Sie
dann Daten in verschiedene Blätter derselben Arbeitsmappe eingeben
können.
Wenn Sie einen Datensatz definieren, versucht NeuralTools, in Excel
die Variablen zu identifizieren, die sich in den Zellen um die aktuelle
Auswahl befinden. Dadurch kann schnell und mühelos ein Datensatz
eingerichtet werden, und zwar mit den Variablen in Spalten und den
entsprechenden Namen der Variablen jeweils in der obersten Zeile.
Referenz: NeuralTools-Menübefehle 41
Dialogfeld
Datensatzmanager
Im Dialogfeld Datensatzmanager sind unter Datensatz folgende
Optionen zu finden:
•Neu, Löschen – fügt einen neuen Datensatz hinzu oder löscht
einen bereits vorhandenen
• Name – legt den Namen für den Datensatz fest
• Excel-Bereich – bestimmt den mit einem Datensatz
verknüpften Excel-Bereich. Wenn einem Datensatz mehrere
Zellbereiche zugewiesen wurden, steht vor diesem Eintrag
die Bezeichnung Mehrfach.
•Zellformatierung anwenden – fügt Raster und Farben hinzu,
um die Datensätze zu identifizieren
•Mehrfach – durch Klicken auf Mehrfach im Dialogfeld
Datensatzmanager wird das Dialogfeld MehrfachbereichsSelektor angezeigt. Dieses Dialogfeld ermöglicht Ihnen, die
einzelnen Zellbereiche einzugeben, aus denen sich der aus
mehreren Zellbereichen bestehende Datensatz
zusammensetzt.
42 Befehlsreferenz
MehrfachbereichsDatensätze
•Importieren – ermöglicht das Kopieren von Variablentypen
aus einem anderen Datensatz oder trainierten neuronalen
Netz in diesen Datensatz. Über das Dialogfeld
Variablentypen importieren können Sie den Speicherort und
das Netz für Definition der Variablen auswählen.
In NeuralTools können mehrere Zellbereiche aus verschiedenen
Arbeitsblättern einem einzigen Datensatz zugewiesen werden. Ein
Mehrfachbereichs-Datensatz kann verwendet werden, wenn:
1) in einem Arbeitsblatt in Excel 2003 oder einer früheren Version
jede Variable im Datensatz mehr als 65.536 Datenpunkte hat und
der Datensatz daher in der Arbeitsmappe mehrere Arbeitsblätter
einnimmt.
2) die Daten für eine Variable sich in mehreren Blöcken befinden,
die in einer Arbeitsmappe über mehrere Arbeitsblätter verstreut
sind.
Hinweis: Ein Mehrfachbereichs-Datensatz kann nicht innerhalb eines
einzigen Arbeitsblattes definiert werden. Er kann jedoch auf mehreren
Arbeitsblättern derselben Arbeitsmappe definiert werden.
Referenz: NeuralTools-Menübefehle 43
Im Dialogfeld Mehrfachbereichs-Datensatzdefinition können
folgende Optionen ausgewählt werden:
• Alle löschen – löscht alle eingegebenen Bereiche
• Autom. füllen – wendet den zuerst (in Zeile 1) eingegebenen
Bereich auf alle sichtbaren Arbeitsblätter in der aktiven
Arbeitsmappe an und gibt diese SheetName!CellRange–
Verweise in das Raster ein.
•Auswählen – zeigt einen Selektor an, um einen Zellblock zur
Verwendung als Datensatzbereich markieren zu können.
•Sekundäre Bereiche haben die Variablennamen i der ersten
Zeile – Bei Mehrfachbereichs-Datensätzen können sich die
Namen von Variablen oben in jeder Spalte der einzelnen im
Dialogfeld aufgelisteten Bereiche befinden. Es ist aber auch
möglich, dass die Namen der Variablen nur die Spalten im
ersten ausgewählten Bereich bezeichnen. Der erste
ausgewählte Bereich ist der Bereich, der in Zeile 1 des
Dialogfelds Mehrfachbereichs-Datensatzdefinition
eingegeben wurde.
44 Befehlsreferenz
Optionen für
Variablen
Im Dialogfeld Datensatzmanager sind in jeder Rasterzeile die
Variablen eines Datensatzes aufgelistet, einschließlich des Excel-
Datenbereichs, der die Datenpunkte für die Variable enthält, des
Variablennamens und des Variablentyps.
Für Variablentyp können folgende Optionen eingestellt werden:
•Kategorieabhängig – eine abhängige oder Ausgabevariable,
deren mögliche Werte aus einem Satz von möglichen
Kategorien stammen, z. B. Ja oder Nein oder Rot, Grün oder
Blau.
•Kategorieunabhängig – eine unabhängige Variable, deren
mögliche Werte aus einem Satz von möglichen Kategorien
stammen, z. B. Ja oder Nein oder Rot, Grün oder Blau.
•Numerisch abhängig – abhängige oder Ausgabevariable,
deren mögliche Werte numerisch sind.
•Numerisch unabhängig – eine unabhängige Variable, deren
mögliche Werte numerisch sind.
Referenz: NeuralTools-Menübefehle 45
Weitere Info zu TagVariablen
•Tag – eine Variable, bei deren möglichen Werten es sich um
„Trainieren“, „Testen“ oder „Voraussagen“ handelt. Dieser
Variablentyp wird dazu verwendet, Fälle in einem Datensatz
zu identifizieren, die für Training, Testen oder Prognose
verwendet werden.
•Unbenutzt – eine Variable in einem Datensatz, der im
neuronalen Netz nicht verwendet wird.
Tag-Variablen sind besondere Variablen in einem NeuralToolsDatensatz, die dazu verwendet werden, Fälle im Datensatz zu
identifizieren, die für Training, Testen und Prognose verwendet
werden. Diese Variablen sind besonders nützlich, wenn sich alle
für Netzwerk-Training, Testen und Prognose zu verwendenden
Daten in nur einem Datensatz befinden sollen. Wenn Sie mit einer
Tag-Variablen arbeiten, wählt NeuralTools solche Fälle aus, die
für Training, Testen oder Prognose verwendet werden. Durch
Änderung der Werte einer Tag-Variablen können Sie ein
Netzwerk unter Verwendung anderer Fälle neu trainieren und
auch sehen, wie sich die Leistung des Netzwerks entsprechend
ändert. Auch können Sie neue Fälle mit unbekannten abhängigen
Variablenwerten zu einem Datensatz hinzufügen und diese
mittels Tag „Voraussagen“ prognostizieren lassen. Eine TagVariable kann nur drei mögliche Werte enthalten:
•Trainieren – legt fest, dass der Fall zum Training
verwendet wird
• Testen – legt fest, dass der Fall zum Testen verwendet wird
• Voraussagen – legt fest, dass der Fall zur Prognose
verwendet wird
Hinweis: Wenn sich in Ihrem Datensatz eine Tag-Variable befindet,
ändern sich dadurch die Optionen im Dialogfeld Training Weitere
Informationen sind unter dem Befehl Trainieren zu finden.
46 Befehlsreferenz
Fähigkeiten von
Datensatz und
Variablen
In einer NeuralTools-Sitzung kann mit Folgendem gearbeitet werden:
• bis zu 256 Datensätzen in einer Arbeitsmappe
• bis zu 16384 Variablen pro Datensatz in Excel 2007 (aber nur
256 Variablen in den früheren Excel-Versionen). Alle Daten
für einen Datensatz müssen sich in derselben Arbeitsmappe
befinden
•Anzahl der Datenpunkte pro Variable und Anzahl der Fälle
pro Datensatz ist in Excel 2007 nur durch den verfügbaren
Speicherplatz begrenzt (in früheren Excel-Versionen sind
16.777.216 Datenpunkte möglich)
Die wirklichen Datenkapazitäten sind je nach Systemkonfiguration
und verwendeter Excel-Version evtl. geringer als die vorstehend
angegebenen. Die Speicherbegrenzungen von Excel können sich
ebenfalls auf die Datenkapazitäten auswirken.
Hinweis: Im Dialogfeld Datensatzmanager sind alle in der aktiven
Arbeitsmappe befindlichen Datensätze und Variablen aufgelistet (es
handelt sich dabei um die oben im Dialogfeld Datensatzmanager
angegebene Arbeitsmappe). Um in anderen Arbeitsmappen befindliche
Datensätze auflisten zu können, muss die gewünschte Arbeitsmappe
in Excel aktiviert und dann im Dialogfeld Datensatzmanager
angezeigt werden.
Referenz: NeuralTools-Menübefehle 47
Befehl Trainieren
Legt die Einstellungen für das Training eines neuronalen
Netzwerks fest und führt den Trainingsvorgang aus
Der Befehl Trainieren ermöglicht Ihnen, 1) die für das Training eines
neuronalen Netzes in NeuralTools zu verwendenden Einstellungen
anzugeben und 2) mit dem Training des Netzes zu beginnen.
Registerkarte
Trainieren
Im Dialogfeld Training sind auf der Registerkarte Trainieren die
allgemeinen Optionen für das Training eines neuronalen Netzwerks
angegeben. Es handelt sich dabei um folgende Optionen:
•Datensatz – zeigt den Datensatz, der beim Training des
neuronalen Netzwerks verwendet werden soll. Dieser
Datensatz muss mithilfe des Datensatzmanagers definiert
werden und muss sich auch im aktiven Arbeitsblatt befinden.
•Netz speichern als – gibt Namen und Speicherort für das zu
trainierende neuronale Netz an Neuronale Netzwerke können
in einer Excel-Arbeitsmappe oder in einer Datei auf der
Festplatte gespeichert werden. Klicken Sie auf
Durchsuchen…, um den gezeigten Namen oder Speicherort
zu ändern.
48 Befehlsreferenz
Sie können auch einen Namen und eine Beschreibung für das zu
speichernde neuronale Netzwerk eingeben.
Die Optionen unter Wenn Training beendet ermöglichen Ihnen,
mithilfe des trainierten Netzes nach dem Training automatisch zu
testen und vorauszusagen. Das kann aber nur dann geschehen,
wenn die zu testenden und vorauszusagenden Daten sich in
demselben Datensatz wie die Trainingsdaten befinden.
•Autom. testen aktivieren – legt fest, dass:
1) ein Prozentsatz der Fälle im Datensatz automatisch
vom Training ferngehalten und zum Testen
verwendet werden soll
2) Fälle, in denen die Tag-Variable = "test" vorhanden
ist, zum Testen verwendet werden soll Bei einer TagVariable handelt es sich um einen Variablentyp, der
im Datensatzmanager spezifiziert ist.
legt fest, dass das trainierte Netz zum Voraussagen von
abhängigen Variablenwerten verwendet werden soll, und
zwar entweder
1) für Fälle, in denen der Wert der abhängigen Variable
nicht vorhanden ist oder
2) für Fälle, in denen die Tag-Variable = "voraussagen"
vorhanden ist. Bei einer Tag-Variable handelt es sich
um einen Variablentyp, der im Datensatzmanager
spezifiziert ist.
Referenz: NeuralTools-Menübefehle 49
Welche Bedeutung
hat die VariablenAuswirkungsanalyse?
•Echtzeit-Prognose aktivieren – legt fest, dass
NeuralTools entsprechende Formeln in den Zellen
platzieren wird, in denen die vorausgesagten abhängigen
Variablen zu sehen sind, um so die vorausgesagten Werte
zu berechnen. Weitere Informationen über EchtzeitPrognose sind in diesem Kapitel unter dem Befehl
Voraussagen zu finden.
•Variablenauswirkung berechnen – legt fest, dass
NeuralTools beim Bestimmen der durch das Netz
berechneten Prognosen die relative Auswirkung der
einzelnen unabhängigen Variablen im Trainingsdatensatz
mit einbeziehen soll.
Der Zweck der Variablen-Auswirkungsanalyse ist es, die
Empfindlichkeit der Netz-Prognosen hinsichtlich Veränderungen in
den unabhängigen Variablen zu messen. Diese Analyse bezieht sich
nur auf die Trainingdaten. Auf Basis dieser Analyse wird den
einzelnen unabhängigen Variablen jeweils ein Wert für „relative
Variablenauswirkung“ zugewiesen. Dies sind prozentuale Werte, die
insgesamt 100 % ergeben. Je niedriger der Prozentsatz einer
gegebenen Variable, desto geringer ist auch die Auswirkung dieser
Variable auf die Prognosen. Die Ergebnisse dieser Analyse können
dazu verwendet werden, einen neuen Satz von unabhängigen
Variablen auszuwählen, durch den dann genauere Prognosen
möglich sind. Eine Variable mit geringer Auswirkung kann z. B.
durch irgendeine neue Variable ersetzt werden. Es muss dabei jedoch
berücksichtigt werden, dass sich die Ergebnisse der
Auswirkungsanalyse nur auf das betreffende Netz beziehen. Die
Tatsache, dass ein gewisses Netz erfolgreich trainiert wurde, eine
bestimmte Variable nicht zu berücksichtigen, bedeutet
wahrscheinlich, dass ein anderes Netz ebenfalls entsprechend
trainiert werden kann. Es kann aber auch passieren, dass durch eine
andere Trainingssitzung mit anderer Netzart „entdeckt“ wird, wie
diese Variable trotzdem evtl. erheblich zu akkuraten Prognosen
beitragen kann. In Datensätzen mit einer kleineren Anzahl von Fällen
oder größeren Anzahl von Variablen können die Unterschiede in
relativer Auswirkung der Variablen von einem trainierten Netz zum
anderen erheblich ausgeprägter sein. Auch ist es wichtig, daran zu
denken, dass diese Werte „relativ“ sind. Angenommen, bei zwei
unabhängigen Variablen ist der einen ein Wert von 99 % und der
anderen ein Wert von 1 % zugewiesen. Dies bedeutet, dass die
letztere Variable viel weniger wichtig als die erstere ist. Das heißt
50 Befehlsreferenz
jedoch nicht, dass die letztere Variable vollkommen unwichtig ist,
besonders dann nicht, wenn sehr genaue Prognosen erwünscht sind.
Es folgen einige zusätzlich zu beachtende Punkte hinsichtlich der
Variablen-Auswirkungsanalyse:
1) Nur der Trainingsdatensatz wird hier analysiert. (Fälle, in denen
Autom. testen oder Autom. Prognose verwendet wird, werden
nicht mit einbezogen, da in diesen Fällen vielleicht Zahlenwerte
vorhanden sind, die außerhalb des Trainingsbereichs liegen.
Dadurch würden die Analysenergebnisse dann schlecht
vorhersehbar sein.)
2) Bei einer gegebenen kategorieunabhängigen Variable wird bei der
Analyse für jeden Fall durch alle für die Variable gültigen
Kategorien gegangen und dabei jeweils die Änderung im
vorausgesagten Wert gemessen. (Bei der Kategorieprognose gibt
es keinen vorausgesagten Zahlenwert, aber dafür viele grobe
numerische Netzausgaben, auf denen die Kategorieprognose
aufgebaut ist. In der Analyse werden diese numerischen
Ausgaben verwendet.)
3) Bei einer numerisch unabhängigen Variable wird in der Analyse
für jeden Fall durch den betreffenden Trainingswertbereich von
Minimum bis Maximum gegangen und dabei jeweils der
veränderte vorausgesagte Wert gemessen (oder, im Falle einer
Kategorieprognose, die Veränderung in den groben numerischen
Ausgaben).
Die Variablen-Auswirkungsanalyse ist nicht dazu da, feste
Schlussfolgerungen zu treffen. Beispielsweise soll dadurch nicht
bewiesen werden, dass eine bestimmte Variable vollkommen
bedeutungslos ist. Diese Analyse soll nur dabei helfen, den besten
Satz von unabhängigen Variablen zu finden: Die Ergebnisse dieser
Analyse können aber vielleicht darauf hinweisen, dass eine bestimmte
Variable ausreichend belanglos ist, sodass Sie vielleicht versuchen
sollten, ein Netz ohne diese Variable zu trainieren.
Die Ergebnisse der Variablen-Auswirkungsanalyse sind im Bericht
Trainingsübersicht zu sehen.
Referenz: NeuralTools-Menübefehle 51
Registerkarte
Netzkonfiguration
Diese Registerkarte im Dialogfeld Training ermöglicht Ihnen, die Art
von neuronalem Netzwerk auszuwählen, das auf Ihre Daten
eintrainiert werden soll. Sie können entweder eine bestimmte
Netzkonfiguration oder einfach Bestes Netz suchen wählen. Im
letzteren Fall versucht NeuralTools verschiedene mögliche
Konfigurationen, um das Netz zu finden, das für Ihre Zwecke am
besten ist.
52 Befehlsreferenz
In NeuralTools werden verschiedene neuronale
Netzwerkkonfigurationen unterstützt, um die bestmöglichen
Voraussagen zu erzielen. Für Klassifizierung/Kategorieprognose sind
zwei Arten von Netzwerken verfügbar: neuronale
Wahrscheinlichkeitsnetzwerke (PNN) und mehrschichtige
Feedforward-Netzwerke (MLF). Numerische Prognose kann mithilfe
von MLF-Netzwerken und auch mit verallgemeinerten neuronalen
Regressionsnetzwerken (GRNN) ausgeführt werden, die so ähnlich
wie PNN-Netzwerke sind. Weitere Informationen über die
technischen Aspekte der verfügbaren Netzwerkkonfigurationen sind
im Abschnitt Weiteres über neuronale Netzwerke zu finden.
Auf der Registerkarte Netzkonfiguration sind folgende Optionen
verfügbar:
•Netztyp – zur Auswahl des Netztyps, der zum Training
verwendet werden soll, oder für Bestes Netz suchen. Je nach
ausgewähltem Netztyp, ändern sich die auf der Registerkarte
Netzkonfiguration angezeigten Optionen. Folgende Netztypen
sind verfügbar:
Referenz: NeuralTools-Menübefehle 53
1) Bestes Netz suchen. Bei dieser Option überprüft
NeuralTools alle angekreuzten Netzkonfigurationen, wie
z.B. PNN/GRNN- und MLFN-Netze mit Knotenzählung
im eingegebenen Min-Max-Bereich. Es wird dann die für
Ihre Daten beste Konfiguration identifiziert, und zwar auf
Basis des erhaltenen Fehlerwert im Testdatensatz. Wenn
Alle versuchsweisen Netze in neuer Arbeitsmappe
speichern ausgewählt ist, können Sie die getesteten Netze
einzeln aus einer Arbeitsmappe laden (ganz gleich, ob es
sich dabei um das leistungsstärkste Netz handelt oder
nicht) und nach dem Trainieren für die Prognose
verwenden. Auch ist ein vollständiger
Testübersichtsbericht für jedes Netz verfügbar.
2) PNN/GRNN-Netz. Bei diesen Netztypen brauchen keine
zusätzlichen Optionen zu Trainingszwecken ausgewählt
werden. Daher ist dies die Standardeinstellung, wenn
NeuralTools installiert ist. Wenn es sich bei Ihren Daten
um numerische Ausgabenwerte handelt, wird ein GRNNNetzwerk und bei kategorischen Ausgabewerten ein
PNN-Netzwerk darauf eintrainiert.
3) MLFN-Netz. Ein mehrschichtiges Feedforward-Netzwerk
(MLFN) enthält eine oder zwei ausgeblendete
Knotenschichten.
54 Befehlsreferenz
Registerkarte
Ausführungszeit
Wenn Sie für die zweite Schicht keine Knoten wählen,
wird diese Schicht entfernt. Um auf zuverlässige Weise
die beste Konfiguration eines MLFN-Netzes zu finden,
sollte die Option Bestes Netz suchen verwendet und
nicht nur ein einzelnes MLFN-Netz trainiert werden. Falls
nicht genügend Zeit für Bestes Netz suchen vorhanden
ist, sollte Knotenanzahl auf Autom. ausgewählt
eingestellt bleiben.
Die Registerkarte Ausführungszeit im Dialogfeld Training
ermöglicht Ihnen, Anhaltebedingungen für das Training einzugeben.
Wenn keine Anhaltebedingungen ausgewählt werden, wird das
Training trotzdem irgendwann angehalten. Die Ausführungszeit ist
relativ kurz für PNN/GRNN-Netze und erheblich länger für MLFNetze. Es ist beispielsweise möglich, keine Anhaltebedingungen zu
wählen und dann im Dialogfeld Trainings-Fortschritt auf Stop zu
klicken, sobald keine Zeit mehr zum Training vorhanden ist. Bei der
Option Bestes Netz suchen muss eine Zeitbegrenzung für das
Training von Netzen definiert werden, um sicherzustellen, dass der
Suchalgorithmus nicht zu viel Zeit für eine bestimmte Konfiguration
verbraucht. Die drei verfügbaren Anhaltebedingungen können
kombiniert werden, um anzugeben, dass NeuralTools anhalten soll,
sobald eine der Bedingungen erreicht ist.
Referenz: NeuralTools-Menübefehle 55
Für Training-Ausführzeit sind folgende Optionen verfügbar:
•Zeit – legt eine bestimmte Zeitgrenze für das Trainieren eines
Netzwerks fest. Das Training wird aber evtl. schon früher
angehalten, wenn der Algorithmus erkennt, dass
wahrscheinlich kein weiterer Fortschritt erzielt werden kann.
Bei Verwendung von Bestes Netz suchen wird jede getestete
Konfiguration entsprechend der eingegebenen Zeitspanne
trainiert.
•Versuche – legt fest, dass NeuralTools nicht mehr als die
angegebene Anzahl an Versuchen ausführen soll, bevor
angehalten wird. Bei mehrschichtigen FeedforwardNetzwerken handelt es sich bei einem „Versuch“ um eine
einzelne Zuweisung von „Bewertungsfaktoren“ an die
Verbindungen zwischen Neuronen. Das Training besteht aus
einer intelligenten Suche nach Bewertungsfaktoren, die die
besten Prognosen ergeben. Bei neuronalen
Wahrscheinlichkeitsnetzwerken und verallgemeinerten
neuronalen Regressionsnetzwerken handelt es sich bei einem
Versuch um die Zuweisung von „Glättungsfaktoren“ an
Variablen Das Training besteht aus der Suche nach den besten
Glättungsfaktoren.
•Fortschritt – legt fest, dass NeuralTools nicht mehr
weitermachen soll, wenn die Fehlerstatistik im angegebenen
Zeitrahmen nicht mindestens um den eingegebenen
Prozentsatz verbessert werden kann.
56 Befehlsreferenz
Dialogfeld
Trainings-Vorschau
In dem Dialogfeld Trainings-Vorschau wird vor Beginn des
Trainings der Aufbau des aktuellen Netzwerk-Trainings angezeigt,
und zwar zusammen mit irgendwelchen Fehlern, die in Ihren Daten
festgestellt wurden. In diesem Dialogfeld sind alle Ihre ausgewählten
und durch NeuralTools berichteten Trainings-Vorraussetzungen zu
sehen. Im Abschnitt Fehler und Warnungen werden irgendwelche
Probleme beschrieben, die NeuralTools in Ihren Daten oder
Einstellungen erkannt hat und die notfalls noch vor dem Training
berichtigt werden können.
Referenz: NeuralTools-Menübefehle 57
Fenster TrainingsFortschritt
In dem Fenster Training läuft wird über den Status des NetzwerkTrainings berichtet, während dieses ausgeführt wird. Durch
Diagramme wird detailliert gezeigt, welchen Fortschritt NeuralTools
beim Verbessern des Netzwerks und Reduzieren des berichteten
Fehlers macht.
Im Fenster Training läuft wird über den Fehlerwert im Trainingssatz
berichtet. Wenn Sie Änderungen in diesem Wert beobachten, kann
dadurch kein direkter Rückschluss auf die Qualität der Prognosen
gezogen werden, die das Netz in Bezug auf nicht im Training
verwendete Fälle stellen wird. Solche Rückschlüsse sollten jeweils auf
Basis des Fehlerwertes im betreffenden Testdatensatz gezogen
werden. Bei numerischen Prognosen ist der im Fenster Training läuft
berichtete Fehlerwert der auf Basis der skalierten Daten festgestellte
Wert des mittleren quadratischen Fehlers. Im Abschnitt
Eingabetransformation sind weitere Informationen über das
Skalieren zu finden. Bei der Kategorieprognose wir der Fehlerwert
auf Basis der numerischen Kategoriedatendarstellung berichtet.
58 Befehlsreferenz
Trainings-Berichte
Nach dem Training können Übersichts- und Detail-Berichte erstellt
werden. Durch diese Berichte sind Einzelheiten über die Leistung des
trainierten neuronalen Netzwerks zu erkennen. Der aktuelle Inhalt
der erstellten Berichte wird im Dialogfeld Anwendungseinstellungen
angegeben, und zwar unter den Einstellungen für Zu erstellende Berichte und Spalten in Detailberichten.
•Trainings-Übersichtsbericht – In diesem Bericht sind
Statistiken und Diagramme über die Leistung des trainierten
neuronalen Netzes zu finden.
Referenz: NeuralTools-Menübefehle 59
Für Kategorieprognose/Klassifizierung ist in den Hauptstatistiken
und Diagrammen des Trainings-Übersichtsberichts folgendes zu
finden:
1) % schlechter Prognosen – dies ist der Prozentsatz der Fälle,
bei denen die vorausgesagte Kategorie nicht mit der aktuellen
Kategorie übereinstimmt.
2) Mittlere falsche Wahrscheinlichkeit (nur in PNN-Netzen
verfügbar) – Für die einzelnen Fälle berechnet NeuralTools
die Wahrscheinlichkeit von falschen Kategorien, wobei es sich
um die Summe der Wahrscheinlichkeiten handelt, die durch
ein PNN-Netz falschen Kategorien zugewiesen werden.
Wenn in irgendeinem Fall ein Netz beispielsweise 30 %
Wahrscheinlichkeit der Farbe Rot, 20% der Farbe Gelb und
50% der Farbe Grün zuweist und wir aber wissen, dass die
richtige Antwort Rot ist, dann ist der Wert in diesem Fall 20 %
+ 50 % = 70 %. Bei diesem Wert handelt es sich somit um eine
fallweise Fehlermessung für die Kategorieprognose. Dies
entspricht dem Residualfehler bei der numerischen Prognose.
Mittlere falsche Wahrscheinlichkeit entspricht dem
Durchschnittsfehlerwert für alle vorhandenen Fälle.
Detailberichte zeigen die falsche Wahrscheinlichkeit für die
einzelnen Fälle. Um dieses Konzept besser zu verstehen,
sollten Sie vielleicht die Einstellungen für Detailbericht
ändern, um die Wahrscheinlichkeiten zu zeigen, die durch ein
neuronales Wahrscheinlichkeitsnetz jeder möglichen
Kategorie der abhängigen Variable zugewiesen wurden. Zu
diesem Zweck müssen Sie im Menü Dienstprogramme die
Option Anwendungseinstellungen wählen und dann rechts
im Dropdown-Menü auf die Zeile Spalten in Detailberichten
klicken. Es ist dann das Dialogfeld NeuralTools – In Detailberichten anzuzeigende Spalten zu sehen. Wählen Sie
in diesem Dialogfeld die Option Wahrscheinlichkeiten für alle Kategorien (für PNN) zum Testen aus. Trainieren Sie
anschließend ein PNN-Netz auf einen Datensatz ein, der
mindestens 3 Kategorien in der abhängigen Variablen enthält
(die Beispieldatei „Autokredite.xls“ kann hierfür verwendet
werden). Zu diesem Zeck muss Autom. testen ausgewählt
sein. In dem sich daraus ergebenden Detailbericht können Sie
sehen, wie die Werte in der Spalte Falsche % sich auf die
Wahrscheinlichkeiten beziehen, die den einzelnen möglichen
Kategorien zugewiesen wurden. Falsche % bezieht sich auf
60 Befehlsreferenz
die Summe der Wahrscheinlichkeiten für alle falschen
Kategorien.
3) Klassifizierungs-Matrix – vergleicht die aktuellen mit den
vorausgesagten Kategorien, und zwar von Kategorie zu
Kategorie. Die Klassifizierungs-Matrix könnte z. B. zu
erkennen geben, dass ein Netz, wie vorgesehen, irgendeine
Krankheit in Patienten erkennt, aber die Tendenz hat, diese
Krankheit fälschlicherweise mitunter auch für gesunde
Patienten anzuzeigen.
4) Variablenauswirkung – zeigt die relative Auswirkung von
unabhängigen Variablen auf vorausgesagte Ergebnisse an.
5) Histogramm der Wahrscheinlichkeit von falschen
Kategorien (nur bei PNN-Netzen verfügbar) – weitere
Informationen über Wahrscheinlichkeit von falschen
Kategorien finden Sie vorstehend unter Mittlere falsche
Wahrscheinlichkeit.
Für Numerische Prognose ist in den Hauptstatistiken und
Diagrammen des Berichts Trainings-Übersicht Folgendes zu finden:
1) % schlechter Prognosen – Eine Prognose wird als „schlecht“
angesehen, wenn sie nicht in die für den aktuellen Wert
definierte Spanne fällt. Die Breite dieser Spanne wird durch
die Einstellung für Gute/schlechte Toleranz (Training) im
Dialogfeld Anwendungseinstellungen definiert.
2) Mittlerer quadratischer Fehler – ein Messwert für die
Abweichung von Prognosen vom aktuellen Wert (wird als
Quadratwurzel der durchschnittlichen quadratischen
Abweichung berechnet).
4) Variablenauswirkung – zeigt die relative Auswirkung von
unabhängigen Variablen auf vorausgesagte Ergebnisse an.
5) Histogramm der Residualwerte – der Residualwert ist die
Differenz zwischen dem aktuellen und dem vorausgesagten
Wert.
6) Aus Punktdiagrammen geht die Beziehung zwischen
aktuellen, vorausgesagten und Residualwerten hervor.
Referenz: NeuralTools-Menübefehle 61
Befehl Testen
Legt die Einstellungen für das Testen eines trainierten
neuronalen Netzwerks fest und führt den Test aus
Der Befehl Testen ermöglicht Ihnen, 1) die für das Testen eines
trainierten neuronalen Netzes zu verwendenden Einstellungen
anzugeben und 2) mit dem Testen zu beginnen.
Bei den zu testenden Daten handelt es sich meistens um Daten mit
bekannten Ausgabewerten, die nicht beim Training des Netzes
verwendet wurden. Im Dialogfeld Testen stehen folgende Optionen
zur Verfügung:
•Datensatz – zeigt den Datensatz, der beim Testen des
trainierten neuronalen Netzwerks verwendet werden soll.
Dieser Datensatz muss mithilfe des Datensatzmanagers
definiert werden und muss sich auch im aktiven Arbeitsblatt
befinden.
•Zu verwendendes Netz – gibt Namen und Speicherort für
das zu testende neuronale Netz an Neuronale Netzwerke
können in einer Excel-Arbeitsmappe oder in einer Datei auf
der Festplatte gespeichert werden. Klicken Sie auf
Durchsuchen…, um den gezeigten Namen oder Speicherort
zu ändern.
62 Befehlsreferenz
Variablenanpassung
Variablenanpassung legt fest, wie die in dem zu testenden Datensatz
befindlichen Variablen den Variablen im Datensatz angepasst
werden, der zum Trainieren des Netzes verwendet wurde.
Für die Variablenanpassung stehen zwei Optionen zur Verfügung:
1) Automatische Anpassung. Die Variablennamen im
Testdatensatz werden namentlich den Variablen im
Datensatz des trainierten Netzes angepasst und die
Variablentypen werden dieser Anpassung gemäß
eingestellt.
2) Benutzerdefinierte Anpassung. Diese Methode
ermöglicht Ihnen, die Variablen im Testdatensatz einzeln
den Variablen im Datensatz des trainierten Netzes
anzupassen. Diese Methode wird verwendet, wenn die
Namen der Variablen in den beiden Datensätzen
unterschiedlich oder verschiedene Zuweisungen
erwünscht sind.
Referenz: NeuralTools-Menübefehle 63
Dialogfeld
Testvorschau
Im Dialogfeld Variablenanpassung sind die Namen der Variablen in
jedem Datensatz aufgelistet, damit sie einander angepasst werden
können. Es können nur Variablen des gleichen Typs einander
angepasst werden. Bei jeder Anpassung werden die vorgenommenen
Zuweisungen zusammen mit dem Datensatz gespeichert. Durch
Klicken auf Vorherige Anpassung laden können die vorherig
vorgenommenen Anpassungen durchgesehen werden, um auf einen
Satz von früheren Zuweisungen für den Datensatz zuzugreifen.
In dem Dialogfeld Testvorschau wird vor Testbeginn der Aufbau des
aktuellen Netzwerktests angezeigt, und zwar zusammen mit
irgendwelchen Fehlern, die in Ihren Daten festgestellt wurden. In
diesem Dialogfeld sind alle Ihre ausgewählten und durch
NeuralTools berichteten Voraussetzungen für den Test zu sehen. Im
Abschnitt Fehler und Warnungen werden irgendwelche Probleme
beschrieben, die NeuralTools in Ihren Daten oder Einstellungen
erkannt hat und die notfalls noch vor dem Test berichtigt werden
können.
64 Befehlsreferenz
Testberichte
Nach dem Testen können Übersichts- und Detailberichte erstellt
werden. Durch diese Berichte sind Einzelheiten über die Leistung des
dem Testdatensatz entsprechend trainierten neuronalen Netzwerks
zu sehen. Der aktuelle Inhalt der erstellten Berichte wird im
Dialogfeld Anwendungseinstellungen angegeben, und zwar unter
den Einstellungen für Zu erstellende Berichte und Spalten in detaillierten Berichten. Der Detailbericht ist besonders beim Testen
recht praktisch, weil aus diesem Bericht zu erkennen ist, wie gut das
trainierte Netz die einzelnen Ausgabewerte im Testdatensatz
vorausgesagt hat.
•Testübersichtsbericht – In diesem Bericht sind Statistiken und
Diagramme über die Leistung des trainierten neuronalen
Netzes in Bezug auf den Testdatensatz zu finden.
Referenz: NeuralTools-Menübefehle 65
Für die Kategorieprognose ist in den Hauptstatistiken und
Diagrammen des Testübersichtsberichts folgendes zu finden:
1) % schlechter Prognosen – dies ist der Prozentsatz der Fälle,
bei denen die vorausgesagte Kategorie nicht mit der aktuellen
Kategorie übereinstimmt.
2) Mittlere falsche Wahrscheinlichkeit (nur in PNN-Netzen
verfügbar) – Für die einzelnen Fälle berechnet NeuralTools
die Wahrscheinlichkeit von falschen Kategorien, wobei es sich
um die Summe der Wahrscheinlichkeiten handelt, die durch
ein PNN-Netz falschen Kategorien zugewiesen werden.
Wenn in irgendeinem Fall ein Netz beispielsweise 30 %
Wahrscheinlichkeit der Farbe Rot, 20% der Farbe Gelb und
50% der Farbe Grün zuweist und wir aber wissen, dass die
richtig Antwort Rot ist, dann ist der Wert in diesem Fall 20 %
+ 50 % = 70 %. Bei diesem Wert handelt es sich somit um
einen fallweisen Fehlermesswert für die Kategorieprognose.
Dies entspricht dem Residualfehler bei der numerischen
Prognose. Mittlere falsche Wahrscheinlichkeit entspricht dem
Durchschnittsfehlerwert für alle vorhandenen Fälle.
Detaillierte Berichte zeigen die falsche Wahrscheinlichkeit für
die einzelnen Fälle. Um dieses Konzept besser zu verstehen,
sollten Sie vielleicht die Einstellungen für Detailbericht
ändern, um die Wahrscheinlichkeiten zu zeigen, die durch ein
neuronales Wahrscheinlichkeitsnetz jeder möglichen
Kategorie der abhängigen Variable zugewiesen wurden. Zu
diesem Zweck müssen Sie im Menü Dienstprogramme die
Option Anwendungseinstellungen wählen und dann rechts
im Dropdown-Menü auf die Zeile Spalten in detaillierten
Berichten klicken. Es ist dann das Dialogfeld NeuralTools –
In Detailberichten anzuzeigende Spalten zu sehen. Wählen Sie in diesem Dialogfeld die Option Wahrscheinlichkeiten
für alle Kategorien (für PNN) zum Testen aus. Trainieren Sie
anschließend ein PNN-Netz auf einen Datensatz ein, der
mindestens 3 Kategorien in der abhängigen Variablen enthält
(die Beispieldatei „Autokredite.xls“ kann hierfür verwendet
werden). Zu diesem Zeck muss Autom. testen ausgewählt
sein. In dem sich daraus ergebenden Detailbericht können Sie
sehen, wie die Werte in der Spalte Falsche % sich auf die
Wahrscheinlichkeiten beziehen, die den einzelnen möglichen
Kategorien zugewiesen wurden. Falsche % bezieht sich auf
die Summe der Wahrscheinlichkeiten für alle falschen
Kategorien.
66 Befehlsreferenz
3) Klassifizierungs-Matrix – vergleicht die aktuellen mit den
vorausgesagten Kategorien, und zwar von Kategorie zu
Kategorie. Die Klassifizierungs-Matrix könnte z. B. zu
erkennen geben, dass ein Netz, wie vorgesehen, irgendeine
Krankheit in Patienten erkennt, aber die Tendenz hat, diese
Krankheit fälschlicherweise mitunter auch für gesunde
Patienten anzuzeigen.
4) Histogramm der Wahrscheinlichkeit von falschen
Kategorien (nur bei PNN-Netzen verfügbar) – weitere
Informationen über Wahrscheinlichkeit von falschen
Kategorien finden Sie vorstehend unter Mittlere falsche
Wahrscheinlichkeit.
Für die Numerische Prognose ist in den Hauptstatistiken und
Diagrammen des Testübersichtsberichts folgendes zu finden:
1) % schlechter Prognosen – Eine Prognose wird als „schlecht“
angesehen, wenn sie nicht in die für den aktuellen Wert
definierte Spanne fällt. Die Breite dieser Spanne wird durch
die Einstellung für Gute/schlechte Toleranz (Test) im
Dialogfeld Anwendungseinstellungen definiert.
2) Mittlerer quadratischer Fehler – ein Messwert für die
Abweichung von Prognosen vom aktuellen Wert (wird als
Quadratwurzel der durchschnittlichen quadratischen
Abweichung berechnet).
4) Histogramm der Residualwerte – der Residualwert ist die
Differenz zwischen dem aktuellen und dem vorausgesagten
Wert.
5) Aus Punktdiagrammen geht die Beziehung zwischen
aktuellen, vorausgesagten und Residualwerten hervor.
Referenz: NeuralTools-Menübefehle 67
•Detaillierter Testbericht. Der Bericht wird neben dem
Testdatensatz platziert du zeigt, wie gut das trainierte Netz die
einzelnen Ausgabewerte im Testdatensatz vorausgesagt hat.
Im detaillierten Testbericht sind die Prognosen als gut oder schlecht
markiert, und zwar auf Basis der im Dialogfeld
Anwendungseinstellungen eingestellten Toleranzschwelle. Wenn Sie
mehrere Tests ausführen, können in neuen Spalten rechts vom
Testdatensatz entsprechende Detailberichte hinzugefügt werden,
sodass Sie feststellen können, wie die Prognosen für die einzelnen
Fälle sich ändern, wenn neu trainierte Netze getestet werden.
68 Befehlsreferenz
Schnellübersichten
in Detailberichten
Beim Durchsehen eines Detailberichts kann in Excel über einen
Popup-Kommentar schnell auf die Informationen im
Übersichtsbericht zugegriffen werden. Um den Popup-Kommentar
anzuzeigen, brauchen Sie mit der Maus nur über die
Berichtsüberschrift gehen. Hinweis – Um die Popup-Kommentare
anzeigen zu können, müssen diese in Excel über das Menü Extras und
das Dialogfeld Optionen auf der Registerkarte Ansicht aktiviert
werden.
Referenz: NeuralTools-Menübefehle 69
Befehl Voraussagen
Legt die Einstellungen für das Voraussagen von Werten unter
Verwendung eines trainierten neuronalen Netzwerks fest und
führt die Prognose aus
Der Befehl Voraussagen ermöglicht Ihnen, 1) die für das Voraussagen
von Werten mittels trainiertem neuronalem Netz zu verwendenden
Einstellungen anzugeben und 2) die Prognose auszuführen.
Bei den vorauszusagenden Daten handelt es sich gewöhnlich um
Fälle mit unbekannten abhängigen Variablen. Im Dialogfeld Prognose
stehen folgende Optionen zur Verfügung:
•Datensatz – zeigt den Datensatz, der für die Prognose
verwendet werden soll. Dieser Datensatz muss mithilfe des
Datensatzmanagers definiert werden und muss sich auch im
aktiven Arbeitsblatt befinden.
•Zu verwendendes Netz – gibt Namen und Speicherort für
das für die Prognose zu verwendende neuronale Netz an.
Neuronale Netzwerke können in einer Excel-Arbeitsmappe
oder in einer Datei auf der Festplatte gespeichert werden.
Klicken Sie auf Durchsuchen…, um den gezeigten Namen
oder Speicherort zu ändern.
70 Befehlsreferenz
•Variablenanpassung – legt fest, wie die in dem die
Prognosedaten enthaltenden Datensatz befindlichen
Variablen den Variablen in dem Datensatz angepasst werden
sollen, der zum Trainieren des Netzes verwendet wurde.
Klicken Sie auf Bearbeiten..., um die Anpassung der
Variablen zu ändern. Weitere Informationen über
Variablenanpassung sind in diesem Kapitel unter dem Befehl
Testen zu finden.
•Voraussagen für – wählt die Fälle aus, für die die Prognosen
vorgesehen sind. In der Regel werden Fälle vorausgesagt, bei
denen es um fehlende abhängige Variablenwerte geht, aber
Sie können auch eine Prognose für alle Fälle vornehmen
(selbst für solche, in denen der Wert der abhängigen Variable
bekannt ist). Wenn sich eine Tag-Variable in dem Datensatz
befindet, werden die Werte der abhängigen Variable nur für
solche Fälle vorausgesagt, die mit dem Tag voraussagen
markiert sind.
•Optionen – sind zum Einstellen von Optionen für den
Speicherort des vorausgesagten Wertes und für die EchtzeitPrognose da.
1) Vorausgesagte Werte direkt im Datensatz platzieren –
Durch diese Option wird festgelegt, dass die
vorausgesagten Werte direkt am Speicherort der
abhängigen Variable im Datensatz der einzelnen
Prognosefälle und außerdem vielleicht auch im
Detailbericht platziert werden sollen (sofern unter Zu erstellende Berichte in Anwendungseinstellungen die
Option Detailberichte ausgewählt wurde). Hierdurch
wird der aktuelle Inhalt der Zelle überschrieben. Bei
dieser Option sollte man daher Vorsicht walten lassen.
Sie können die vorausgesagten Werte im Datensatz
durch die verschiedenen Farben erkennen.
2) Echtzeit-Prognose aktivieren – legt fest, dass
NeuralTools entsprechende Formeln in den Zellen
platzieren soll, in denen die vorausgesagten abhängigen
Variablen zu sehen sind. Durch diese Formeln kann
NeuralTools die vorausgesagten Werte als Veränderung
der unabhängigen Werte berechnen.
Referenz: NeuralTools-Menübefehle 71
Echtzeit-Prognose
3)Keine Echtzeit-Prognose bei Fällen mit fehlenden oder
ungültigen Werten hinzufügen – legt fest, dass keine
Formel für Echtzeit-Zukunftsprognose hinzugefügt
werden soll, wenn für den betreffenden Fall keine Werte
für die Eingabevariable vorhanden sind. Wenn
Eingabewerte fehlen, werden dadurch aus den
Prognoseformeln fehlerhafte Werte zurückgegeben. Es
könnte jedoch nützlich sein, NeuralTools trotz fehlender
unabhängiger Werte zu erlauben, Formeln einzugeben,
da dann sofort nach Einfüllen der fehlenden Werte,
automatisch die Prognose angezeigt werden kann.
Die Echtzeit-Prognose stellt eine leistungsstarke Funktion in
NeuralTools Industrial dar, die Ihnen ermöglicht, in Excel
automatisch Prognosen vorzunehmen, ohne vorher erst einen
speziellen Voraussage-Vorgang ausführen zu müssen.
Mithilfe der Echtzeit-Prognose kann NeuralTools
entsprechende Formeln in den Zellen platzieren, in denen die
Werte der vorausgesagten abhängigen Variablen zu sehen
sind. Für diese Formeln wird eine benutzerdefinierte
NeuralTools-Funktion verwendet, um die vorausgesagten
Werte zu berechnen, wie z. B. in
Die entsprechende Formel braucht nicht von Ihnen
eingegeben werden, da sie durch NeuralTools automatisch
Ihrem Arbeitsblatt hinzugefügt wird. Durch die Argumente
kann NeuralTools feststellen, welches trainierte Netzwerk
verwendet wird und auch, wo sich die unabhängigen Werte
im Arbeitsblatt befinden. Wenn Werte für eine für den
betreffenden Fall eingegebene Variable hinzugefügt oder
geändert werden, gibt NeuralTools automatisch einen neuen
vorausgesagten Wert zurück. Dadurch ist es einfach, für neue
Fälle weitere Prognosen zu erstellen oder hinzuzufügen, und
zwar unter Verwendung des bestehenden trainierten Netzes.
Hinweis: Falls die Prognose auf Zellwerten basiert, die sich
wahrscheinlich nicht ändern werden, sollte die Option
Echtzeit-Zukunftsprognose im Dialogfeld Training oder
Prognose deaktiviert werden, da dadurch in Excel die
Arbeitsmappe erheblich schneller neu berechnet werden
kann.
72 Befehlsreferenz
Dialogfeld
Prognosevorschau
Im Dialogfeld Prognosevorschau ist der Prognoseaufbau für den
ausgewählten Datensatz zu sehen, und zwar einschließlich
irgendwelche in den Daten oder der Einstellungsprognose erkannten
Fehlern. In diesem Dialogfeld sind alle Ihre ausgewählten und durch
NeuralTools berichteten Prognosevorraussetzungen aufgeführt. Im
Abschnitt Fehler und Warnungen werden irgendwelche Probleme
beschrieben, die NeuralTools in Ihren Daten oder Einstellungen
erkannt hat und die notfalls noch vor der Prognose berichtigt werden
können.
Referenz: NeuralTools-Menübefehle 73
Prognoseberichte
Nach der Prognose können Übersichts- und Detailberichte erstellt
werden. Durch diese Berichte sind Einzelheiten über die Leistung des
dem Testdatensatz entsprechend trainierten neuronalen Netzwerks
zu sehen. Der aktuelle Inhalt der erstellten Berichte wird im
Dialogfeld Anwendungseinstellungen angegeben, und zwar unter
den Einstellungen für Zu erstellende Berichte und Spalten in detaillierten Berichten.
•Detaillierter Prognosebericht. Dieser Bericht wird neben dem
Prognosedatensatz platziert. Er kann als Speicherort für
Prognosen verwendet werden, wenn der Benutzer diese nicht
innerhalb der abhängigen Variable im Datensatz selbst
platzieren möchte. Falls die abhängige Variable Verlaufsdaten
für bestimmte Fälle enthält, ist es vielleicht sicherer, diese
Verlaufsfälle nicht mit den Netzprognosen zu kombinieren.
Wenn Sie mehrere Prognosen ausführen, können in neuen Spalten
rechts vom Datensatz entsprechende Detailberichte hinzugefügt
werden, sodass Sie feststellen können, wie die Prognosen für die
einzelnen Fälle sich ändern, wenn neu trainierte Netze verwendet
werden.
74 Befehlsreferenz
Dienstprogramme
Befehl Anwendungseinstellungen
Legt die Einstellungen für Trainings-, Test- und
Prognoseberichte fest
Der Befehl Anwendungseinstellungen ermöglicht Ihnen, genau
auszuwählen, 1) welche Berichte für Training, Testen und Prognose
zu erstellen sind, 2) welche Trainings-Standardwerte zu verwenden
sind und 3) welche Standardwerte für Prognose und Ausführzeit
benutzt werden sollten. Bei vielen der Anwendungseinstellungen
handelt es sich um Standardwerte zur Verwendung in den
Dialogfeldern Training, Testen und Prognose. In diesen
Dialogfeldern sind weitere Informationen über die betreffenden
Einstellungen zu finden. Andere Einstellungen werden nachstehend
beschrieben.
Referenz: NeuralTools-Menübefehle 75
Berichte
Für Berichte gibt es folgende Einstellungen:
•Zu erstellende Berichte – In NeuralTools kann durch jeden
Vorgang ein Übersichts- und ein Detailbericht erstellt werden.
In der Regel werden Sie jedoch den Standardbericht
verwenden, da andere Berichte meistens nicht viel zum
Verfahren beitragen. Bei der Prognose ist z. B. der Detailbericht
der standardmäßig verwendete Bericht und ein
Übersichtsbericht würde in diesem Fall nicht viel zu diesem
Vorgang beitragen.
Übersichtsberichte werden auf dem zugehörigen Arbeitsblatt
platziert, während Detailberichte sich in Spalten rechts vom
Datensatz befinden, und zwar auf dem gleichen Arbeitsblatt
wie der Datensatz.
• Folgende Option ist für Übersichtsberichte platzieren in
vorhanden:
- Neue Arbeitsmappe – um ein neues Arbeitsblatt für
jeden Bericht zu erstellen. Sie können entweder dieselbe
Arbeitsmappe für alle Ihre Berichte verwenden oder
jeweils eine neue Arbeitsmappe erstellen.
• Für Detailberichtsplatzierung sind folgende Optionen
verfügbar:
- Vorhandene Berichte überschreiben – überschreibt die
Datenspalten vorhergehender Detailberichte in einem
Datensatz mit neuen Detailberichten (um einen
Detailbericht manuell zu löschen, müssen Sie die
Überschriften der Spalten, die diesen Bericht enthalten,
durch Markieren auswählen und dann im Menü
Bearbeiten auf Löschen klicken).
- Rechts vom Datensatz – fügt neue Spalten rechts vom
Datensatz ein, um dort die neuen Detailberichte zu
platzieren.
- Rechts von vorhandenen Berichten – verwendet die
Spalten rechts vom Datensatz sowie vorhandene Berichte,
um die neuen Detailberichte zu platzieren.
76 Dienstprogramme
•Spalten in Detailberichten. Für jede ausgewählte Zeile wird
rechts vom Datensatz im Detailbericht eine Spalte angezeigt, in
de die Informationen für die einzelnen Fälle zu sehen sind.
Folgende Spalten können angezeigt werden:
1) Verwendetes Tag – Die Tags Training, Testen und
Prognose sind für jeden Fall zu sehen, wenn er als Teil
des Trainings- oder Testsatzes verwendet wurde oder
wenn eine Prognose in einem bestimmten Fall gestellt
wurde.
2) Durech Verwendung des Netzes erstellte Prognose –
zeigt eine durch das Netz vorausgesagte Zahl oder
Kategorie
3) Wahrscheinlichkeit der vorausgesagten Kategorie (für
PNN) –Durch neuronale Wahrscheinlichkeitsnetze wird
nicht nur eine unbekannte Kategorie vorausgesagt,
sondern der Kategorie auch eine bestimmte
Wahrscheinlichkeit zugewiesen. Diese Option ist nicht
verfügbar, wenn die Kategorien mithilfe von
mehrschichtigen Feedforward-Netzwerken vorausgesagt
werden. Diese Option bezieht sich nicht auf numerische
Prognosen.
4) Wahrscheinlichkeit von falschen Kategorien (für
PNN) – Summe der Wahrscheinlichkeiten, die durch ein
PNN-Netz den falschen Kategorien zugewiesen wurden.
Wenn in irgendeinem Fall ein Netz beispielsweise 30 %
Wahrscheinlichkeit der Farbe Rot, 20% der Farbe Gelb
und 50% der Farbe Grün zuweist und wir aber wissen,
dass die richtige Antwort Rot ist, dann ist der Wert in
diesem Fall 20 % + 50 % = 70 %. Bei dieser Spalte handelt
es sich somit um einen fallweisen Fehlermesswert für die
Kategorieprognose. Dies entspricht der Spalte
Residualfehler bei der numerischen Prognose.
Referenz: NeuralTools-Menübefehle 77
5) Residualfehler – die Differenz zwischen aktuellem und
vorausgesagtem Wert. Das bezieht sich nicht auf die
Kategorieprognose.
6) Gute/schlechte Auswertungen – Bei der numerischen
Prognose wird in dieser Spalte angezeigt, ob die Prognose
für den betreffenden Fall auch in die für den Wert
definierte Spanne fällt. Die Breite dieser Spanne wird
Toleranz für gute/schlechte Bewertung genannt. Bei der
Kategorieprognose ist in dieser Spalte nur zu sehen, ob
die vorausgesagte Kategorie auch mit der wirklichen
Kategorie übereinstimmt.
7) Wahrscheinlichkeit für alle Kategorien (für PNN) –
Wenn diese Option ausgewählt und ein neuronales
Wahrscheinlichkeitsnetz trainiert wird, erscheint jeweils
eine Spalte für jede abhängige Kategorie. Wenn das Netz
beispielsweise dazu verwendet wird, eine Farbe
vorauszusagen, sind vielleicht die Spalten „% rot“, „%
gelb“ und „% grün“ mit dem Prozentsatz der
Wahrscheinlichkeit zu sehen, die jeder dieser Farben
zugewiesen wurde.
•Gute/schlechte Toleranz. Wenn beim Testen und Training die
numerische Prognose innerhalb des für den Wert der aktuellen
abhängigen Variable eingegebenen Prozentsatzes liegt, wird
die Prognose als gut angesehen.
78 Dienstprogramme
Befehl Neuronalnetzmanager
Ermöglicht das Kopieren, Verschieben und Löschen von
trainierten neuronalen Netzwerken
Über den Befehl Neuronalnetzmanager können Sie trainierte
neuronale Netzwerke verwalten, indem Sie sie z. B. aus einer
Arbeitsmappe oder Datei in eine andere verschieben oder den Netzen
beschreibende Informationen hinzufügen.
Neuronale Netzwerke können in einer Excel-Arbeitsmappe oder in
einer Datei auf der Festplatte gespeichert werden. In einer ExcelArbeitsmappe können beliebig viele Netzwerke platziert werden.
Mithilfe des Neuronalnetzmanagers können Sie Netze in neue
Arbeitsmappen oder Dateien ziehen bzw. die Netze löschen oder
ersetzen. Dadurch sind Sie in der Lage, mühelos Datensätze in
anderen Arbeitsmappen zu analysieren, und zwar durch
Verwendung von bereits bestehenden trainierten Netzwerken. Die
Arbeitsmappe mit den Trainingsdaten braucht dabei nicht vorliegen.
Referenz: NeuralTools-Menübefehle 79
Im Neuronalnetzmanager sind folgende Optionen verfügbar:
•Kopieren – kopiert ein trainiertes neuronales Netzwerk an
einen anderen Speicherort. Sie brauchen zu diesem Zweck nur
die Arbeitsmappe oder Datei auswählen, in der das Netzwerk
platziert werden soll.
•Entfernen – löscht das betreffende trainierte neuronale
Netzwerk.
•Ersetzen – überschreibt ein trainiertes neuronales Netzwerk
durch ein neues Netzwerk. Diese Funktion ist bei Netzen
verfügbar, die für Echtzeit-Prognose verwendet werden. Nach
dem Ersetzen werden Echtzeit-Prognosen, die vorher mithilfe
des alten Netzes vorgenommen wurden, unter Verwendung
des neuen Netzen ausgeführt. Dies bezieht sich jedoch nicht auf
Detailberichte. Wenn ein Detailbericht Zellen mit EchtzeitPrognosen enthält, in denen das zu ersetzende Netz verwendet
wird, enthalten diese Zellen nach dem Überschreiben des
Netzes weiterhin die alten Werte.
•Netzinformationen – ermöglicht Ihnen, einem Netzwerk
beschreibende Informationen hinzuzufügen. Dadurch ist es
einfacher, das trainierte Netzwerk und auch die dazu
verwendeten Bedingungen zu identifizieren.
80 Dienstprogramme
Befehl Dienstprogramm zum Ersetzen fehlender
Daten
Macht es möglich, in einem Datensatz fehlende Daten und
fehlerhafte Werte durch künstliche Werte zu ersetzen
Dieser Befehl gibt Ihnen die Möglichkeit, in einem Datensatz die
fehlenden oder nicht erwünschten Daten durch künstliche Werte zu
ersetzen. Fehlende Variablenwerte werden in NeuralTools während
des Training, des Testens und der Prognose nicht berücksichtigt. Es
ist daher häufig angebracht, solche Variablen vor der Verarbeitung zu
berichtigen.
Im Dialogfeld Trainings-Vorschau ist ein Warnhinweis zu sehen,
wenn in einem Datensatz gewisse Werte fehlen. Wenn dieser
Warnhinweis erscheint, kann das Problem über den Befehl
Dienstprogramm zum Ersetzen fehlender Daten beigelegt werden.
Referenz: NeuralTools-Menübefehle 81
Im Dialogfeld Dienstprogramm zum Ersetzen fehlender Daten sind
folgende Optionen verfügbar:
•Zu ändernde Variablen – listet die Variablen auf, die im
aktuellen Arbeitsblatt im Datensatz verwendet werden, und zeigt
die Anzahl der fehlenden, fehlerhaften und (bei numerischen
Variablen) nichtnumerischen Daten. Durch Aktivieren des
Kontrollkästchens einer Variable wird diese ausgewählt, damit
darin fehlende oder andere nicht erwünschte Daten ersetzt
werden können.
In dieser Variablenliste ist durch Klicken mit der rechten
Maustaste ein Kontextmenü verfügbar, in dem Variablengruppen
ausgewählt und auch abgewählt werden können.
•Zu ersetzende Variablen – wählt unter den ausgewählten
Variablen die Wertetypen aus, die ersetzt werden sollen.
Bestimmter Wert – ermöglicht das Ersetzen aller Instanzen eines
bestimmten Variablenwertes durch einen neuen Wert.
•Art der Ersatzwerte – legt fest, welche Werte als Ersatz für
fehlende oder nicht erwünschte Daten im Datensatz platziert
werden sollen. Für numerische Variablen und Variablen vom Typ
Kategorie müssen unterschiedliche Werte angegeben werden.
Optionen für Kategorievariablen:
- Häufigste oder seltenste Kategorie – zeigt den
Kategorienwert, der am häufigsten oder seltensten bei
den Fällen im Datensatz vorkommt
- Benachbarte Kategorie – zeigt den Kategorienwert, der
in dem Datensatz auftritt, der sich neben dem Fall mit
dem fehlenden Wert befindet
- Zufallskategorie – zeigt den Kategorienwert, der zufällig
aus den im Datensatz befindlichen Werten gewählt
wurde
- Spezielle Kategorie – stellt alle fehlenden oder
unerwünschten Werte auf einen bestimmten Wert ein
82 Dienstprogramme
Weitere
Informationen über
fehlende Werte
Optionen für Numerische Variablen:
- Durchschnittlicher Variablenwert – zeigt den
durchschnittlichen Wert für die Variable bei allen Fällen
in dem Datensatz
- Mittlerer Variablenwert – zeigt den mittleren Wert für
die Variable bei allen Fällen in dem Datensatz
- Interpolation aus angrenzenden Werten – zeigt den
Wert, der in den Fällen durch Interpolation zwischen den
Variablenwerten in dem Datensatz berechnet wurde, der
sich neben dem Fall mit dem fehlenden Wert befindet
- Zufallswert (zwischen Min. und Max.) – zeigt einen
Zufallswert, der für alle Fälle im Datensatz zwischen dem
variablen Minimum und Maximum gewählt wurde
Bei beiden Variablentypen werden durch Zellen löschen die für die
Variable ausgewählten Werte gelöscht.
Das Dialogfeld Dienstprogramm zum Ersetzen fehlender Daten
stellt eine der möglichen Methoden zur Beseitigung von fehlenden
Daten dar. Über dieses Dialogfeld können künstliche Daten für
fehlende Daten eingefüllt werden. Es ist möglicherweise oft besser,
Zellen, in denen Daten fehlen, einfach leer zu lassen, sodass
NeuralTools dann solche Fälle mit fehlenden Daten überhaupt nicht
berücksichtigt. Hinweis: NeuralTools betrachtet besondere Symbole,
wie z. B. „?“ nicht als fehlende Daten. Fragezeichen müssen gelöscht
werden und das kann durch das Dienstprogramm zum Ersetzen fehlender Daten erreicht werden. Sie brauchen zu diesem Zweck
unter Zu ersetzende Werte nur Bestimmter Wert und unter Art der Ersatzwerte die Option Zellen löschen wählen.
Es ist evtl. auch möglich, NeuralTools zu verwenden, um fehlende
Werte in einer unabhängigen Variable vorauszusagen, und zwar auf
Basis von anderen unabhängigen Variablen, die nur wenige oder
überhaupt keine fehlenden Daten haben. Aus den Testergebnissen
geht hervor, um ein zum Voraussagen von fehlenden Werten
trainiertes Netz auch zuverlässig ist.
Referenz: NeuralTools-Menübefehle 83
84
Weitere Info über neuronale
Netzwerke
Grundlagen des neuronalen Netzwerks
Ein neuronales Netzwerk ist ein System, das Berechnungen an
numerischen Eingaben vornimmt und dann einen oder mehrere
Zahlenwerte ausgibt. Wenn ein neuronales Netz auf eine bestimmte
Anwendung abgerichtet ist, wird es wahrscheinlich korrekte Werte
für die betreffenden Eingaben ausgeben. Die Eingaben in einem Netz
könnten beispielsweise einige mühelos messbare Eigenschaften eines
Seeohrs (d.h. einer Abalone-Muschel) darstellen, wie z. B. Länge,
Durchmesser und Gewicht. Die im Netz vorgenommenen
Berechnungen würden dann eine Zahl ergeben, die ungefähr dem
Alter der Muschel entspricht (das genaue Alter einer solchen Muschel
ist nicht so leicht zu ermitteln).
Die Inspirationsquelle für das neuronale Netz ist in der Tat die
Struktur des menschlichen Gehirns. Das Gehirn besteht aus einer
großen Anzahl von Zellen, die Neuronen genannt werden. Ein
Neuron erhält Impulse von anderen Neuronen über eine Reihe von
Dendriten. Je nach erhaltenden Impulsen, kann ein Neuron ein Signal
an andere Neuronen senden, und zwar über ein Neuraxon, das die
Verbindung zu den Dendriten der anderen Neuronen herstellt. Genau
wie beim Gehirn, besteht das künstliche neuronale Netz aus
Elementen, die jeweils eine Anzahl von Impulsen erhalten. Daraus
ergibt sich eine Ausgabe, die eine verhältnismäßig einfache Funktion
der Eingaben darstellt.
Weitere Info über neuronale Netzwerke 85
Neuronale Netze gegenüber statistischen
Methoden
Neuronale Netze stellen eine Alternative zu den herkömmlicheren
statistischen Methoden dar. Genau wie die lineare Regression,
werden diese Netze zur Funktionsannäherung verwendet. Und genau
wie die Diskriminanzanalyse und die logistische Regression, werden
sie auch zur Klassifizierung verwendet. Neuronale Netze haben den
Vorteil, dass durch sie äußerst komplexe Funktionen modelliert
werden können, was bei den herkömmlichen linearen Techniken (d.h.
bei der linearen Regression und der linearen Diskriminanzanalyse)
nicht der Fall ist. Die Techniken zum Optimieren von linearen
Modellen waren gut bekannt, bevor die künstlichen neuronalen Netze
in der Mitte des 20. Jahrhunderts entwickelt wurden. Diese
Entwicklung nahm viele Jahre in Anspruch, bis schließlich
ausreichend wirksame Algorithmen für das Training von neuronalen
Netzen verfügbar waren. Heutzutage können wir jedoch mit vielen
hoch entwickelten Algorithmen für das Training von neuronalen
Netzen arbeiten, wodurch diese Netze zu einer attraktiven
Alternative zu den herkömmlicheren Methoden geworden sind.
Struktur eines neuronalen Netzes
Die Struktur eines neuronalen Netzes besteht aus verbundenen
Einheiten, die Knoten oder Neuronen genannt werden. Die einzelnen
Neuronen führen jeweils einen Teil der Berechnungen innerhalb des
Netzes aus: Jedes Neuron nimmt eine relativ einfache Berechnung
einiger Eingaben vor und ergibt dann eine Ausgabe. Der
Ausgabewert eines Neurons wird dann als eine der Eingaben für ein
anderes Neuron weitergegeben, sofern es sich nicht um Neuronen
handelt, die die endgültigen Ausgabewerte für das gesamte System
generieren.
Neuronen sind in Schichten angeordnet. Die zur Eingabeschicht
gehörenden Neuronen erhalten die Eingaben für die Berechnungen,
wie z. B. Länge, Durchmesser und Gewicht einer Abalone-Muschel.
Diese Werte werden dann an Neuronen in der ersten ausgeblendeten
Schicht weitergegeben, die dann Berechnungen an diesen Eingaben
vornehmen und die entsprechenden Ausgaben an die nächste Schicht
weitergeben. Diese nächste Schicht (falls vorhanden) könnte ebenfalls
ausgeblendet sein. Die Ausgaben der Neuronen in der letzten
ausgeblendeten Schicht werden an das Neuron oder die Neuronen
weitergeleitet, die die endgültigen Ausgaben für das Netz generieren.
Daraus geht dann z. B. das Alter der Abalone-Muschel hervor.
86 Grundlagen des neuronalen Netzwerks
Numerische und Katagorieprognosen
Wenn neuronale Netze dazu verwendet werden, Zahlenwerte
vorauszusagen, haben sie meistens nur eine Ausgabe.
Einzelausgabenetze sind zuverlässiger als Netze mit mehreren
Ausgaben. Auch kann fast jedes beliebige Prognoseproblem durch
Netze mit Einzelausgabe gelöst werden. Anstatt nur ein Netzwerk zu
konstruieren, um das Umsatzvolumen und den Kurs einer Aktie am
folgenden Tag vorauszusagen, ist es besser, ein Netz für
Kursprognosen und ein Netz für Umsatzprognosen zu erstellen.
Andererseits haben neuronale Netze aber mehrere Ausgaben, wenn
sie für die Klassifizierung-/Kategorieprognose verwendet werden.
Angenommen, Sie möchten voraussagen, ob der Kurs einer Aktie am
folgenden Tag „mehr als 1 % steigt“, „mehr als 1 % fällt“ oder sich
„nicht mehr als 1% verändert“. In diesem Fall wird das Netz drei
numerische Ausgaben haben und aus der höchsten Ausgabe geht
hervor, welche Kategorie durch das Netz ausgewählt wurde.
Trainieren eines Netzes
Beim Training eines Netzes handelt es sich um einen Prozess, durch
den die Berechnungsparameter fein eingestellt werden. Dadurch soll
erreicht werden, dass das Netz Wert ausgibt, die möglichst genau den
betreffenden Eingaben entsprechen. Dieser Prozess wird einerseits
durch Trainingsdaten und andererseits durch den TrainingsAlgorithmus gesteuert. Durch den Trainings-Algorithmus werden
verschiedene Sätze von Berechnungsparametern ausgewählt und
wird dann jeder Satz entsprechend ausgewertet, indem das Netz auf
die einzelnen Trainingsfälle angewendet wird, um festzustellen, wie
gut die durch das Netz gegebenen Antworten oder Lösungen sind.
Jeder Parametersatz wird als „Versuch“ bezeichnet. Der TrainingsAlgorithmus wählt jeweils neue Parametersätze aus, und zwar immer
auf Basis der Ergebnisse aus den vorhergehenden Versuchen.
Weitere Info über neuronale Netzwerke 87
Computerverarbeitung von neuronalen Netzen
Ein neuronales Netz ist ein Berechnungsmodell, das in verschiedene
Typen von Computerhardware implementiert werden kann.
Beispielsweise könnte ein neuronales Netz aus kleinen
Verarbeitungselementen erstellt werden, die jeweils die Arbeit eines
einzelnen Neurons ausführen. Neuronale Netze werden gewöhnlich
auf einem Computer implementiert, der mit nur einem
leistungsstarken Prozessor ausgestattet ist, wie das bei den meisten
Computern heutzutage der Fall ist. Bei dieser Art von Computer
verwendet NeuralTools den vorhandenen Prozessor, um die
Berechnungen der einzelnen Neuronen auszuführen. In diesem Fall
ist ein Neuron einfach Teil der Berechnungen, die für eine Prognose
erforderlich sind, und kein physikalisches Verarbeitungselement.
Arten von neuronalen Netzwerken
Es gibt verschiedene Arten von neuronalen Netzwerken, die sich in
Struktur, Berechnungsweise in den Neuronen und auch in den
Trainings-Algorithmen unterscheiden. Eines der in NeuralTools
verfügbaren Netze ist das mehrschichtige Feedforward-Netzwerk (MLF). Bei diesen MLF-Netzen kann der Benutzer von NeuralTools
angeben, ob eine oder zwei Schichten von verdeckten oder
ausgeblendeten Neuronen vorhanden sein und wie viele Neuronen
diese Schichten enthalten sollen (NeuralTools kann dabei behilflich
sein, die passenden Auswahlen zu treffen – siehe Abschnitt über
MLF-Netze). Verallgemeinerte neuronale Regressions (GRN)-Netze
und neuronale Wahrscheinlichkeits (PN)-Netze sind ebenfalls in
NeuralTools verfügbar. Diese beiden Arten stehen in enger Beziehung
zueinander. Das GRN-Netz wird für numerische Prognosen und das
PN-Netz für Kategorieprognose/Klassifizierung verwendet. Bei
diesen Netzen braucht der Benutzer keine Entscheidungen über die
Netzstruktur zu treffen. GRN- und PN-Netze sind immer mit zwei
ausgeblendeten Neuronenschichten versehen. Die erste Schicht
enthält ein Neuron pro Trainingsfall und die Größe der zweiten
Schicht hängt von gewissen Gegebenheiten in Bezug auf die
Trainingsdaten ab.
In den noch verbleibenden Abschnitten dieses Kapitels werden die in
NeuralTools verfügbaren neuronalen Netzwerke detaillierter
beschrieben.
88 Grundlagen des neuronalen Netzwerks
Mehrschichtige Feedforward-Netze
Bei mehrschichtigen Feedforward-Netzwerken (die auch
„mehrschichtige Wahrnehmungsnetzwerke“ genannt werden)
handelt es sich um Systeme, die in der Lage sind, komplexe
Funktionen zu approximieren und somit komplizierte Beziehungen
zwischen unabhängigen Variablen und einer abhängigen Variablen
modellieren können.
MLF-Architektur
Das nachstehende Diagramm zeigt ein MLF-Netz für numerische
Prognose, und zwar unter Verwendung von drei numerisch
unabhängigen Variablen. Das Netz wurde für 2 Neuronen/Knoten in
der ersten und 3 Neuronen/Knoten in der zweiten ausgeblendeten
Schicht konfiguriert.
Ausgabe
2. ausgebl.
Schicht
1. ausgebl.
Schicht
Eingaben
Das Verhalten des Netzes wird bestimmt durch:
• die Topologie des Netzes (d.h. durch die Anzahl der
ausgeblendeten Schichten und die Anzahl der Knoten in diesen
Schichten)
• die Bewertungsfaktoren für die Verbindungen (jeder Verbindung
ist ein Parameter zugewiesen) und die
Beeinflussungsbedingungen (jedem Neuron ist ein Parameter
zugewiesen)
Weitere Info über neuronale Netzwerke 89
• die Aktivierungs-/Übertragungsfunktion, die dazu verwendet
wird, die Eingaben in jedes Neuron in die entsprechende Ausgabe
zu konvertieren
Insbesondere wird ein ausgeblendetes Neuron mit n Eingaben zuerst
folgende gewichtete Summe der Eingaben berechnen:
Sum = in
wobei es sich bei in
vorherigen Schicht und bei w
* w0 + in1 * w1 + ... + inn * wn + bias
0
bis inn um Ausgaben von Neuronen in der
0
bis wn um
0
Verbindungsbewertungsfaktoren handelt. Jedes Neuron hat seinen
eigenen Beeinflussungswert. Anschließend wird die
Aktivierungsfunktion auf Sum angewendet, um die Ausgabe des
Neurons zu erzeugen.
In Neuronen, die sich in ausgeblendeten Schichten befinden, wird
eine S-förmige Funktion als Aktivierungsfunktion verwendet.
Genauer genommen, wird in NeuralTools die hyperbolische
Tangentenfunktion verwendet. In NeuralTools verwendet das
Ausgabeneuron die Einheit als Aktivierungsfunktion. Mit anderen
Worten, das Ausgabeneuron gibt einfach die gewichtete Summe
seiner Eingaben zurück. Neuronale Netze werden mitunter mit
sigmoidalen Aktivierungsfunktionen in den Ausgabeneuronen
konstruiert. Das ist jedoch für ein neuronales Netz nicht erforderlich,
um komplexe Funktionen approximieren zu können. Außerdem
haben sigmoidale Funktionen einen begrenzten Ausgabebereich (-1
bis 1 für die hyperbolische Tangentenfunktion) und typischerweise
sind auch außerhalb des Bereichs abhängige Werte zu finden. Wenn
daher eine sigmoidale Funktion im Ausgabeneuron verwendet wird,
ist vor Weitergabe von Trainingsdaten an das Netz ein zusätzliches
Transformieren der Ausgabewerte erforderlich.
Bei Verwendung von MLF-Netzen zur Klassifizierung haben diese
Netze mehrere Ausgabeneuronen, von denen jeweils ein Neuron den
einzelnen möglichen abhängigen Kategorien entspricht. Ein Fall wird
in einem Netz dadurch klassifiziert, dass die numerischen Ausgaben
berechnet werden. Es wird dann die Kategorie ausgewählt, die dem
Neuron entspricht, das den höchsten Ausgabewert ergibt.
90 Mehrschichtige Feedforward-Netze
Training eines MLF-Netzes
Ein MLF-Netz wird dadurch trainiert, dass nach einem Satz von
Verbindungsbewertungsfaktoren und Beeinflussungswerten gesucht
wird, durch die das Netz in der Lage ist, generell die richtigen
Antworten zu geben, wenn neue Fälle vorgebracht werden (zur
Vereinfachung werden in der nachstehenden Darstellung die
Beeinflussungswerte ausgelassen). Das Training beginnt damit, dass
ein ganz zufällig gewählter Satz von Verbindungsbewertungsfaktoren
zugewiesen wird. Es wird dann eine Zukunftsprognose für jeden
Trainingsfall vorgenommen (indem unabhängige Werte eingegeben
werden, um die Ausgabe zu erhalten). Diese Ausgabe wird sich
wahrscheinlich vom bekannten abhängigen Wert unterscheiden. Für
jeden Trainingswert haben wir daher einen Fehlerwert. Aus diesen
Fehlerwerten errechnen wir einen Fehlermesswert für den gesamten
Trainingssatz. Daraus ergibt sich, wie gut das Netz bei Verwendung
der anfänglichen Bewertungsfaktoren funktioniert.
Das Netz wird wahrscheinlich bei der anfänglichen rein zufälligen
Zuweisung von Bewertungsfaktoren nicht sehr erfolgreich sein. Wir
gehen daher zu weiteren Versuchen mit anderen Zuweisungen von
Bewertungsfaktoren über. Diese Zuweisungen von
Bewertungsfaktoren sind jetzt jedoch nicht mehr rein zufällig,
sondern werden durch unseren Trainings-Algorithmus festgelegt,
d.h. durch die Methode zur Auswahl von
Verbindungsbewertungsfaktoren auf Basis de Ergebnisse aus den
vorherigen Versuchen. Wir haben es hier mit einem
Optimierungsproblem zu tun: Wir möchten den Fehlermesswert
durch Änderung der Verbindungsbewertungsfaktoren minimieren.
Weitere Info über neuronale Netzwerke 91
Verlaufshintergrund
Fehlermesswerte
Trainingszeit
Der erste erfolgreiche Algorithmus für das Training von
Verbindungsbewertungsfaktoren in MLF-Netzen war die
„Fehlerfortpflanzung“. Wissenschaftler bevorzugen jetzt aber andere
Algorithmen, die schneller sind und wahrscheinlich sicherer das
globale Optimum finden. In NeuralTools wird das Konjugierte-Gradienten-Verfahren verwendet, das zur Kategorie der
zweitrangigen Optimierungsmethoden gehört. Diese
„deterministischen“ Optimierungsmethoden sind dazu da, nach dem
lokalen Minimum einer Funktion zu suchen, indem sie auf
wirkungsvolle Weise dem Neigungsgrad der Fehlerfunktion folgen.
Um das Risiko zu verringern, anstelle des globalen das lokale
Minimum zu finden, wird in NeuralTools die „deterministische“ mit
der „stochastischen“ Optimierungsmethode kombiniert. Genauer
genommen, wird die „simulierte Abkühlung“ (Simulated Annealing)
zusammen mit dem „Konjugierte-Gradienten-Verfahren“ (Conjugate
Gradient Descent Method) verwendet. Durch den Algorithmus wird
entschieden, welche Methode an einer bestimmten Stelle verwendet
wird, und zwar auf Basis der Ergebnisse aus den vorhergehenden
Versuchen. Weitere Informationen über „Conjugate Gradient
Descent“ sind unter Bishop (1995) und Masters (1995) zu finden.
Masters (1995) enthält auch weitere Informationen über „Simulated
Annealing“.
Beim Fehlermesswert, der zum Training von numerischen
Prognosenetzen verwendet wird, handelt es sich um den mittleren
quadratischen Fehler aller Trainingsfälle. Mit anderen Worten, dies ist
die mittlere quadratische Differenz zwischen der korrekten und der
durchs Netz erhaltenden Antwort. Bei der Klassifikation haben wir
mehr als eine Ausgabe für jeden Trainingsfall (d.h. jeweils eine
Ausgabe pro abhängiger Kategorie). Wir berechnen den mittleren
quadratischen Fehler aller Trainingsfallausgaben, indem wir auf die
gewünschten Ausgabewerte verweisen. Für jeden Trainingsfall sollte
der Ausgabewert möglichst dicht am Wert 1 liegen, und zwar jeweils
für die der korrekten Kategorie entsprechende Ausgabe. Die übrigen
Ausgabewerte sollten dicht an 0 liegen.
Der MLF-Trainings-Algorithmus von NeuralTools startet automatisch
viele Male neu, und zwar jedesmal mit unterschiedlichen
anfänglichen Startfaktoren. Mit anderen Worten, je länger ein Netz
trainiert wird, desto besser. Je öfter dem Netz ermöglicht wird, sich
erneut zu starten, desto wahrscheinlicher ist es, dass das globale
Minimum der Fehlerfunktion gefunden wird.
92 Mehrschichtige Feedforward-Netze
Loading...
+ hidden pages
You need points to download manuals.
1 point = 1 manual.
You can buy points or you can get point for every manual you upload.