Fortschrittlichster Ansatz für Data Mining und prädiktive Modellierung
Daten in den Biowissenschaften und dem Gesundheitswesen sind bekanntermassen sehr komplex und enthalten grosse Mengen an Faktoren, die sich meist gegenseitig beeinflussen. Um die hochdimensionale, nichtlineare Dynamik in solchen Daten zu bewältigen, sind ausgefeilte Modellierungsverfahren erforderlich.
Exploris Health hat ein einzigartiges und autonomes Softwarepaket für Data Mining und prädiktive Modellierung mit dem Namen AI-X-ENGINE entwickelt, das auf einer mehrstufigen Modellierungsarchitektur basiert und die höchstmögliche Klassifizierungs- und Vorhersagequalität liefert, indem es verschiedene Methoden aus der künstlichen Intelligenz, in einem automatisierten selbstlernenden Prozess auf der Grundlage eines evolutionären Optimierungsverfahrens kombiniert, bewertet und optimiert.
Die Nachahmung evolutionärer Prinzipien in der Mustererkennung und Merkmalsselektion, ermöglicht eine raffinierte Kombination und Verschachtelung verschiedener Methoden aus dem Bereich der künstlichen Intelligenz.
Die Modelle werden aus einer Kombination von assoziativen mathematischen Strukturen, wie einem künstlichen neuronalen Netz (ANN), insbesondere Self-Organizing-Maps (SOM), oder Decision-Tree-Ensembles und anderen Ensemble-Methoden mit einem künstlichen Evolutionsverfahren (AEVOP) erstellt. Die verwendeten Methoden lassen sich am besten als heterogenes adaptives System (HAS) auffassen, bei dem wettbewerbsorientiertes Lernen durch künstliche Evolution als Grundlage dient und statistische Modelle für die Auswahl des letztendlich gewünschten Modells verwendet werden. Die Ensemble-Methoden und SOM sind in der Lage, verborgene Korrelationsstrukturen selbständig zu erkennen, auch wenn diese nicht linear sind. Der Ansatz erreicht dieses Ziel durch mehrstufiges Re-Sampling und Kreuzvalidierung, bei dem jedes Modell eine Reihe von Stabilitäts- und Leistungsprüfungen durchläuft und mit anderen Modellen um das Überleben konkurriert, wobei nur die «fittesten» in einer vernetzten Modellarchitektur überleben.
Der gesamte Modellierungsprozess ist in hohem Masse automatisiert und standardisiert. Es ist keine Vorbewertung von Datenattributen durch Experten erforderlich - die Software erkennt verborgene Zusammenhänge in den Daten von selbst und bewertet die relevanten prognostischen Faktoren.
Die Fähigkeit, den Modellierungsprozess im Voraus in Richtung der gewünschten Sensitivität/Spezifität zu lenken, ermöglicht die Erstellung von Modellen mit sehr niedrigen Falsch-Positiv- oder Falsch-Negativ-Raten, was mit Standardmethoden nicht erreichbar ist.
Bereitstellung von Vorhersagemodellen, die hochkomplexe nichtlineare Beziehungen in Daten mit grosser Dimensionalität erkennen und reproduzieren können.
Die Aufgaben der Merkmalsselektion und der Reduktion der Dimensionalität werden eigenständig durchgeführt. Die manuelle Try-and-Error-Methode wird durch eine gezielte Suche nach den bestmöglichen Methoden und Merkmalskombinationen ersetzt, die das System automatisch durchführt.
Die mehrschichtige Kreuzvalidierung gewährleistet die Stabilität des von unserem Ansatz abgeleiteten Modells auch bei kleinen Datensätzen.
Bereitstellung einer maximalen Analysequalität und Gewährleistung eines kontrollierten und nachvollziehbaren Analyseprozesses für die diagnostische Klassifikation.