Beratung in einem neuen Stil
ecs Beratung & Service GmbH
Home
Unternehmen
News
Kontakt
Karriere
Downloads

Beratung
Knowledge Discovery in Databases
Anwendungen
Lexikon
Benchmarking
Datenmanagement

Lexikon

Einige Erklärungen zu den auf unserer Homepage verwendeten Fachbegriffen aus den Bereichen Knowledge Discovery in Databases und Operations Research. Das Lexikon wird sukzessive ausgebaut.


A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z







 

Vorgehensmodell der Knowledge Discovery in Databases



Data Mining - die Analyse - ist nur ein Teil des Gesamtprozesses.
Clusteranalyse Analyseverfahren, mit denen Gruppen mit ähnlichen Eigenschaften zu sog. Clustern zusammengefasst werden. Wichtigste Anwendung der Clusteranalyse bei ecs ist der Aufbau von Klassifizierungssystemen für Materialstammdaten.
Computerlinguistik Die Computerlinguistik ist ein interdisziplinäres Fachgebiet im Spannungsfeld zwischen Linguistik und Informatik, das sich mit der maschinellen Verarbeitung der natürlichen Sprache befasst.
Wichtige Anwendungsfelder sind u.a. Spracherkennung, automatische Übersetzung, Klassifizierung, Text Retrieval und Text Mining
Data Mining Data Mining ist die Nutzung verschiedenster mathematischer Methoden zur Untersuchung von Gesetzmäßigkeiten in meist sehr großen Datenbeständen. Hierzu gehören u.a.
Clusteranalyse
Klassifikation
Regressionsanalyse
Outlier Detection
Assoziationsanalyse
Künstliche neuronale Netze
Domänenwissen Wissen über bestimmte Themenbereiche (Domänen). Es kann sich hierbei sowohl um allgemeines Fachwissen, als auch um Erfahrungswissen handeln. Für effektive Knowledge Discovery in Datases muss häufig Domänenwissen und methodisches Know-How zusammengebracht werden.
explorative
Datenanalyse
Datenanalyse bei der der zu untersuchende Sachverhalt noch nicht eingegrenzt wurde und die zu untersuchenden Variablen noch nicht eindeutig festgelegt sind. Mit Hilfe des Domänenwissens über einen Sachverhalt wird hierbei versucht, Abhängigkeiten zwischen einzelnen Variablen zu finden, für die eine genauere Betrachtung sinnvoll ist.
Knowledge
Discovery in
Databases (KDD)
Knowledge Discovery in Databases (KDD) umfasst sowohl das Data Mining, die Analyse großer Datenbestände, als auch die hierfür in der Regel erforderliche Aufbereitung der Rohdaten sowie die Interpretation und Evaluierung der Ergebnisse.
Das Vorgehensmodell der KDD nach Fayyad, Piatetsky-Shapiro & Smyth umfasst die folgenden Schritte.
1. Datenselektion
2. Datenvorverarbeitung
3. Datentransformation
4. Data Mining
5. Interpretation und Evaluierung
Klassifikation Im Umfeld des Data Mining ist Klassifikation die Einordnung von Datensätzen in bestimmte Klassen oder Kategorien. ecs beschäftigt sich intensiv mit der semiautomatischen Klassifikation zur Aufwandsreduzierung bei der Stammdatenbereinigung, sowie dem Aufbau von einkaufsgerechten Klassifikationshierarchien.
Künstliche
neuronale
Netzwerke
Künstliche neuronale Netzwerke, Abk. KNN ist ein Rechenmodell, das versucht, die biologische Struktur des Gehirns nachzubilden. Mit Hilfe unterschiedlicher Konfigurationen (Verbindungen, Gewichtungen, Schwellwerten) von miteinander vernetzten Einzelknoten können insbesondere Probleme der Mustererkennung gelöst werden.
Dabei wird ein KNN zunächst mit Trainingsdaten versorgt, mit denen es seine Konfiguration auf ein zu lösendes Problem anpasst. Der eigentliche Analyseprozess erfolgt nach dieser Trainingsphase.
Linear Performance
Pricing (LPP)
Einkaufsanalysetool, bei dem auf der x-Achse die Leistung ("Performance") eines Produkts, auf der y-Achse der Preis aufgetragen wird. Man erhält verschiedenen Datenpunkte, durch die eine Regressionsgerade gelegt werden kann. Produkte, die oberhalb der Geraden liegen, weisen einen an der Funktionalität gemessen zu hohen Preis auf. Die Herausforderung beim LPP liegt in der Erfassung und Normalisierung aller leistungsrelevanten Produktmerkmale. Hierzu ist in der Regel umfangreiches Hintergrundwissen über das Produkt erforderlich.
Operations Research Operations Research, Abk.: OR, auch: Unternehmensforschung beschäftigt sich mit der Lösung von Entscheidungsproblemen mit Hilfe optimierender mathematisch-informationstechnischer Verfahren. Zu den bekanntesten Teilgebieten zählt die lineare Programmierung.
Regressionsanalyse Die Regressionsanalyse ist ein mathematisches Verfahren zur Untersuchung der Beziehungen zwischen 2 oder mehr Variablen. Dabei wird eine Regressionsfunktion berechnet, die die Beziehungen zwischen den vorgegebenen Daten am besten approximiert. Zwar kann hierbei je nach Datenlage eine beliebige Funktion gewählt werden, der typische Fall ist jedoch die Annahme einer linearen Abhängigkeit: lineare Regression. Eine wichtige Anwendung der Regressionsanalyse im Einkauf ist das Linear Performance Pricing.