inform blog

MACHINE LEARNING – EIN BLICK HINTER DEN HYPE

17.06.2019 Björn Heinen

Der Begriff Machine Learning wird häufig für Marketing- und Vertriebszwecke genutzt. Daher sollte man nicht vergessen, dass hinter dem Buzzword neben der Werbemaschinerie tatsächlich ein realer Mehrwert für Unternehmen steht. Eines meiner bevorzugten Vortragsthemen besteht nur darin, auf verständliche Weise zu erklären, was konzeptuell bei verschiedenen Machine-Learning-Use-Cases passiert und wie die Anwendungen in der Praxis wirklich aussehen. In einem einzelnen Blogbeitrag ist das Thema natürlich nicht in voller Tiefe abgehandelt. Daher möchte ich meinen ersten Beitrag zu dem Thema nutzen, um eine Einführung in die verschiedenen Methoden des Maschinellen Lernens zu geben – und schon erste Einblicke in die Praxis.

Es gibt viele verschiedene Definitionen für Machine Learning – eine, die mir gefällt, lautet: Machine Learning geschieht dann, wenn der Computer eigenständig lernt, aus Daten Entscheidungen abzuleiten. Um diese Entscheidungen abzuleiten, gibt es verschiedene Wege, beziehungsweise Algorithmenklassen. Beispiele sind hier überwachtes, unüberwachtes, teilüberwachtes und bestärkendes Lernen oder auch genetische Algorithmen. In diesem Beitrag gehen wir auf die beiden gängigsten Sorten überwachtes und unüberwachtes Lernen ein. Auf die restlichen Verfahren inklusive ihrer Vor- und Nachteile für Unternehmen kommen wir in späteren Beiträgen zurück.

Machine-Learning-Arten und ihre Anwendung in der Praxis

Bei der Methode Supervised Learning handelt es sich um ein angeleitetes Verfahren, bei dem Trainingsdaten inklusive bereits beobachteter Zielwerte für den Aufbau des Modells bereitgestellt werden. Ein Beispiel für Supervised Learning ist die Klassfikation. Die Daten sollen hierbei vorgegebenen Klassen oder Gruppierungen selbstständig zugeordnet werden. Ein Beispiel aus der Praxis stammt aus dem Bereich Betrugserkennung, wo Software durch Maschinelles Lernen schnell Muster und Auffälligkeiten erkennen kann, die auf einen Betrug hinweisen (die Klassen sind also Betrug/Kein Betrug). Findet zum Beispiel eine Kreditkartenabhebung in Deutschland statt und bereits zehn Minuten später mit derselben Karte in Thailand, muss ein Betrug vorliegen. Eine große Herausforderung liegt darin, dass sich die Betrugsmuster kontinuierlich verändern. Dementsprechend müssen auch die Machine-Learning-Algorithmen permanent dazu lernen.

Eine weitere Methode des Maschinellen Lernens ist das Unsupervised Learning. Bei dieser Methode fehlen im Gegensatz zum Überwachten Lernen bekannte Zielwerte. Die Maschine versucht eigenständig, in den Eingabewerten Muster oder statistische Auffälligkeiten zu erkennen. Ein Anwendungsbeispiel für dieses unüberwachte Lernen findet sich in einem Chemiepark. Unternehmen im Chemiepark bezahlen unter anderem für die Nutzung seiner Infrastruktur, beispielsweise in Form von Wasserdampf oder Elektrizität. Außerdem leitet er das toxische Abwasser für die Unternehmen ab. Dabei gibt es für jedes Unternehmen einen Kanal, der in die Hauptkanalisation führt, die das Abwasser wiederum in eine Kläranalage leitet. Der Betreiber möchte wissen, ob bei allen Unternehmen die Abwasserabführung nach Plan läuft, da er ansonsten unter anderem einen finanziellen Schaden durch das Aussetzen der Kläranlage und folglich den Stillstand des Chemieparks haben könnte. Neben Informationen zu den Unternehmen wie Wasser-, Elektrizität-, oder Dampfabnahme, weiß man außerdem durch kontinuierliche, automatisierte Probeentnahmen, wie viel Abwasser aktuell in die Kanalisation abgepumpt wird, welche Temperatur es hat, usw. Anhand dieser Werte kann man über einen zeitlichen Verlauf mit Hilfe von Maschinellem Lernen eine Anomalie direkt erkennen.

Segmentierung mithilfe von Machine Learning

Ein weiteres Thema, das für viele Branchen von großer Bedeutung ist und mithilfe von Machine Learning optimiert werden kann, ist die Segmentierung von Daten. Clustering-Algorithmen unterstützen Unternehmen beispielsweise dabei, verschiedene Kundensegmente auszumachen. So können Retail-Unternehmen anhand von Kundeninformationen, Produktinformationen, Informationen über aktuelle Werbeaktionen und vieles mehr verschiedene Kunden-Typen identifizieren und gewinnen dadurch wichtige Einblicke in ihre Zielgruppen-Struktur. Sie erfahren, was die verschiedenen Segmente vereint oder unterscheidet. So sind gezielte Marketingmaßnahmen entsprechend dieser Zielgruppen möglich.

Clustering kann außerdem im Maschinen- und Anlagenbau Verwendung finden. Ich kenne ein Beispiel von einem Maschinenbauer, der tausende unterschiedliche Werkzeuge für CNC-Fräsen herstellt, diese aber nicht ordentlich katalogisiert hatte, z.B. nach Typ. Es gab jedoch viele Informationen wie Materialfestigkeit oder geometrischen Eigenschaften zu diesen Werkzeugen, die bereits in einer Datenbank gespeichert waren. Um herauszufinden, welche Werkzeuggruppen es gibt und was sie unterscheidet, konnte er diese Daten mithilfe von Machine Learning in kurzer Zeit clustern und nicht nur die Stammdatenqualität steigern, sondern auch einen nie dagewesenen Überblick bzw. Einblick gewinnen in Bezug auf sein Portfolio.

Die Annahme, dass man eine sehr hohe Datenqualität braucht, um Machine-Learning-Algorithmen überhaupt erfolgreich einsetzen zu können, stimmt nämlich so nicht ganz. Man kann mit Machine Learning diese Qualität oft auch verbessern.

Fazit

Es gibt etliche Beispiele, wie Maschinelles Lernen Unternehmen helfen kann, Prozesse und Daten zu optimieren. Hinter dem Buzzword steht ein echter Mehrwert! Dank Methoden des überwachten und unüberwachten Lernens können Unternehmensprozesse automatisiert, Einblicke in Prozesse gewonnen und Entscheidungen datengetrieben getroffen werden.

In meinen nächsten Beiträgen werde ich Ihnen noch mehr über Künstliche Intelligenz in der Praxis berichten und weitere Themen wie Predictive Maintenance und Datenqualität im Detail behandeln.

Nutzen Sie bereits Künstliche Intelligenz in Ihrem Unternehmen? Suchen Sie weitere Informationen zu Machine Learning in der Praxis? Dann schauen Sie sich hier gerne mein Webinar zu dem Thema an.

ÜBER UNSERE EXPERT:INNEN

Björn Heinen

Lead Data Scientist

Björn Heinen arbeitet seit 2017 bei INFORM im Bereich Data Science. Als Lead Data Scientist beschäftigt er sich sowohl mit internen Projekten, bei denen bestehende INFORM-Produkte um Machine-Learning-Funktionalitäten erweitert werden, als auch mit externen Projekten, die er von der Ausarbeitung über die Implementierung bis zur Integration begleitet.

Alle Beiträge

Cookie	Beschreibung	Speicherdauer	Domain
cookieConsent	Technisch notwendig für den Basis-Betrieb des Systems.	1 month	.inform-software.com
cookieConsentAccepted	Technisch notwendig für den Basis-Betrieb des Systems.	1 month	.inform-software.com
Neos_Session	Technisch notwendig für den Basis-Betrieb des Systems.	Session	.inform-software.com
msd365mkttrs	Wiedererkennung von CRM-Kontakten bei der Newsletter-Anmeldung	Session	.inform-software.com
WYSIWYG_AB_TESTING	Cookie für die Speicherung von AB-Tests	1 year	.inform-software.com
__cf_bm	Unterstützung von Cloudflare Bot Management	30 minutes	.vimeo.com
LanguageCode	Speichern von Spracheinstellungen	3 month	.inform-software.com

Cookie	Beschreibung	Speicherdauer	Domain
_ga	Registriert eine eindeutige ID für einen Website-Besucher, die protokolliert, wie der Besucher die Website verwendet (Google LLC)	2 years	.inform-software.com
_ga_*	Registriert eine eindeutige ID für einen Website-Besucher, die protokolliert, wie der Besucher die Website verwendet (Google LLC)	2 years	.inform-software.com
UserMatchHistory	Dieses Cookie wird verwendet, um das Verhalten der Besucher auf der Website aufzuzeichnen	1 month	.linkedin.com
AnalyticsSyncHistory	Speichert und verfolgt Besuche über Websites hinweg.	1 month	.linkedin.com

Cookie	Beschreibung	Speicherdauer	Domain
li_gc	Cookie von LinkedIn zum Speichern der Zustimmung der Besucher zur Verwendung von Cookies für nicht wesentliche Zwecke	6 months	.linkedin.com
VISITOR_INFO1_LIVE	Mit diesem Cookie kann Youtube die Bandbreitennutzung überprüfen	6 months	.youtube.com
vuid	Cookie von Vimeo für den Videoplayer	2 years	.vimeo.com

Cookie	Beschreibung	Speicherdauer	Domain
msd365mkttr	Cookie zur langfristigen Verhaltensanalyse. Das Cookie enthält keine personenbezogenen Daten, identifiziert jedoch einen bestimmten Browser auf einem bestimmten Computer eindeutig, und Dynamics 365 Marketing kann ihn verwenden, um diese ID mit einem tatsächlichen Kontakt in der Dynamics 365 Marketing-Datenbank zu korrelieren.	2 years	.inform-software.com
_fbp	Dieser Cookie wird von Facebook zu Werbezwecken und für das Conversion-Tracking verwendet (Meta Inc).	3 months	.inform-software.com
_gcl_au	Dieses Cookie wird von Google Adsense für Versuche mit websiteübergreifender Werbung gesetzt.	3 months	.inform-software.com
bcookie	Cookies von LinkedIn, die von Teilen-Schaltflächen und Werbetags verwendet werden.	1 year	.linkedin.com
bscookie	Cookie von LinkedIn, das von Share-Buttons und Werbe-Tags verwendet wird	1 year	.linkedin.com
li_sugr	Cookies von LinkedIn, die von Teilen-Schaltflächen und Werbetags verwendet werden.	3 month	.linkedin.com
lidc	Cookies von LinkedIn, die von Teilen-Schaltflächen und Werbetags verwendet werden.	1 day	.linkedin.com
YSC	Registriert eine eindeutige ID, um Statistiken darüber zu speichern, welche Videos von YouTube der Nutzer gesehen hat.	Session	.youtube.com