Veröffentlicht: November 2019

Objekterkennung, Texterkennung und intelligente RPA-Bots – zahlreiche Machine-Learning(ML)-Services werden von Amazon, Google & Co. angeboten. Rund 37 % der Unternehmen weltweit nutzen künstliche Intelligenz zur Unterstützung und Erweiterung innovativer digitaler Lösungen – dreimal mehr als im Vorjahr. Gleichzeitig bewertet kaum ein Experte Deutschland im Bereich KI als relevanten Akteur. In einer aktuellen VDE-Studie werden die USA und China mit jeweils mehr als 30 % als Vorreiter genannt – Deutschland 1 %. Um Kundenanforderungen künftig State-of-the-Art zu begegnen und mit der Technologieentwicklung Schritt zu halten, müssen Firmen am Puls der Zeit bleiben. Und es gibt viele Bereiche in denen Machine Learning produktiv eingesetzt werden kann.

Im Folgenden finden Sie fünf ML-Lösungen aus Finance, Handel, Einkauf und Logistik, die unser Team in den letzten Monaten entwickelt hat.

1. Mobile Shopping-App: Erkennen von Produkten in Prospekten

Die Nutzer der Shopping-App können per Kamera einzelne Produkte in den Prospekten des Handelsunternehmens identifizieren. Dazu wird die Produktnummer über eine Texterkennung gelesen und dann weiterverarbeitet. Diese Funktion unterstützt den Kaufvorgang der Kunden auf sehr effiziente Art und Weise. Statt Produktnummern mühsam einzugeben, um das gewünschte Produkt zu selektieren, können Kunden den Kaufvorgang einfach, bequem und intuitiv mobil abschließen.

Eines unserer Entwicklungsteams ist für die Entwicklung der Shopping-App zuständig. Im Rahmen eines Sprints hat es diese Funktion mit Googles ML-Kit realisiert. Das Google ML-Kit, ein mobiles SDK, ermöglicht die Verwendung von Machine Learning für Android- und iOS-Apps. Das SDK enthält eine Reihe von Funktionalitäten für mobile Anwendungsfälle wie etwa Texterkennung, Gesichtserkennung, Scannen von Barcodes, Beschriftung von Bildern und Identifizierung der Sprache von Texten. Einige dieser Funktionalitäten können sowohl auf dem Device als auch in der Cloud ausgeführt werden. On-Device können lokal gespeichert Daten schneller verarbeitet werden und funktionieren auch offline, allerdings ist die Komplexität der Verarbeitungslogik durch die auf dem Device verfügbaren Ressourcen limitiert. Die Ausführung der Funktionalitäten in der Google-Cloud-Plattform nutzen idealerweise elastische Ressourcen, die keiner Limitierung unterliegen und können somit, aufgrund der höheren Leistung, ein höheres Maß an Genauigkeit bieten.

Der von uns genutzte Machine-Learning-Service für die Texterkennung kann „as is“ ohne Modelltraining etc. eingesetzt werden und funktioniert sehr robust.

Für das Google-ML-Kit zahlen Unternehmen je nach Nutzung. Ein Beispiel: 100.000 Aufrufe/Monat kosten aktuell rund 150 $.

2. Smarte Upload-Filter von Amazon-Web-Services (AWS)

Bei diesem Beispiel geht es um ein Branchenportal (Finanzindustrie) mit einem Upload-Filter als Schutz vor ungewolltem Content. Der Upload-Filter prüft das von den Benutzern hochgeladene Bildmaterial auf Unangemessenheit, d. h. Bildmaterial, welches explizite Nacktheit oder anzügliche Darstellungen enthält. Bei Verstößen gegen die Nutzungsbedingungen wird solches Bildmaterial zurückgewiesen.

Für die technische Realisierung dieses Projekts hat unser Entwicklungsteam den Amazon-AWS-Service-Rekognition verwendet.

Rekognition ist ein Dienst, über den ein mit Deep Learning ausgestatteter Bilderkennungsservice zugänglich ist. Dieser erkennt unter anderem unangemessene Bildinhalte. Hierfür kann über das API zu einem Bild ein Moderationskennzeichen eingeholt werden. Diese Moderationskennzeichen enthalten Hinweise zu expliziten oder anstößigen Inhalten. Auf dieser Grundlage kann dann entschieden werden, ob der Content akzeptiert oder zurückgewiesen wird.

Da Amazon Rekognition für die Kennzeichnung von Kategorien mit expliziten und anzüglichen Inhalten eine hierarchische Taxonomie verwendet, können wir den realisierten Upload-Filter recht granular konfigurieren. So könnten wir beispielsweise explizite Nacktheit ablehnen jedoch Fotos mit Personen in Badebekleidung zulassen. Im Falle unseres Kundenprojektes wird jedoch jeder anstößige Inhalt abgewiesen.

Amazon bietet diesen Dienst „as is“ an. Amazon-Rekognition verfolgt dabei ein Pay-per-Use-Prinzip. Derzeit zahlen Nutzer rund 1,20 $ pro 1.000 geprüften Bildern.

3. Automatisierte Auszeichnung von Immobilienfotos mit Machine Learning

Bei dieser Anwendung handelt es sich um ein Immobilienportal. Vom Verkäufer hochgeladene Bilder der Immobilie werden mit Machine Learning automatisch analysiert und ausgezeichnet. Ein Beispiel: Das Bild einer Küche, wird als Szene erkannt und entsprechend textuell gekennzeichnet. Die Funktion bietet dem Kunden des Immobilienportals zusätzliche Convenience durch die vollständige Kennzeichnung und Beschreibung ihrer Objekte.

Bei diesem Projekt setzen wir für die technische Realisierung ebenfalls auf Amazon-Rekognition-Image. Hier kommt die Erkennung von Objekten und Szenen zum Einsatz.

Rekognition-Image erkennt zahlreiche Objekte wie etwa Möbel oder Fahrzeuge. Darüber hinaus erkennt der Dienst auch Szenen innerhalb eines Bildes, zum Beispiel einen Garten oder eine Terrasse. Auf diese Weise haben wir auch eine Funktion realisiert, die dem Nutzer des Immobilienportals automatisiert Empfehlungen für die Objektbeschreibung liefert. Dies ist insbesondere dann interessant, wenn ein Ausstattungsmerkmal in Fotos erkannt wird, welches der Verkäufer noch nicht in seiner textuellen Beschreibung aufgeführt hat.

Auch hier gilt das nutzungsabhängige Preismodell von Amazon-Rekognition (derzeit 1,2 $ je 1.000 geprüfte Bilder).

4. Mobile App für die automatische Objekterkennung

In diesem aktuellen Projekt geht es um die mobile Erkennung von Objekten im 3D-Raum. Die Nutzer können über die Kamerafunktion ihres Smartphones ein Objekt eindeutig identifizieren und erkennen. Die Nutzer der Anwendung sind in diesem Beispiel Servicetechniker. Der ML-Service hat die Aufgabe sehr ähnliche Objekte aus derselben Domäne, wie etwa dem Sanitärbereich, zu erkennen.

Der Nutzen dieser Anwendung ist erheblich. Die Servicetechniker und das zugehörige Backoffice sparen signifikante Aufwände für die manuelle Recherche von Produktnummern, Verfügbarkeiten und Ersatzteilen ein. Unser Kunde ermittelte eine durchschnittliche Zeitersparnis je Anwendungsfall von etwa 24 Minuten. Bei täglich etwa 420 Servicefällen ergibt sich so eine Aufwandssenkung von insgesamt 168 Arbeitsstunden pro Tag.

Bei diesem Projekt setzen wir für die technische Realisierung auf unser Produkt Almato-Object-Rekognition (AOR). AOR setzt für das Training, die Validierung und die Optimierung des Machine-Learning-Modells Amazon-SageMaker ein. Die Objekt-Erkennung erfolgt mit einem Single-Shot-Detector-Verfahren. Mit dem Apache-Deep-Learning-Framework MXNET wird ein Convolutional Neural Network trainiert wobei wir alternativ auch TensorFlow unterstützen.

Für die Generierung der notwendigen Trainingsdaten („Annotated Data“) wird bei der AOR ein proprietäres Verfahren auf Basis von 3D-Modellen verwendet. Für ultrarealistisches Rendering kommt hierbei unter anderem eine dedizierte Hochleistungsinfrastruktur zum Einsatz. Abhängig von der Spezifität des Objektraums der zur erkennenden Objekte erfordert das Training des ML-Modells mehrere 100.000 fotorealistische Bilder je Objekt.

Wir arbeiten derzeit an einem vollautomatisierten Service, der es unseren Kunden ermöglichen soll, die notwendige Modellgenerierung im Selfservice zu erledigen.

Das Preismodell für AOR ist nutzungsabhängig. Preise richten sich nach dem Aufwand für die Modellgenerierung. Dieser kann je nach adressiertem Objektraum sehr stark variieren. Deshalb kalkulieren wir die Anwendungsfälle derzeit noch individuell.

5. Intelligente RPA-Bots zur Analyse von Dokumenten

Bei diesem Beispiel handelt es sich um eine Anwendung zur Unterstützung von Softwarerobotern für die Abarbeitung von Serviceprozessen (Robotic Process Automation – RPA). Die Softwareroboter können über einen ML-Service eingehende Dokumente analysieren und so z. B. Tickets kategorisieren und priorisieren. Je nach Ergebnis erfolgt dann die Weiterverarbeitung der extrahierten Daten.

Der Nutzen für unseren Kunden aus der Logistikbranche basiert auf der Vollautomatisierung und Digitalisierung seines bestehenden Serviceprozesses. Die Prozesskosten betragen mit der Lösung lediglich einen Bruchteil der Kosten für die manuelle Abarbeitung.

Für die technische Realisierung der Lösung kommt die RPA-Plattform von Automation Anywhere (AA) zum Einsatz. Der beschriebene ML-Service wird über eine Erweiterung mit dem AA-Produkt IQ-Bot realisiert.

Fazit: Machine Learning funktioniert und lohnt sich

Die genannten 5 Beispiele aus dem B2C-Kundenservice zeigen: Machine Learning ist eine gut geeignete Technik für die Realisierung innovativer Funktionen mit teils erheblichem Kundennutzen. Wie kann man das Potenzial von Machine Learning für bestehende Anwendungen wie etwa Kundenservice-Apps oder Webportale identifizieren? Wir haben gute Erfahrungen gemacht mit kompakten Kreativ-Workshops, bei denen unsere ML-Experten und UX-Designer mit den Product-Owners zusammenarbeiten. Ist der richtige Geschäftsprozess für das KI-Projekt gefunden ermöglicht Machine Learning signifikante Senkungen im Aufwand, gesteigerte Convenience und Kundenzufriedenheit sowie eine erhöhte Prozesseffizienz.

Dieser Beitrag wurde auch auf LinkedIn veröffentlicht.

Jetzt weiterlesen__

CTA hellblau

Just add digital to your mailbox__

Erhalten Sie alle Neuigkeiten rund um Almato, Projekte und Neues zum Thema Digital Enterprise im Almato-Newsletter.

Telefon

Sie wollen Beratung zu digitalen Lösungen und Services?
Wir stehen Ihnen gerne zur Verfügung!

+49 711 62030-400
Newsletter