RobotikLab

Katheter, Sonde oder doch ein Zugang?

Im Rahmen der Erstellung eines KI-Systems zur Informationssuche für die Pflege wurde ein spezielles IR (Information Retrieval) Modell entwickelt. Dieses System verbessert die zielgerichtete Suche in unstrukturierten Datenbeständen. Sowohl kurze, Keyword basierte Formulierungen als auch vollständige Fragen sind anwendbar. Mit dem entwickelten Ansatz konnte eine deutliche Verbesserung des Information Retrieval für Deutsch gegenüber bisherigen Ansätzen erreicht werden (um bis zu 14% Punkte).

Information Retrieval als Basis von Textsuche

„Wie reinigt man den gelegten Zugang?“ Nun, eine Person nimmt sich einen Wischlappen, befeuchtet diesen und wischt die Tür von oben bis unten ab, bis der Dreck entfernt ist. Irgendwie passen Frage und Antwort nicht zusammen? Richtig, denn beim Lesen bzw. Interpretieren erscheint die Kombination aus „etwas legen + Zugang“ nicht stimmig, um eine Interpretation mit Zugang/Eingang/Tür zuzulassen. Mit etwas Vorwissen lässt sich schlussfolgern, dass der Kontext im Bereich der medizinischen Versorgung anzusiedeln ist. Konkret wird erfragt, wie der Katheter einer Person gereinigt werden kann, beispielsweise um diesen zu desinfizieren. Aber die Beweggründe sind eigentlich unwichtig, denn was viel mehr interessiert, ist die korrekte Kontextualisierung und korrekte Beantwortung der Nutzereingabe.

Die eingangs formulierte Frage mittels einer gängigen Suchmaschine zu beantworten ist zwar prinzipiell möglich, sollte aufgrund der Auswirkungen auf Menschen (und insbesondere Patienten), jedoch auf einer selbst zusammengestellten Datenbasis mit entsprechendem Domäne-Wissen basieren. Dafür ist ein Information Retrieval (IR) System notwendig. Ein IR-System nutzt die Eingabe der Benutzer zum Abgleich mit Dokumenten in einer Datenbank, um die relevantesten Inhalte zu extrahieren und zu sortieren. Die Suche nach relevanten Inhalten hat sich dabei über Jahre hinweg wenig verbessert und basiert auf lexikalischen Ansätzen wie der statistischen Vorkommenshäufigkeit (z.B. TF-IDF, BM25), der Wortstammrückführung, Entfernung von „irrelevanten Worten“ aber auch simplen (Voll-)Text vergleichen.

Direkte Abgleiche, egal ob bei Schlüsselworten (Keywords), Wortgruppen oder im Volltext, haben ein generelles Problem: Sprache ist nicht eindeutig. Die Suchergebnisse ignorieren inhaltsmäßige Ähnlichkeiten. Verwenden Benutzer nicht „die richtigen Worte“, sondern Synonyme oder thematisch ähnliche Begriffe, kann es schnell zu falschen Ergebnissen kommen. Beispielsweise könnten die Domäne-Inhalte einer Pflege-Einrichtung ausschließlich fachsprachlich vorliegen, was bedeutet, dass in den Texten von „Sonde“, „Katheter“, etc. die Rede ist und der Begriff „Zugang“ gar nicht vorkommt. In diesem Fall kann keine der klassischen Suchmethoden zielgerichtet relevante Inhalte auffinden. Die möglichst große Übereinstimmung von Eingabeworten und verwendeten Begriffen in den Dokumenten der Datenbank ist zwingende Voraussetzung, egal welche lexikalische oder syntaktische Methode Anwendung findet.

Verbesserung mit KI-Methoden

Mit Aufkommen der aktuellen KI-Welle entwickelten sich in den letzten Jahren vielversprechende Ansätze, um dieses Problematik unter Nutzung von Machine Learning, respektive Deep Learning, zu minimieren. Die Einführung von „Transformer“, zu nennen sind hierbei vor allem BERT, XLM, und T5, ermöglichen es, Zusammenhänge von Worten (Ähnlichkeit, Analogie, Thematik) durch neuronale Sprachmodelle darzustellen. Ein solches Modell kann anschließend anhand von Trainingsdaten hinsichtlich eines Lernziels optimiert werden.

In dem hier vorgestellten Fall gilt es, das Sprachmodell für die asymmetrische Suche zwischen einer Frage und beliebig vielen Textpassagen zu verfeinern (fine tuning). Die Suche ist asymmetrisch, weil eine relativ kurze Frage mit einer i.d.R. deutlich längeren Passage bzw. einem Textabsatz auf semantische Nähe untersucht wird. Im Training erlernt das Modell dabei anhand von Daten-Samples, bestehend aus Frage, der richtigen Antwort, einer falschen Antwort sowie einer Bewertung (score), zu priorisieren, welche Zusammenhänge zwischen Frage und Antwort besonders relevant (attentions) sind.

Symmetrische Suche vs. Asymmetrische Suche

Sollen relevante Inhalte bei der symmetrischen Variante gefunden werden, so müssen Eingabesatz und die Sätze der Datenbank ungefähr gleich lang sein. Bestenfalls sind die Sätze sogar gleich aufgebaut, d.h. es wird die Eingabefrage mit ähnlichen Fragen abgeglichen. In einem FAQ-System kann dies hilfreich sein, da FAQs häufig je Textabschnitt mit einer Frage beginnen.

Beispiel: „Wie reinigt man den gelegten Zugang?“ ↔ „Was mache ich bei der Reinigung des Katheters?“

Gilt es relevante Inhalte mit der asymmetrischen Form zu finden, so sollten Eingabesatz und Datenbank-Sätze unterschiedlich lang, wobei dabei normalerweise letztere länger sind. Solche Suchsysteme kommen am häufigsten vor und auch das hier vorgestellte entspricht diesem Ansatz.

Beispiel: „Wie reinigt man den gelegten Zugang?“ ↔ „Der hygienische Umgang mit einem Katheter ist enorm wichtig, um das Infektionsrisiko zu minimieren. Gehen Sie dabei wie folgt vor: (...)“

Training des Modells und Bewertung der Ergebnisse

Die Durchführung des Trainings erfolgt unter Nutzung von Sentence Transformer mit der Margin-MSE-Loss-Methode. Auf Details des Trainings (Parameter, Dauer, Skripte) soll an dieser Stelle nicht eingegangen werden. Alles wissenswerte über den Datensatz und den Trainingsprozess wird ein einem separaten Artikel vorgestellt bzw. können diese Informationen schon jetzt auf Englisch über Huggingface Transformers, der wichtigsten Plattform zur Veröffentlichung von Transformer Modellen, eingesehen werden. Außerdem lässt sich das trainierte Modell von dort herunterladen (https://huggingface.co/PM-AI/bi-encoder_msmarco_bert-base_german).

Gleich nach dem Training ist eine Evaluierung des neu entstandenen Modells nötig. Nach einer Recherche hat sich zunächst der Vergleich zwischen drei Ansätzen angeboten, welcher in Tabelle 1 dargestellt ist.

	Recall@1	Recall@10	Recall@100
Unser Modell	0.5300	0.7196	0.7360
svalabs/bi-electra-ms-marco-german-uncased	0.3818	0.5663	0.5986
BM25	0.3196	0.5377	0.5740

Tabelle 1: Ergebnis der Evaluierung. Auf einer Skala von 0.0 bis 1.0 werden die Ansätze nach der Metrik „Recall“ bewertet. Hierbei ist 1.0 der beste Wert.

Im Vergleich schneidet BM25, ein lexikalischer Ansatz, der in der Praxis noch häufig Verwendung findet, am schlechtesten ab. Im Evaluierungs-Datensatz befinden sich schlichtweg zu viele Frage-Antwort-Paare, die nur bei Verständnis von Synonymen und thematischer Ähnlichkeit korrekt miteinander in Verbindung gesetzt werden können. Das Modell von svalabs erlaubt dagegen den direkten Vergleich zwischen zwei sehr ähnlichen Ansätzen, da sowohl svalabs als auch das Modell von senseaition und der TH Wildau Transformer basiert sind. Im Ergebnis schneidet das neue Modell mit einer hervorragenden Performance-Steigerung um 14 Prozentpunkte ab.

Um die Qualität des hier vorgestellten Ansatzes zu untermauern, findet ein weiterer Vergleich mit einem aktuellen State-Of-The-Art Modell statt: Das Entwickler-Team von deepset.ai hat, nach der DPR-Methode, einen Zwei-Stufen-Transformer für Deutsch entwickelt, bei dem Fragen und Texte/Passagen separat behandelt werden. Die erweiterten Ergebnisse sind in Tabelle 2 abgebildet.

	Recall@1	Recall@10	Recall@100
Unser Modell	0.5300	0.7196	0.7360
https://huggingface.co/deepset/gbert-base-germandpr-question _encoder & deepset/gbert-base-germandpr-ctx _encoder	0.4828	0.6970	0.7147
svalabs/bi-electra-ms-marco-german-uncased	0.3818	0.5663	0.5986
BM25	0.3196	0.5377	0.5740

Tabelle 2: Ergebnis der erweiterten Evaluierung. Auf einer Skala von 0.0 bis 1.0 werden die Ansätze nach der Metrik „Recall“ bewertet. Hierbei ist 1.0 der beste Wert.

Auch wenn die Performance-Steigerung mit ca. 2 Prozentpunkten kleiner ausfällt, ist das Ergebnis dennoch beeindruckend. Denn beim Ansatz von deepset werden zwei Modelle gebraucht, was Arbeitsspeicher und CPU-Leistung doppelt beansprucht und somit höhere Kosten verursacht. Im Produktiveinsatz kann dies entscheidend sein.

Die Ergebniswerte dürfen jedoch nicht als absolute Werte betrachtet werden! Je nach Testdaten und Domäne können die Werte variieren. Dennoch ist die Evaluierung im Vergleich der Ansätze untereinander valide. Übrigens, Experimente haben die Sinnhaftigkeit einer Kombination von BM25 mit Transformer-Modellen bewiesen. Entsprechende Erkenntnisse, KI getriebene Dienste und das technische Know-How bietet Ihnen die sense.AI.tion GmbH über eine eigens entwickelte Cloud-Produktpalette.

Dieses Projekt ist eine Kollaboration zwischen der Technischen Hochschule Wildau und sense.ai.tion GmbH. Sie können uns wie folgt kontaktieren:

Philipp Müller (M.Eng.); Autor
Prof. Dr. Janett Mohnke; TH Wildau
Dr. Matthias Boldt, Jörg Oehmichen; sense.AI.tion GmbH

This work was funded by the European Regional Development Fund (EFRE) and the State of Brandenburg. Project/Vorhaben: "ProFIT: Natürlichsprachliche Dialogassistenten in der Pflege".

ROS-E Dokumentation

Dokumentation zu ROS-E

Robotergefährtin ROS-E gewinnt Hauptpreis beim innofab_ Ideenwettbewerb

Am 14. Juni 2022 fand die finale Runde des innofab_Ideenwettbewerbs 2022 statt. Auch zwei Teams aus Wildau konnten am Dienstag in Cottbus ihre Ideen verteidigen - mit großem Erfolg. Die Telematiker:innen Lara Ziemert und Oskar Lorenz überzeugten mit ihrer Präsentation zum Projekt "ROS-E – Die zwischenmenschliche Roboter-Gefährtin”. Zusammen mit Valentin Schröter und Tobias Kannenberg arbeiten sie im RobotikLab Telematik. Das 4-köpfige Team gewann am Dienstag nicht nur den 1. Preis des Wettbewerbs, sondern zusammen mit einem weiteren Team auch den Publikumspreis.

Impressionen zur Veranstaltung sowie weitere Informationen zum Wettbewerb, den Preisträger:innen und den Projekten unter https://innohub13.de/innofab-gewinnerinnen-2022/.

ROS-E wurde entwickelt im Rahmen des Projektes Natürlichsprachliche Dialogassistenten in der Pflege.

Das PROFIT-Projekt “Natürlichsprachliche Dialogassistenten in der Pflege” wird gefördert aus Mitteln des Europäischen Fonds für regionale Entwicklung (EFRE).

Weiterlesen über Robotergefährtin ROS-E gewinnt Hauptpreis beim innofab_ Ideenwettbewerb
Anmelden, um Kommentare verfassen zu können

Die Stadtbücherei Frankfurt am Main hat am 3.11.2021 den 1. Platz des Deutschen Lesepreises in der Kategorie „Herausragende Leseförderung mit digitalen Medien“ verliehen bekommen.

Vorstellung des Projekts.
Alle Preisträger im Kurzportrait.

Lesepreis für Projekt "Roboter hört mit!"

Kindern im Grundschulalter zu helfen, mit Hilfe eines humanoiden Roboters ihre Lesekompetenz zu stärken, ist die Idee des Wildauer Lese-NAO-Projektes. Mit dieser attraktiven Idee hat 2017 die Stadtbibliothek Wildau den Innovationspreis für Bibliotheken der Berlin-Brandenburgischen Stiftung für Bibliothek-Forschung e.V. gewonnen. Das RoboticLab Telematik war Partner der Stadtbibliothek Wildau, u.a. verantwortlich für die technische Umsetzung des Projektes und entwickelt es seitdem kontinuierlich weiter.

Dass diese Idee nicht nur Brandenburger und Berliner Kindern gut gefällt, zeigte sich am 19. April 2021 in der Stadtbücherei Frankfurt am Main: Der dortige NAO-Roboter Ada hatte an dem Tag den ersten Einsatz als Lese-Roboter (Pressemitteilung). Die Veranstaltung war ausgebucht. Eine Reise durch die öffentlichen Bibliotheken der Stadt ist geplant. Wir im RoboticLab Telematik freuen uns sehr über die lebhafte und spannende Kooperation mit dem Team der Frankfurter Stadtbücherei. Das Projekt wird durch Oskar Lorenz, studentischer Mitarbeiter im RoboticLab Telematik und Bachelorstudent am Studiengang Telematik, inhaltlich und organisatorisch betreut. Die technische Umsetzung der ersten Version erfolgte durch Amanda Klingner (Masterstudentin) und Tina Lüthe (Absolventin des Masterstudiengangs Telematik).

Bericht in der Hessenschau vom 20.04.2021

Roboter hört mit! © Stadtbücherei Frankfurt

„Roboter hört mit! – LautLesen 4.0“ gewinnt den 1. Platz des Deutschen Lesepreises 2021 © Stadt Frankfurt am Main, Foto: Benjamin Esche / Maxim Sotnikov

Robots in Residence

Seit dem Sommer 2020 reisen zwei NAO-Roboter, GAIA und NaoMI, auf unterschiedlichen Wegen durch Europa - in jedem Monat besuchen sie eine andere Stadt. Dort werden sie von Coder*innen und Künstler*innen betreut und weiter programmiert, je nach lokalen Fragestellungen und Rahmenbedingungen.

Dieses spannende Projekt des Goethe-Institus in München ist Teil des Projektes “Generation A = Algorithmus - Nachdenken über Künstliche Intelligenz”, welches die Diskussion über Künstliche Intelligenz in breitere Gesellschaftsschichten tragen möchte.

Im Teilprojekt “Robots in Residence” stehen humanoide Roboter im Rampenlicht. Im Fokus steht das Verhältnis zwischen Mensch und Maschine in unterschiedlichen kulturellen Kontexten. Auf jeder Station lernen GAIA und NaoMI etwas Neues. Auf der Projektseite des Münchner Goethe-Instituts wird ausführlich darüber berichtet.

Für die Vorbereitung der NAO-Roboter für und die technische Unterstützung auf ihren Reisen ist das RoboticLab Telematik der TH Wildau verantwortlich. Auf dem für Herbst 2021 geplanten Abschlussfestival von “Generation A = Algorithmus” in Dresden sollen die beiden Roboter-Damen dann ihre erlernten Fähigkeiten präsentieren. Beide Teams in München und in Wildau sind schon sehr gespannt!

Abschlussfestival im Hygienemuseum in Dresden

Die Präsentation ausgewählter Projekte fand im Rahmen des Abschlussfestivals von „Generation A=Algorithmus“ im Deutschen Hygiene-Museum statt. Auf zwei großen Postern mit Projektinformationen von den Reisestationen konnten die Touren nachverfolgt werden. An zwei Stationen für Vorführung bzw. Interaktion konnten Besucher*innen die Ergebnisse hautnah erleben. Die Europareise war aufgeteilt in eine Ost- und ein Westtour. Drei NAO-Roboter waren vor Ort im Einsatz.

Die Projektergebnisse im Überblick

Robots in Residence - Projektpräsentation im Hygienemuseum Dresden

Neues vom Lese-NAO

Die Stadtbücherei Frankfurt am Main, Kooperationspartner des RoboticLab für das Projekt "Roboter hört mit!", hat den 1. Preis des Deutschen Lesepreises in der Kategorie „Herausragende Leseförderung mit digitalen Medien“ erhalten.
Vorstellung des Projekts. | Alle Preisträger im Kurzportrait.

Mehr zum Projekt "Roboter hört mit!".

Weiterlesen über Neues vom Lese-NAO
Anmelden, um Kommentare verfassen zu können

Das PROFIT-Projekt wird gefördert aus Mitteln des Europäischen Fonds für regionale Entwicklung (EFRE).

Projektlaufzeit: 01.07.2020 – 31.12.2022

Kooperationspartner:
sense.AI.tion
TH Wildau

Natürlichsprachliche Dialogassistenten in der Pflege

Das Projekt "Natürlichsprachliche Dialogassistenten in der Pflege"

Die Partner des Verbundprojektes haben es sich zum Ziel gesetzt, die Grundlagen für ein umfassendes maschinelles Verstehen von menschlicher Kommunikation in der Pflege zu schaffen. Dadurch werden Interaktionen mit natürlicher Sprache zwischen computergestützten Systemen und Menschen möglich. Für den privaten Bereich soll damit ein längeres und selbstbestimmtes Leben in den eigenen vier Wänden von Pflegebedürftigen unterstützt werden.

In Pflegeeinrichtungen und Krankenhäusern sollen in erster Linie Pflegekräfte von Routine- und Dokumentationstätigkeiten entlastet werden. Mit den Ergebnissen werden direkt erste Anwendungsfelder für sprachbediente Hilfsmittel in der Pflege praktisch erschlossen.

Motivation

Unsere alternde Gesellschaft mit ihren demografischen Problemen erzeugt neue, aktuelle und zukünftige Herausforderungen, die gegenwärtig umfassend diskutiert werden. Dennoch gibt es bis heute keine zufriedenstellenden Lösungen, mit denen es möglich ist, der Situation angemessen zu begegnen. Zukünftig wird es für uns notwendig, das Thema der Versorgung Pflegebedürftiger zu optimieren, alternative Hilfen und Werkzeuge zu entwickeln und in der Pflege einzusetzen. Nur so lässt sich langfristig und nachhaltig dem Ressourcenmangel und dem drastisch wachsenden Pflegebedarf entgegenwirken. Technische Innovationen aus dem Bereich Informations- und Kommunikationstechnik können hier einen wertvollen Beitrag leisten.

Eine zentrale Aufgabe für einen erfolgreichen Einsatz von Innovationen für die geplante Zielgruppe älterer Menschen wird die Entwicklung stabiler Systeme für eine Interaktion mit natürlicher Sprache sein. Dass die Systeme umgangssprachlich formulierte Aussagen erkennen, sowie korrekte und zufriedenstellende Antworten auf Fragen oder Anliegen zur Verfügung stellen, ist eine notwendige Voraussetzung für ihre Akzeptanz und einen dauerhaften Einsatz. Auf der einen Seite ist diese Umstellung zu sprachbedienten Nutzerschnittstellen ein allgemeiner Trend in der Automatisierung, auf der anderen Seite kommt diese Entwicklung den nicht vorrangig mit Informationstechnik beschäftigten Menschen sehr entgegen und steigert Akzeptanz und Nutzen
von technischen Hilfsmitteln. Zusätzlich besitzen sprachbediente Geräte/Systeme den entscheidenden Vorteil, dass sie durch Patienten vom Bett aus und von Pflegekräften „nebenläufig“ gesteuert werden können (die Arme und Augen sind für andere Arbeiten frei).

Menschen nutzen für die Kommunikation untereinander verschiedene Ebenen und Kanäle. Neben dem rein verbalen, werden entscheidende Inhalte und Informationen auch im paraverbalen und nonverbalen Bereich übertragen. Bei der Auswertung von Gesprächen zeigt sich schnell: Dem paraverbalen Kommunikationsanteil kommt in vielen Situationen, insbesondere
in vertrauten Umgebungen, eine hohe Bedeutung zu. Nur gemeinsam mit diesem Kommunikationsanteil können die im verbalen Kanal enthaltenen Nachrichten korrekt gedeutet werden. Eine Analyse von enthaltenen Emotionen, Motivationen und psychologischen Eigenschaften kann weitere Einsichten in die Gespräche, deren Inhalte und Hintergründe bringen. Als Grundlage für diese Analyseziele dient die „TwentyFive“-Methode, welche von der sense.AI.tion GmbH branchenführend angewandt wird.

Stand der Forschung und aktuelle Ergebnisse

1) Modelle

Gegenwärtige im Markt existierende Systeme nutzen zur Spracherkennung und -analyse ausschließlich „eins zu eins“ schriftliche Kommunikationsanteile. Diese Einschränkung führt in so gut wie allen Anwendungsfällen dazu, dass wesentliche situations- und kontextabhängig Inhalte gar nicht beachtet werden. So entstehen Missverständnisse und/oder zusätzlicher Kommunikationsaufwand ist notwendig, um die notwendige Information zu transportieren.

Beispielsweise besitzt das Wort „Bank“ mehrere Verwendungen: als Kreditbank (Geldinstitut), Parkbank (Sitzgelegenheit), Schotterbank (Flussbett) oder auch als „eine sichere Bank sein“ (Redensart). Für Menschen ist die Zuordnung in der Regel eindeutig. Bringt jemand sein Geld zur Bank, ist das Geldinstitut gemeint und möchte sich jemand auf einer Bank ausruhen, so handelt es sich um eine Sitzgelegenheit. Gängige Systeme zur Sprachanalyse unterscheiden hierbei aber nicht und ordnen Begriffen feste Kategorien zu. Im Ergebnis entstehen viele Fehleinschätzungen. Optimal wärem außerdem Systeme, die zusätzlich Emotionen, Stimmungen und Motivationen erfassen, um darauf in einer passenden Weise reagieren zu können. Sätze wie „Mach doch was du willst!“ meinen häufig das Gegenteil des Gesagten. Situationsbedingte Komplikationen können auf diese Art und Weise besser erkannt und einer Lösung zugeführt werden. Reinen Sprachassistenten fehlen genau diese Fähigkeiten. Sie können kaum eine soziale Komponente für den Menschen einnehmen.

Zur Lösung dieses Problems wird aktuell im Projekt auf KI-Methoden des Natural Language Processings (NLP) zurückgegriffen. Dabei werden kontextsenitive Sprachmodelle trainiert, welche die Zusammensetzung der Sprache in mathematischen Vektorräumen abbilden. Die Technik basiert dabei auf sogenannte Transformer, wobei hierbei insbesondere BERT-Modelle trainiert und eingesetzt werden. Diese gestatten die bereits erwähnte Beachtung des Kontextes bei der Analyse von Gesprächen. Für sprachbediente Lösungen, die im deutschsprachigen Raum genutzt werden sollen, muss der Fokus logischerweise auf die umfassende Untersuchung der deutschen Sprache gelegt werden. Notwendige Trainingsdaten fehlen für deutschsprachige Systeme und die unterschiedlichen Anwendungsfälle, weshalb momentan ein Hybridansatz im Fokus steht. Konkret bedeutet dies: Wann immer möglich, werden die Modelle direkt für die deutsche Sprache trainiert und angewendet. Wenn dies, aufgrund der fehlenden Trainingsdaten, nicht möglich ist, wird zunächst eine Übersetzung ins Englische angestrebt, denn in der englischsprachigen NLP-Community stehen deutlich mehr Modelle zum Experimentieren zur Verfügung. Im Zuge der produktiven Verwendung dieses Hybridansatzes werden durch die User immer mehr Daten auf Deutsch zur Verfügung stehen, so dass auf mittelfristige Sicht die Übersetzung wegfallen kann.

Hinweis: Zur besseren Einschätzung der bisher geschaffenen deutschsprachigen Modelle wurde eine entsprechende Recherche durchgeführt. Diese mündete in einer Übersicht, welche unter folgendem Link betrachtet werden kann: https://github.com/icampuswildau/german-transformersoverview Prinzipiell konnten bisher 97 GB an textuellen Daten beschafft und vorverarbeitet werden. In verschiedenen Konfigurationen entstanden dabei 7 verschiedene BERT-Modelle (Nach dem Pretraining-Verfahren). Auch wenn die Menge an Daten viel erscheint, können diese jedoch i.d.R. nicht eins zu eins für die verschiedenen Anwendungsfälle verwendet werden und bedürfen größtenteils weiteren Unterteilungen und Vorklassifizierungen. Für den weiteren Verlauf des Projektes können sie jedoch als wichtiger Rohstoff betrachtet werden.

2) Anwendungsfälle

Mit den Prozessen zur Verarbeitung und Analyse von Sprache entsteht das Fundament für die eigentlichen Anwendungen sprachbedienter Hilfsmittel. Dabei stehen Pflegekräfte und Pflegebedürftige gleichermaßen im Zentrum des Konzeptes. Pflegekräfte werden seit vielen Jahren immer stärker belastet. Eine wachsende Anzahl zusätzlicher Aufgaben und Prozesse hält sie von ihrer eigentlichen, fachlichen Arbeit ab. Das reduziert die Zeit, die sie für die „Arbeit am Menschen“ aufbringen können. Zeitgleich betreuen Pflegekräfte mehrere Pflegebedürftige simultan und können auch sonst nicht ununterbrochen bei den betreuten Personen sein – es entstehen häufige und teils lange Zeiträume zwischen dem direkten menschlichen Kontakt.

Im ersten Schritt wurde eine automatische Protokollierung von Abläufen in der Leistungserbrinungen der Pflegekräfte (Tätigkeitsprotokollierung) durch die Implemetierung eines Checklistensystems geschaffen. Ein mehrstufiger KI-Workflow, als Kombination aus Deep-Learning Sprachmodellen (NLP mittels Transformern) und einem Machine-Learning-Classifier (mittels k-Nearest-Neighbor) realisiert dies.

Mit dieser automatischen Protokollierung von Abläufen in der Leistungserbringung soll ein erster Schritt zur Entlastung gegeben sein. Mittels einer Liste der Arbeitsabläufe und Leistungen, die zusätzlich kurze inhaltliche Beschreibungen enthalten, wir eine entsprechende Zuordnung erzeugt. Das Teilsystem wird gegen Ende 2021 von einem Fachkreis in Beelitz-Heilstätten erstmalig getestet.

Zum Projekt:

ROS-E: Die Geschichte eines kleinen Roboters, der Menschen unterstützt.