Slider Image

Technology

Wir bieten kein Standard-Produkt „out-of-the-box“ an, sondern erarbeiten für jeden Kunden eine maßgeschneiderte Lösung im Kontext eines Projekts, also eine iterative Zusammenarbeit.

Der Gesamt-Prozess lässt sich durch die Integration von SCENTS-Standard-Diensten, Customer Services und speziell für den Use-Case entwickelten Diensten auf die jeweiligen spezifischen Bedürfnisse anpassen und kann so das optimale Portfolio an benötigten Funktionalitäten anbieten.

Diese Integrierbarkeit folgt dem best-of-breed-Ansatz.

Sämtliche Dokumente und Daten werden initial zusammen mit Meta-Daten und Kontext-Informationen auf Basis von AES Standards serverseitig verschlüsselt und bei Bedarf wieder entschlüsselt. Der AES Algorithmus für die symmetrische Blockverschlüsselung stellt die vollumfängliche Integrität der Daten sicher, die Schlüssel werden im Key Vault verwaltet.
Dateien und Dokumente bestehen aus Text und Layout-Informationen. Dieser Dienst extrahiert aus den unterschiedlichen Formaten den Content (Plain Text) zusammen mit den dazugehörigen Metadaten. Zusätzlich werden weitere Informationen wie zB Autor, Thema, Kategorie, Seitenzahl usw. ermittelt. Mögliche Formate sind hier beispielsweise PDF/A, DOCX, PPTX, XLSX, ASC, HTML, OpenDocument und Postscript.
Dokumente in Papierform beinhalten Texte und ggf. auch Meta-Informationen. Diese Dokumente werden gescannt und in ein Bildformat transformiert. Der OCR Extractor Service extrahiert aus den vorliegenden Bildern den Content (Plain Text) und ermittelt zusätzliche Informationen wie beispielsweise Formatierungen und Seitenzahl. Die Texte können in einer beliebigen Sprache vorliegen. Mögliche Formate sind hier u. a. Barcode, BMP, GIF, PNG, JPG, JPEG, TIF, TIFF und DIB.
Daten und Meta-Informationen können in unterschiedlichen relationalen Datenbanksystemen oder auch NoSql-Datenbanken vorliegen. Diese Werte und Informationen werden über einen Konnektor einmalig oder auch permanent (scheduled) in den Workflow integriert. Standardmäßig werden MS SQL Server, Oracle, DB2, MySQL, Postgres, CouchDB, MongoDB, CosmosDB und HBase unterstützt, weitere DBMSs können angebunden werden.
Daten und Meta-Informationen können in CSV, XML- oder JSON-Formaten vorliegen. Diese Werte und Informationen werden über einen Konnektor einmalig oder auch permanent (scheduled) in den Workflow integriert. Eine Schemaprüfung und eine Transformation in ein anderes Format (zB PDF) ist möglich.
E-Mails, Anhänge und Meta-Informationen können aus unterschiedlichen Mail-Systemen über einen Konnektor einmalig oder auch permanent (scheduled) in den Workflow integriert werden.
Die elektronische Akte (E-Akte) ist eine virtuelle Sammlung von Dateien und Dokumenten, die zu einem einheitlichen elektronischen Medium zusammengefasst werden. Hierin können auch insbesondere Grafikdateien, Bilddateien, Film- und Tondateien sowie Meta-Informationen enthalten sein. Diese Dokumente werden in den SCENTS-Prozess importiert, strukturiert und für die Weiterverarbeitung aufbereitet.
Die Bing-basierte Vorschlagssuche unterstützt Benutzer während der Eingabe in der App oder Website mit intelligenten Funktionen (Auto-Vervollständigung) und ermöglicht es, mit automatischen Suchvorschlägen schnelle und relevante Suchergebnisse zu erhalten.
Dieser Dienst konvertiert gesprochene Audiodaten in Text. Dabei können mehr als 40 Sprachen und Varianten transkribiert werden. Über unterschiedliche Modelle kann die Genauigkeit bei fachspezifischer Terminologie verbessert werden. Sofern die Datei als Video vorliegt, wird die Audiospur initial extrahiert und anschließend analog weiterverarbeitet.
Sämtliche Dokumente und Daten werden initial zusammen mit Meta-Daten und Kontext-Informationen auf Basis von AES Standards serverseitig verschlüsselt und bei Bedarf wieder entschlüsselt. Der AES Algorithmus für die symmetrische Blockverschlüsselung stellt die vollumfängliche Integrität der Daten sicher, die Schlüssel werden im Key Vault verwaltet.
Audio-Dateien und Videos bestehen u.a. aus einer Audio-Spur und Metadaten. Dieser Dienst extrahiert aus der Audio-Spur den Content (Plain Text). Zusätzlich werden weitere Informationen wie zB Autor, Beschreibung, Kategorie, Laufzeit, Bitrate usw. ermittelt. Mögliche Formate sind hier AVI, MP3, MP4, WAV, FLV, M4A und YouTube-Seiten.
Dieser Dienst ermittelt über vorkonfigurierte Suchmaschinen Webseiten sowie Twitter- und Facebook-Einträge zu definierten Themen und Bereichen und identifiziert im Anschluss relevante Texte und Metadaten. Die Texte können in einer beliebigen Sprache vorliegen.
Daten und Meta-Informationen können in unterschiedlichen Fremdsystemen vorliegen. Diese Werte und Informationen werden über einen RESTful- oder SOAP-Konnektor einmalig oder auch permanent (scheduled) in den Workflow integriert.
Daten und Meta-Informationen können aus Fremdsystemen (CMS, CRM, DMS, ERP, HL7, KIS, PACS, Sales Force, SAP, …) über einen Konnektor einmalig oder auch permanent (scheduled) in den Workflow integriert werden.
Die X-Rechnung ist ein XML-basiertes semantisches Datenmodell, das als Standard für elektronische Rechnungen aktuell etabliert wird, die an die öffentlichen Auftraggeber in Deutschland gesendet werden. Diese Dokumente werden in den SCENTS-Prozess importiert, strukturiert und für die Weiterverarbeitung aufbereitet.
Der Service für die Bing-basierte Suche bietet Ranking-Optionen, skalierbare Such-Indizes und die Interpretation von Dokumentinhalten. Es werden themenbezogenen Websites und Bilder identifiziert, die relevanten Suchergebnisse können über Filter und Regeln präzise spezifiziert werden. Die Ergebnisse können als Eingabe für den Web-Crawler-Service weiterverarbeitet werden.
Die KI-gestützte Erkennung von handschriftlichen Texte, Formen und Layouts geschriebener Dokumente ermöglich die Umsetzung von Papier zu Plain Text.
Sämtliche Data Ingestion Dienste enthalten integrale Funktionen um Meta-Informationen und Semantik zu den jeweiligen Dokumenten und Objekten zu ermitteln. Diese Informationen sind auf die jeweiligen Objekttypen abgestimmt und werden zusammen mit allgemeinen Prozess- und Projektinformationen über den vollständigen Prozess-Lauf mitgeführt.
Der Text im Gesamtkontext und die segmentierten Sätze werden über diesen KI-Dienst in Echtzeit in mehr als 60 Sprachen übersetzt. Sämtliche Eingangsdaten werden in eine einheitliche Zielsprache übersetzt und die nachfolgende Prozesse setzen auf diese Standardsprache auf. Somit wird gewährleistet, dass alle Analysen und Recherchen sprachlich konsolidierte Ergebnisse liefern, die dann wieder in eine beliebige Zielsprache übersetzt werden können.
Der unstrukturierte Content (Plain Text) wird in Abschnitte, Sätze, Satzteile, Wörter, Buchstaben, Ziffern und Satzzeichen segmentiert - dies ist eine zentrale Voraussetzung für die weitere linguistische Verarbeitung und Analyse.
Sämtliche Wörter des strukturierten Textes werden ihren Wortarten zugeordnet. Diese Kennzeichnung wird durch Dienste aus dem Bereich der Computerlinguistik (NLP) automatisiert. Dies ist Voraussetzung, um eine linguistische Weiterverarbeitung und Analyse anschließen zu können.
Das Lemma ist die Grundform eines Wortes, entsprechend wird der Vorgang zur Bestimmung der genaueren Lemmata als Lemmatisierung bezeichnet. Sämtliche Wörter des strukturierten Textes werden ihrer Grundform zugeordnet (better → good). Diese Einteilung wird durch Dienste aus dem Bereich der Computerlinguistik (NLP) automatisiert.
Über die Methode der Stammformreduktion werden die unterschiedlichen morphologischen Varianten der Wörter auf ihren jeweiligen Wortstamm zurückgeführt(closing, closed → close). Diese Kennzeichnung wird durch Dienste aus dem Bereich der Computerlinguistik (NLP) automatisiert. Dies ist Voraussetzung um eine linguistische Weiterverarbeitung und Analyse anschließen zu können.
Der Datenanonymisierungsdienst ermöglicht es, in einem Content alle personenbezogenen Informationen auf Objektebene mittels verschlüsselte Keys zu bereinigen. Sofern ein berechtigter Grund besteht, können zu einem späteren Zeitpunkt die realen Benutzerinformationen wieder hergestellt werden. Für die Veröffentlichung von Daten wird eine konfigurierbare K-Anonymität angeboten.
Auf Basis der Bing-basierten Entitäten-Suche werden umfassende Kontextdaten zu Personen, Orten, Dingen und lokalen Unternehmen ermittelt. Hierbei werden alle relevante Entitäten zu den Such-Begriffen ermittelt und mit aussagekräftigen Statistiken unterlegt. Die gewonnen Erkenntnisse unterstützen bei strategischen Entscheidungen und steigern den Informationsgehalt.
Die Rechtschreibfehler in einfachen Sätzen und darüber hinaus Groß-/Kleinschreibung, Zeichensetzung und Silbentrennung in komplexen Dokumenten werden erkannt und können während der Eingabe über Vorschläge oder auch voll automatisiert korrigiert werden. Homophone sowie die Unterschiede zwischen Namen, Markennamen und Jargon werden erkannt und optimiert.
Dieser KI-basierte Service analysiert Bildern und liefert umfangreiche Informationen zu Inhalt und Struktur. Die Textextraktion identifiziert gedruckte und handgeschriebene Texte, die weitere Inhalte zum Kontext liefert.
Die KI-gestützte Analyse ermöglicht die Extrahieren von Metadaten aus Video- und Audioinhalten und liefert wertvolle Erkenntnisse und Informationen wie gesprochene Worte, geschriebener Text, Gesichter, Sprecher, Prominente, Emotionen, Themen, Marken oder Szenen.
Dieser KI-gestützte NLP Service extrahiert auf Basis von ML-Modellen Informationen aus unstrukturierten Text. Hierbei werden Schlüsselelemente identifiziert sowie klassifiziert und vorab definierten Kategorien zugeordnet. Diese eindeutig unterscheidbaren Entitäten sind oftmals Voraussetzung für die weitere Verarbeitung innerhalb des SCENTS-Prozesses.
Ein KI-Dienst, der Erkenntnisse wie Stimmungen, Entitäten und Schlüsselbegriffe aus unstrukturiertem Text liefert. Satzteile und ganze Sätze werden mithilfe domänenspezifischer, vorab trainierter Modelle, terminologisch klassifiziert und anschließend über die Sentiment-Analyse bewertet. Als Ergebnis erhält man Aussagen bzgl. der Wahrnehmung eines vorab definierten Produktes oder Themas.
Dieser KI-gestützte NLP Service führt auf Basis eines vortrainierten statistischen Models eine Dependency-Analyse durch um dann die ermittelten Abhängigkeiten zu nutzen um Sätze und Satzphrasen mittels Rule-Based-Pattern-Matching einem Produkt gezielt zuordnen zu können. Es besteht so die Möglichkeit, Texte, die unterschiedliche Produkte vergleichen, zu zerlegen und jedem Produkt isoliert ein eindeutiges Sentiment zuzuordnen.
Dieser integrierte Azure Media Service analysiert Audio-Dateien und -Streams bzgl. Sentiment (Stimmung) und identifiziert den Sprecher. Dazu werden aus dem gesprochene Text alle Sätze extrahiert und bzgl. der Stimmung bewertet. Zusätzlich werden Informationen über Trefferwahrscheinlichkeit und Sprechdauer je Satz geliefert. Diese Auswertung kann in einem Graphen visualisiert werden, so dass man beispielsweise zu einer Rede mit der Laufzeit auf der Abszisse und dem Sentiment-Faktor auf der Ordinate die Volatilität und die Klimaxe ableiten kann.
Dieser integrierte Azure Media Service analysiert Video-Dateien und -Streams bzgl. Sentiment (Stimmung). Dazu wird das Video in Triple-Sequenzen zerlegt, die satz-basiert Ascii-Text, Audio-Sentiment und Bild-Sentiment zusammenhalten. Zusätzlich werden Informationen über Trefferwahrscheinlichkeit und Sprechdauer je Satz geliefert. Eine Auswertung kann analog zu dem Audio Sentiment Analyzer Service erstellt werden.
Die maschinengestützte Überprüfung von Bildern, Texten und Videos ermöglicht das Erkennen und Filtern von möglicherweise anstößigen und unerwünschten Bildern, Texten und Videos. Eine Klassifizierung über benutzerdefinierte Listen bietet die Option, themenbezogen (beispielsweise das Thema Jugendgefährdung) zu erkennen und auszuwerten. Hierbei ist auch die Suche nach personenbezogenen Informationen möglich. Dieser Service stellt Indikatoren für die Erstellung eines dynamischen Lagebilds zur Verfügung.
Das Risiko systematischer Fehler bei der Analyse von Texten ist im Bereich der Computerlinguistik zu einem zentralen Thema herangewachsen. Kognitive Verzerrungen beim Wahrnehmen, Erinnern, Denken und Urteilen führen zu vorurteilsbehafteten Daten, die dann für ML Algorithmen als Trainingsdaten verwendet werden könnten und so den BIAS zementieren. Der BIAS DETECTION Service identifiziert in Texten Auffälligkeiten bzgl. sozialer Variablen (Alter, Geschlecht, geografische Herkunft) und Plagiaten und optimiert so die Performance von NLP Werkzeugen.
Die KI-gestützte Erkennung von Auffälligkeiten und Abweichungen ermöglicht über unterschiedliche Modelle eine Identifizierung von vordefinierten Szenarien. Individuell konfigurierbare Parameter optimieren die Ergebnisse, die als tabellarische oder grafische Auswertung Auskunft zu Abweichungen, Entwicklungen und Trends bieten. Dieser Service stellt Indikatoren für die Erstellung eines dynamischen Lagebilds zur Verfügung.
Die KI-gestützte Analyse und Erkennung von Gesichter und Attributen in einem Bild liefert Kontextinformationen zu einem Thema. Die identifizierten Personen können über ein Repository mit bereits erfassten Personen abgeglichen werden. Zusätzlich kann der Service Emotionen wie Glück, Verachtung, Neutralität und Angst erkennen und ermöglicht eine Gruppierung ähnlicher Gesichter in Bildern.
Die maschinengestützte Überprüfung und Erkennung von Sprechern ermöglicht anhand einzigartiger Stimmmerkmale die Identifizierung von Personen. Dieser Service kann Indikatoren für die Erstellung eines dynamischen Lagebilds zur Verfügung stellen.
Dieser KI-basierte Dienst ermöglicht die Extraktion von Text und Struktur aus Dokumenten und Formularen. Hierbei werden die Schlüssel-Wert-Paare und Tabellen in den Dokumenten erkannt, extrahiert und für eine Weiterverarbeitung vorbereitet.
Diese Dienste bieten die Möglichkeit Auswertungen und Ergebnisse in unterschiedlichen Formaten (PDF/a, MS Excel, MS PowerPoint, Xml, HTML, DBMSs) auszuleiten und zu präsentieren. Publikationen können zu jedem Zeitpunkt und fortwährend angefordert und exportiert werden und liefern eine dynamische und angepasste eine Sicht auf den aktuellen Stand.
Berichte und Auswertungen können manuell zu jedem Zeitpunkt und auch automatisiert über Schedule-Mechanismen an die Stackholder per E-Mail oder Monitoring-Tool kommuniziert werden.
Eine Web-Dashboard informiert ständig über den Status und Fortschritt (Monitoring) der jeweils abonnierten Prozesse und Projekte. Anstehende Aufgaben (zB im Kontext eines Aproval-Prozesses) werden plakativ angezeigt und die Umsetzung wird über eine entsprechende Benutzerführung unterstützt.
Dieser Persistenz-Dienst bietet einen hoch skalierbaren und sicheren Objektspeicher für die revisionssichere (unveränderte) Ablage von Dokumenten und Objekten. Die Datenhaltung dieser Objekte kann über kostengünstige Data Tiering Konzepte und Life Cycle Systeme gesteuert werden.
Dieser Dienst bietet eine BLOB-Storage-Archivierung auf Basis von OAIS. Das Open Archival Information System ist ein Referenzmodell für ein dynamisches, erweiterungsfähiges Archivinformationssystem, das im August 2012 als ISO-Standard veröffentlicht wurde. Vor dem Hintergrund der Einsicht, dass digital archivierte Dokumente nach längerer Zeit aus vielfältigen Gründen nicht mehr lesbar sein könnten, wurde Standards definiert, die bei der Langzeitarchivierung zu beachten sind.
Spezifische Ausleitungen in Fremdsysteme und individuelle Auswertungen gestatten eine maximal optimierte Verwendung der Daten und ermöglichen dem Kunden Zusatzleistungen wie beispielsweise die Erstellung von Dokumentation, Berichten, Rechnungen, Informationsblättern, marketingrelevante Statistiken und unternehmensweiten bzw. -übergreifenden Bewertungen.
Mächtige und vielfältige Werkzeuge für Volltextsuche, Facets- und Fuzzy-Research, Faulted KI Opimization, High-Lighting, 360° Dokumente und intelligente (lernfähige) Suchen mit umfangreichen Filtermöglichkeiten ermöglichen das schnelle und gezielte Auffinden von themenbezogenen Inhalten. Suchen können hinterlegt und Ergebnisse persistiert werden.
Mit diesem cloudbasierter Dienst werden Frage-Antwort-Tupels im Konversationsstil zu vorhandenen Daten erstellt. Das Ergebnis ist eine Wissensdatenbank mit den Fragen und Antworten aus teilweise strukturierten Inhalten einschließlich FAQs, Anleitungen und Dokumenten. Fragenstellungen können so automatisiert mit geeigneten Antworten aus dieser Wissensdatenbank beantwortet werden.
Die Daten werden samt ihren Meta-Informationen in das Xml-Format überführt und zusammen mit den Layout-Informationen über ein definierbares Stylesheet (XSLT) in ein PDF-File oder eine HTML-Datei transformiert. Schema-Dateien (XSD) sichern diesen automatisierten Prozess bzgl. der Validität ab.
Top