NLP-basierte Text Mining-Plattform

Wir haben einen sprachdiagnostischen Dienst entwickelt, der Terabytes an Textdaten verarbeitet

Data analyticseLearningInformationstechnikNLPPlattformentwicklungSprachdatenverarbeitung

Project highlights

  • Semantik natürlicher Sprache analysieren
  • Relevante Suchergebnisse erhalten
  • Informationen effizient klassifizieren
Branche:
Soziale Medien, Textanalytik
Hauptsitz:
Österreich
Markt:
9 Mitarbeiter
Teamgröße:
2 Jahre

Über unseren Kunden

Als Innovator im Bereich Natural Language Understanding entwickelt unser Kunde semantische Fingerabdrucktechnologie als Grundlage für Künstliche Intelligenz-Software. Das Unternehmen unseres Kunden mit Sitz in Wien und San Francisco befasst sich mit den Herausforderungen, große Mengen unstrukturierter Textdaten zu filtern, Themen in Echtzeit auf Social Media zu erkennen und in mehreren Sprachen in Millionen von Dokumenten zu suchen. Unser Kunde wurde als IDC-Innovator 2016 im Markt für maschinell lernbasierte Textanalytik sowie als einer der 100 Start-ups ausgezeichnet, die mit Hilfe der Künstlichen Intelligenz Industrien durch CB Insights transformieren.

NLP-basierte Text Mining-Plattform

Cortical kam mit einer Herausforderung

Inspiriert von den neuesten Erkenntnissen, wie das menschliche Gehirn Sprache verarbeitet, erarbeitete das österreichische Start-up einen grundlegend neuen Ansatz, um große Textmengen abzubauen und die erste sprachdiagnostische Semantic Engine zu schaffen. Die Semantic Engine, die mit Algorithmen des hierarchischen Zeitgedächtnisses (HTM) betrieben wird, generiert semantische Fingerabdrücke aus beliebigen unstrukturierten Textinformationen und verspricht nahezu unbegrenzte Anwendungsfälle und eine enorme Marktchance.

Unser Kunde hat sich mit uns zusammengetan, um sein Entwicklungsteam zu vergrößern und seine innovative Semantic Engine zum Leben zu erwecken. Unsere Expertise in REST, Spring und Java war von entscheidender Bedeutung, da unser Kunde einen Prototyp entwickeln musste, der in der Lage war, komplexe sinnbasierte Filterung, Themenerkennung und semantische Suche über riesige Mengen unstrukturierten Textes in Echtzeit auszuführen.

Intellias entwickelte die Lösung

Indem er die Semantik natürlicher Sprachelemente in semantisch fundierten Binärcode kodiert, ermöglicht es dieser sprachdiagnostische Service unserem Kunden, Terabyte an Textdaten zu verarbeiten. Der resultierende Code wird dann weiter verglichen und mit standardisierten Metriken analysiert, was große Möglichkeiten für Textfilterung, Klassifizierung und Suche bietet. Dieser Service ist vorteilhaft für Unternehmen, die Text-Repositorys in verschiedenen Sprachen durchsuchen, eingehende E-Mails überwachen oder aktuelle Themen in Social Media aufspüren müssen.

Wir stellten auch einen Prototyp von NLP-Algorithmen vor, die in KNIME-Workflows integriert sind und Java-Snippet-Knoten verwenden. Dabei handelt es sich um eine konfigurierbare Pipeline, die unstrukturierte wissenschaftliche Texte als Input nimmt und strukturierte Daten als Output zurückgibt. Der Benutzer kann Vorverarbeitungseinstellungen und Analysen für eine beliebige Anzahl von Themen festlegen. Die Ausgabe kann dann grafisch auf dem resultierenden Ähnlichkeitsindex visualisiert werden.

Was hat unser Kunde bekommen?

  • Eine NLP-Engine, die auf der Ebene der Semantik und nicht auf der Ebene von Schlüsselwörtern arbeitet, um Texte zu filtern, zu klassifizieren, zu gruppieren, zu gruppieren und zu suchen.
  • Eine horizontal skalierbare Lösung, die bereit ist, ein exponentielles Wachstum der Benutzerbasis zu unterstützen.
  • Eine semantische Fingerabdrucktechnologie, die als Dienstleistung auf dem globalen Markt angeboten wird.

Gemeinsam erzielten wir großartige Ergebnisse

Wir haben an der Entwicklung eines Produkts mitgewirkt, das semantische Fingerabdrücke von Sprache erzeugt. Es ist eine grundlegend neue Alternative zur Erfassung der Semantik der natürlichen Sprache. Dieses Produkt ermöglicht es Endkunden, intelligente Entscheidungen auf der Grundlage von menschlich generierten Texteingaben zu treffen, einschließlich Wörtern, Dokumenten und Social Media Streams.

Wir halfen Cortical

  • neue Investoren und Kapital in Höhe von 2 Millionen Dollar zu akquirieren
  • RESTful APIs, die auf dem Amazon Web Services-Marktplatz verfügbar sind zu implementieren, um Ihre Lösung mit angepassten Datenbanken und Anwendungen zu skalieren
  • die Reaktionen der Kunden in Echtzeit durch einen intelligenten Filter zu überwachen, der die Twitter-Firehose in einen Strom semantischer Fingerabdrücke umwandelt
  • NLP-Algorithmen in KNIME-Koten zu entwickeln, um einen Prototyp ihres NLP-Systems voranzutreiben
Wie können wir Ihnen helfen?

Kontaktieren Sie uns. Wir freuen uns darauf, von Ihnen zu hören.

Wir verwenden Cookies, um Ihnen das beste persönliche Erlebnis zu bieten.
Indem Sie auf „Akzeptieren“ klicken, erklären Sie sich mit der Verwendung von Cookie, wie in der Cookie-Richtlinie beschrieben, einverstanden.

Danke für Ihre Nachricht.
Wir melden uns in Kürze bei Ihnen.