Traditionell unterscheiden Datenexperten und Informationsmanager drei Arten von Daten, strukturierte Daten, unstrukturierte Daten und, du hast es erraten, halbstrukturierte Daten.
Manche sprechen auch von „quasi-strukturierten“, „multi-strukturierten“ und „hybriden Daten“. Obwohl es Debatten über die Struktur rund um unstrukturierte Daten gibt, ist es wichtig, einen Blick darauf zu werfen, was diese drei Arten von Daten im Wesentlichen bedeuten. Woher sie kommen und wie sie genutzt werden.
Strukturierte Daten versus unstrukturierte Daten
Es gibt wirklich viele Definitionen von Daten. Unstrukturierte Daten, strukturierte Daten und andere Datenformen, die wir gerade erwähnt haben.
Strukturierte Daten werden traditionell als die Daten definiert, die du in Datenbanken oder in Tabellenkalkulationen mit einem klar definierten Format und Struktur findest. Daten sind einfach einzugeben, zu speichern, abzurufen und zu analysieren. Denke als Beispiel an eine relationale Datenbank oder auch eine Excel-Datei, die alle deine Kundendaten enthält.
Unstrukturierte Daten sind Daten, die nicht in einer Datenbank liegen. Oder besser gesagt, Sie folgen nicht den gleichen Datenstrukturdefinitionen und Regeln. Diese Art von Daten wurde traditionell mit allen Arten von Dateien in Verbindung gebracht. Denke an Word-Dokumente, Bilder oder digitale Audio-Dateien. Und dann hast du halb-strukturierte Daten, die zwischen beidem liegen.
Warum ist das alles wichtig und wie wirkt es sich auf dein Geschäft aus? Wir werden die drei Datentypen noch ein wenig näher erläutern und sie in eine historische Perspektive stellen. Aber zuerst werfen wir einen Blick auf die Herausforderung und die Chance von unstrukturierten Daten.
Die Herausforderungen von Datenstrukturen
Gehen wir zurück in die Zeit, in der wir noch mit Tabellenkalkulationen und sehr einfachen Datenbanken und Datentools gearbeitet haben.
Erinnere dich an das Beispiel einer Kundendatenbank. Es gibt andere Datenbanken oder „Tabellen“, die ebenfalls strukturierte Daten über verschiedene Aspekte deiner Kunden enthalten. Und diese sind traditionell verknüpft. Du kannst eine Datenbank der Verkaufstransaktionen haben, die mit einer Liste deiner Produkte und der Kundendatenbank verknüpft ist, damit du weißt, was von wem gekauft wurde. Das ist dein grundlegender traditioneller Datenbankansatz aus dem Jahr 1987.
Jetzt gibt es verschiedene Systeme und Prozesse, um solche Datenquellen zu nutzen, um eine bestimmte Funktion zu erfüllen. Stell dir vor, wir sind im Jahr 2000, das Internet wird sehr populär und du hast ein Formular auf deiner Website, um Kunden Unterstützung anzubieten.
Sie müssen ein paar Felder ausfüllen und Daten wie die Rechnungsnummer eingeben, die auch in deiner Transaktionsdatenbank gespeichert ist. Darüber hinaus können sie einige weitere Daten eingeben, darunter natürlich die Art ihres Problems. All diese Daten fließen in ein System ein, wiederum in einer strukturierten Art und Weise, und du bist in der Lage, deinen Kunden mit einer vollständigen Historie des Kaufs zu versorgen.
In der Praxis und in den verschiedenen Arten von Lösungen, die in einem solchen Kontext verwendet werden, gibt es noch viel mehr und die Daten können auch auf eine andere Art und Weise eingegeben werden. Zum Beispiel, wenn dein Kunde einen Contact Center Agent anruft, der dann die Details des Anrufs eingeben kann. Die ersten CRM-Systeme waren eigentlich nichts anderes als sehr statische Kundendatenbank-Systeme.
Unstrukturierte Daten und das Contact Center
Schneller Vorlauf ins Jahr 2017. Der Kunde ist omni-channel oder kanal-agnostisch. Er nutzt mobile Geräte und hat zahlreiche neue Möglichkeiten, mit deinem Contact Center in Kontakt zu treten.
Er ruft vielleicht immer noch an oder füllt ein Webformular aus, aber er sendet auch E-Mails, Twitter-Supportanfragen usw. Er interagiert möglicherweise in Echtzeit über Webchat oder Videochat.
Das Problem mit E-Mails und Twitter-Nachrichten ist, dass sie im Wesentlichen unstrukturierte Formen der Kommunikation sind. Mit anderen Worten, Sie enthalten Informationen, die man nicht einfach in ein strukturiertes Format oder eine Datenbank packen kann.
Hinzu kommt, dass der durchschnittliche Kunde heute sehr schnell Hilfe haben möchte, hohe Erwartungen hat und es hasst, zu warten. Der Kunde erwartet, dass du alles weißt, um ihm hier und jetzt zu helfen.
Die Herausforderung ist, dass die meisten Unternehmen nicht in der Lage sind, das zu tun. Es sei denn, sie haben einen wirklich einheitlichen Informationsansatz und haben alle Arten von Informationen miteinander verbunden.
Hier ist ein Beispiel dafür, was passiert. Ein neuer Kunde hat, sagen wir, einen Kredit beantragt. Er hat einige Papiere ausgefüllt, möglicherweise einige Dokumente geschickt, per Post, per E-Mail oder digital wenn das Dokument gescannt wird.
Diese Informationen gelangen in dein Unternehmen. Das dauert einige Zeit und der Kunde wird ein wenig ungeduldig. Wen ruft er dann an? Nicht die Menschen, die sich mit der Kreditanfrage beschäftigen. Nein, er ruft das Contact Center an. Oder er schickt eine Mail, vielleicht mit einem Anhang, z.B. einer Kopie seines Antragsformulars.
Dies ist nur ein mögliches Szenario, aber es zeigt die Herausforderungen. Wenn dein Contact Center keinen Einblick in die Prozesse hat, die im Backend ablaufen, in diesem Fall den Status der Genehmigung, können sie nicht sofort helfen. Und wenn du keinen einheitlichen Ansatz hast, mit dem du die wichtigen Daten erfassen kannst, die in den unstrukturierten Kommunikationsformen versteckt sind.
Das ist ein Grund, warum die Fähigkeit, mit unstrukturierter Kommunikation und Daten umzugehen, sehr wichtig ist. Vor allem, weil diese Art der unstrukturierten Kommunikation immer mehr zunimmt.
Big Data und seine Bedeutung in diesem Kontext
Unstrukturierte Daten sind im Kontext von Big Data und Analytik sehr wichtig. Zunächst einmal hat Big Data die Frage, wie man all diese unstrukturierten Daten verarbeiten kann. Wie man sie neu entfacht und sie aus traditionelleren Bereichen wie der Forschung direkt in den Mittelpunkt des geschäftlichen Interesses rückt. Wobei zunächst ein Hauptaugenmerk auf Text Analytics und Content Analytics lag.
Letztendlich ist das beschleunigte Wachstum der Datenmengen, Quellen und Formaten, hauptsächlich getrieben durch unstrukturierte Daten, der Grund, warum IBM als erstes den Weg des Cognitive Computing eingeschlagen hat. Es gibt ein starkes Wachstum von Anwendungen, die Techniken der künstlichen Intelligenz nutzen, die zuvor in sehr spezifischen Bereichen eingesetzt wurden.
Der Bedarf an künstlicher Intelligenz
Die Kundenkommunikation hat sich mit immer mehr unstrukturierten Kommunikationskanälen und Quellen dramatisch verändert. Es besteht ein Bedarf, mit all dieser unstrukturierten Kommunikation und den daraus resultierenden unstrukturierten Daten und Informationen umzugehen. Unternehmen müssen wissen, wie sie diese Informationen zusammenführen und aus dem darin enthaltenen Wissen aufbauen können.
Zusätzlich gibt es eine Menge anderer wichtiger Informationen, die in dieser Fülle von unstrukturierten Daten versteckt sind. Nur künstliche Intelligenz kann mit all dem umgehen, da unstrukturierte Daten einfach nicht mit einem regelbasierten Ansatz behandelt werden können.
Künstliche Intelligenz nimmt die Notwendigkeit für Regeln weg. Sie nutzt ihre Intelligenz, um über die Basisinformationen hinauszugehen und erarbeitet Inhalte automatisch, lernt vom menschlichen Verhalten und kann auch Vorhersagen und Prognosen machen.