Big Data Projekte zeichnen sich meist durch große umfangreiche und unstrukturierte Datenmengen aus. Die unstrukturierten Daten, die aus zahlreichen Quellsystemen stammen, sind in ihrer Quantität oftmals dem verantwortlichen Projektmanager nicht bekannt. Ein entsprechendes Analysetool schafft hier Transparenz, welche Daten vorliegen, jedoch auch, wieviele Daten von den entsprechenden Datentypen vorhanden sind und indexiert werden können. Ebenfalls kann ein Analysetool, korupte Dateien erkenntlich machen, als auch die zu benötigte Zeit für die Indexierung sämlticher Daten berechnen.
Bei der Umsetzung von Big Data Projekten ist es daher unerlässlich, dass ein erfahrener Enterprise Search Spezialist die Analyse der Daten durchführt, den Projektverantwortlichen zur Seite steht und so bei der Umsetzung unterstützt. Somit können ggf. schnell Schwachstellen bei Berechtigungen und Dokumenten aufgezeigt werden. Diese können dadurch entstehen, dass Dateien aus den verschiednen Dateisystemen kopiert oder auch verschoben werden. Auch die Vergabe von zu langen Dateinamen kann ein zusätzliches Problem darstellen. Anschließend wird zusammen mit dem Projektansprechpartner für die Indexierung ein Maßnahmenkatalog erstellt.
Planungssicherheit und Kostentransparenz bei Big Data Projekten
Ein großer Kostenpunkt in Enterprise Search Projekten ist die Anbindung von Datenquellen. Dies wird zusätzlich von Aussagen unterstützt die Analysten die entsprechende Enterprise Search Projekte untersuchten. Zudem wird dies zusätzlich durch die praktische Erfahrung bei konkreten Enterprise Projekten der IntraFind AG untermauert. Die IntraFind AG entwickelte daher ein auf der Lucene-Suche basiertes Tool zur Analyse von Dateilaufwerken, um die Sicherheit bei der Planung von Enterprise-Search Projekten zu gewährleisten. Zudem ist dieses Tool unerläßlich, um eine Kostentransparenz erstellen zu können.
Hat eine erste Analyse stattgefunden, kann aus den Analyseergebnissen der Daten erste Erkenntnisse abgeleitet werden auf deren Basis dann die Projektierung des Projektes vorgenommen werden kann. Die Erstanalyse ist dahingehend ein wichtiger Bestandteil der Projektierung, da hierdurch bereits zu Beginn wichtige Entscheidungen über einen evtl. Kauf getroffen werden können. Ebenfalls erhält man so wichtige Informationen über den Total Cost of Ownership (TCO), also der Gesamtbetriebskosten des Projektes.