innovation

Hochleistungsspeicher fürs Triebwerksbusiness

Um Maschinendaten nutzbarer zu machen, müssen Datenanalyst:innen gigantische Datenmengen in Kontexte setzen. Ein gänzlich neuer Speicher ist nötig.

Autor: Thorsten Rienth | 4 Min. Lesezeit veröffentlicht am: 19.05.2021

AEROREPORT-Serie Auf digitaler Mission

Wer den abstrakten Begriff von Datenflut veranschaulichen will, könnte sich einer gängigen Fräsmaschine bedienen, mit der die MTU Aero Engines in München zum Beispiel Blisks fertigt, die in Verdichtern von Triebwerken zum Einsatz kommen. Mit einer Frequenz von 250 Hertz, also 250 Mal in der Sekunde, greift ihre Sensorik etwa 70 Signale aus Maschinen ab. Drehmomente, Temperaturen, Achspositionen oder Qualitätswerte der Kühlschmierstoffe. Zehn Stunden kann die Maschine bei einem komplexen Bauteil gut und gerne beschäftigt sein. Bedeutet für die Länge des Datensatzes: Über zehn Millionen Zeilen – für nur diesen Bearbeitungsschritt.

AEROREPORT-Serie: Auf digitaler Mission

Mit der Digitalisierung hebt die Luftfahrt ab
Hochleistungsspeicher fürs Triebwerksbusiness
Schnell und präzise: Angebotskalkulation mit Big Data
Dokumentenrecherche mit Künstlicher Intelligenz
Neues Datenmanagement für Triebwerkstestdaten
Mastermind für die MTU-Produktion

Irgendwann stoßen selbst fortschrittliche Datenbanken an ihre Grenzen

Um aber später aus diesen Rohdaten relevante Informationen extrahieren zu können und daraus Wissen und Verständnis für Produkte und Prozesse abzuleiten, reichen zehn Stunden Datenaufzeichnungen nicht aus. Damit unbekannte Muster und Zusammenhänge zwischen verschiedenen Variablen sichtbar werden können, sind schnell die Daten eines kompletten Maschinenbetriebsjahrs nötig. Aus Millionen Zeilen werden Milliarden Zeilen. Aber irgendwann stoßen selbst fortschrittliche Datenbanken an ihre Grenzen. Mit zunehmender Speichergröße verlangsamen sie sich rapide. Die MTU-Informatikerinnen Dr. Galina Baader und Dr. Sonja Hecht arbeiten deshalb an einem Turbo.

„Damit wir die Daten weiterhin handhaben können, müssen wir den Aufbau des Speichers komplett neu denken“, sagt Baader. „Wir müssen es schaffen die Daten so zu speichern, dass diese auf leistungsstarke Weise abgerufen werden können und möglichst wenig Speicherplatz benötigen“. Der Weg dorthin ist lang – und dennoch führt er über eine Abkürzung: Anstatt in Zeilen, wollen die Entwicklerinnen künftig in Spalten denken. „In einer Spalte stehen meist homogene Daten, die sich mit einem geeigneten Algorithmus deutlich komprimieren lassen“, erklärt die Big Data-Spezialistin. Das Ergebnis sind sehr kompakte Dateien. Abhängig vom konkreten Anwendungsfall sind diese um den Faktor vier bis zehn kleiner als bisherige Speicherlösungen.

„Big Data und Datenanalyse begleiten mich schon sehr lange. Zuerst im Wirtschaftsinformatikstudium, dann im IT-Consulting– und jetzt bei der MTU. Das gesamte Big Data-Feld hat einen enormen Wandel hinter sich: Bis vor gar nicht allzu langer Zeit standen vor allem administrative Prozesse im Fokus. Jetzt liegt er ganz unmittelbar auf dem Produkt. Genau das ist der Punkt, der meine Aufgabe bei der MTU so spannend macht: Ich kann durch meine Arbeit ganz direkt die Produktqualität beeinflussen.“

Dr. Sonja Hecht

Informatikerin bei der MTU Aero Engines

Spaltenperspektive und Parallelisierung machen Datenspeicherung effizient

Die Daten spaltenweise abzuspeichern hat noch weitere Vorteile. Analysiert ein Datenanalyst beispielsweise den Temperaturverlauf, so muss der Rechner nur die dafür zutreffende Spalte einlesen. Alle anderen Spalten kann er ignorieren. „Der Rechner stößt sehr schnell und vor allem zielgerichtet zu genau jener Stelle vor, an der die für den jeweiligen Task benötigten Daten liegen“, sagt Baader.

Durch diese Art der Datenspeicherung können mittels Parallelisierung dann auch sehr große Datenmengen gleichzeitig abgearbeitet werden. Während ein Prozess die Daten aus einem Zeitraum verarbeitet, prüft ein anderer Prozess bereits die Daten aus einem anderen Zeitraum – theoretisch kann eine Vielzahl solcher Prozesse gleichzeitig ablaufen und die Prozessgeschwindigkeit um ein Vielfaches beschleunigen.

Der Fachbegriff hinter der Spaltenperspektive lautet Parquet-Format. Und „Record-shredding-and-assembly “ heißt der Algorithmus, der die verschachtelten Datenstrukturen dann in Bruchteilen von Millisekunden zerlegt und wieder zusammenfügt. So wird die MTU Rechenleistung sehr effizient verwendet. „Abhängig vom konkreten Anwendungsfall können wir die Laufzeit eines Algorithmus von mehreren Stunden auf eine Stunde reduzieren“, sagt Baader.

Spalten statt Zeilen

Schneller ans Ziel: Die spaltenweise Abspeicherung zeigt ihren Nutzen vor allem in der Datenanalyse: Der Rechner kann schneller und zielgerichtet auf die benötigte Stelle zugreifen und mittels Parallelisierung können mehrere Prozesse sogar gleichzeitig ablaufen und zusätzlich die Laufzeit verkürzen.

„Wir Dateningenieur:innen fungieren als die Schnittstelle zwischen den IT-Infrastruktur Kolleg:innen, der Fachabteilung und den Data Scientist:innen im Unternehmen. Um diese Rolle gut ausfüllen zu können, ist einiges an Verständnis für die Arbeit dieser Fachabteilungen nötig. Als ich vor etwas über einem Jahr bei der MTU anfing, habe ich mich erst einmal in Niederdruckturbinen und ihre Fertigungsverfahren eingelesen. Big Data-Projekte sind also immer auch interdisziplinäre Projekte, das finde ich extrem spannend.“

Dr. Galina Baader

Informatikerin bei der MTU Aero Engines

Mustererkennung aus Maschinendaten, statistischen Annahmen und Erfahrungswerten

Diese Stufe ist deshalb so wichtig, weil sie für Baaders und Hechts Kolleg:innen aus der Datenanalyse den Schritt in eine neue Welt ermöglicht. Plötzlich kommen sie in die Lage, das sprichwörtliche große Ganze der Maschinenbetriebsdaten zu analysieren. Nicht mehr nur kleinere Ausschnitte. „Für eine echte Mustererkennung sind wir auf die Werte aus längeren Zeiträumen angewiesen“, sagt Informatikerin Hecht. In Extremfällen aus mehreren Jahren.

Wegen der steigenden Komplexität von Triebwerkskomponenten wird auch deren Produktion immer komplexer. „Die schlussendliche Qualität eines Bauteils hängt ganz maßgeblich von den Wechselwirkungen der einzelnen Produktionsschritte ab“, erklärt Hecht. Was, wenn sich Maschinendaten, statistische Annahmen sowie Erfahrungswerte zu belastbaren Prognosen vernetzen ließen? Dann wäre eine datengetriebene Vorhersage der Produktqualität geschaffen, eine echte Predictive Quality.

Prognosefähigkeit liefert Fertigungsingenieur:innen Einblick in bislang unsichtbare Zusammenhänge

„Gibt es vielleicht an einem bestimmten Fertigungsschritt eine bestimmte Abhängigkeit zwischen Druck, Drehmoment und Temperatur, die sich womöglich erst Fertigungsschritte später negativ in einer Qualitätskennzahl niederschlägt?“, fragt Hecht. Relevante Werte wie mit einer digitalen Schere aus den Datensätzen geschnitten, als Muster extrahiert und in Dashboards visualisiert, geben den Fertigungsingenieur:innen unmittelbar an ihrer Linie Einblick in bislang unsichtbare Zusammenhänge. „Sie könnten einem möglichen Fehler bereits zu einem Zeitpunkt gegensteuern, an dem sie ihn noch nicht einmal ahnen können.“

Analog werden Prognosen zu den Verläufen von Werkzeugverschleiß denkbar. Triebwerksbauteile sind hochwiderstandsfähig – leider auch gegenüber den Fräswerkzeugen, die sie herstellen. Um die geringen Fertigungstoleranzen von Triebwerksbauteilen nicht zu gefährden, sind die Werkzeuglaufzeiten stets mit einem gewissen Materialpuffer versehen. Besser ausgenutzte Restlebensdauer könnten den Fertigungsfluss spürbar verbessern, weil die zeitaufwendigen Werkzeugwechsel seltener werden. Zudem sind Werkzeugkosten im Triebwerksgeschäft ein echter Kostenfaktor.

Überblick behalten: Mit einer besonderen Art der Datenspeicherung ermöglichen die beiden Informatikerinnen ihren Kolleg:innen aus der Datenanalyse und Fertigung, die Daten besser in Muster und Zusammenhänge setzen zu können.

Hardware-Rückgrat: High-Performance Computing (HPC) im MTU-Rechenzentrum

Beim Aufbau der neuartigen Datenspeicher und Analysetools spielt den beiden Informatikerinnen ein MTU-Spezifikum in die Hände. „Gerade in den Disziplinen Aerodynamik und Strukturmechanik setzen die Triebwerksentwickler:innen umfangreich Simulationen ein“, sagt Hecht. Dafür ist enorme Rechenpower im MTU-Rechenzentrum nötig.

Auf dem dort vorhandenen High-Performance-Computing-Cluster können nun auch Datenanalysealgorithmen laufen, ohne eigens eine zweite Rechenumgebung aufbauen zu müssen. „Das ist natürlich aus der IT-Infrastrukturperspektive unglaublich attraktiv.“