Diesen Freitag waren wir im Haus Gertrud, um den Bildschirm aufzubauen. Der Kunde war zufrieden, hatte noch einige Verbesserungswünsche, die wir in Launix-Manier aufgenommen haben und demnächst umsetzen werden. Doch im Büro wartete dann ein Folgeauftrag: Es sollten zwei E-Mail-Listen mit tausenden Einträgen verglichen werden.
Regelmäßig zig Stunden Arbeit durch IT-Handarbeit
Regelmäßig zig Stunden Arbeit durch IT-Handarbeit waren vorher notwendig: Es gab zwei Verteiler-Email-Listen. Aus der einen trugen sich die Leser ein- und aus; die andere Liste musste damit synchronisiert werden. Zusätzlich war die Datenbasis relativ unrein: Doppelte Datensätze und verschiedene Schreibweisen der E-Mail (nur E-Mail, Name und E-Mail in Klammern). Diese Listen von Hand zu synchronisieren hieß, diese in eine Excel-Tabelle einzulesen und über die Such-Funktion die Adressen einzeln herauszufischen.
Schnell war ein Auftrag über 1 Stunde Programmierung vor Ort ausgehandelt, um den Prozess zu automatisieren. Es wurde ein Programm angefertigt, in das man die beiden E-Mail-Listen eingibt. Anschließend werden die Daten bereinigt, Dupletten entfernt und die beiden Listen verglichen. Dabei kommt der sogenannte Merge-Sort-Algorithmus zum Einsatz: Die beiden E-Mail-Listen werden sortiert und anschließend alphabetisch verglichen. Der Algorithmus fängt an, beide Listen synchron zu durchlaufen. Dabei wird mit den alphabetisch niedrigsten Einträgen begonnen: Ist der Eintrag in der linken Liste alphabetisch „kleiner“ als der der Rechten Seite, so ist der Eintrag der linken Liste eine „aus der Liste entfernte“ E-Mail-Adresse. Der Zeiger auf der linken Seite rutscht einen Eintrag weiter. Ist dagegen der Eintrag auf der rechten Seite alphabetisch „kleiner“, handelt es sich bei dem Eintrag aus der rechten Seite um eine „in die Liste hinzugekommenen“ E-Mail-Adresse. In diesem Fall rutscht man anschließend den Zeiger auf der rechten Seite einen Eintrag weiter. Entsprechen hingegen in der linken und rechten Liste beide Einträge derselben E-Mail-Adresse, handelt es sich um eine Adresse, die in der Liste bleibt. Hier rutscht man auf beiden Seiten einen Eintrag weiter. Das ganze wiederholt man so oft, bis die beiden Listen synchron abgearbeitet sind. Als Ergebnis bekommt man zwei neue Listen: Die Liste der entfernten E-Mails und die Liste der hinzugekommenen E-Mails.
Viele Aufträge schlummern in den Firmen
Beispiele wie dieses gibt es überall: IT-Handarbeit, die optimiert werden kann. Doch niemand spricht diese Probleme an, wenn sich keine Gelegenheit bietet.
Deshalb: Fassen Sie sich ein Herz, klicken Sie auf Kontakt und machen Sie der nervigen Datenarbeit ein Ende.
Comments are closed