Transferzentrum für Digitalisierung,
Analytics & Data Science Ulm

Suche

Projektbeispiel

Information Extraction zur Katalogisierung von Exponaten

Zur Projektübersicht

Katalogtexte neu gedacht: Exponat Analyse von Briefmarken mit KI

Im Auktionsgeschäft für Briefmarken und philatelistische Exponate ist die Erstellung hochwertiger Katalogbeschreibungen ein zentraler Arbeitsschritt. Jedes Exponat – ob Einzelmarke, Brief oder Sammlung – muss präzise beschrieben werden, um Sammlern und Bietern eine fundierte Grundlage zu bieten. Dieser Prozess ist jedoch hochgradig repetitiv (etwa durch das Reproduzieren relevanter Erkenntnisse aus einem gedruckten Gutachten) und erfordert zugleich tiefes Fachwissen: Feine Unterscheidungen in Bezug auf Aufdruck, Stempel und Mängeln bestimmen den Wert eines Exponats maßgeblich. Der hohe personelle Aufwand begrenzt die Katalogisierungskapazität und führt dazu, dass neue Exponate teilweise nicht rechtzeitig berücksichtigt werden können.
Genau hier setzt das Projekt mit dem Auktionshaus Heinrich Köhler an: Im Rahmen einer Machbarkeitsstudie wird untersucht, wie eine KI-gestützte Pipeline die strukturierte Erfassung und sprachliche Aufbereitung von Exponaten unterstützen kann – als Grundlage für marktgerechte Auktionskatalogbeschreibungen.

© Adobe Stock / Yevheniiya

01 Verstehen

Der erste Schritt besteht darin, die philatelistische Domäne und die konkreten Anforderungen an Katalogbeschreibungen tiefgehend zu verstehen. Dabei steht im Rahmen der Machbarkeitsstudie die Frage im Vordergrund: Wie lässt sich Expertenwissen so formalisieren, dass eine KI damit zuverlässig arbeiten kann?
Um der KI das Expertenwissen beizubringen, finden regelmäßige Abstimmungen mit dem Kunden statt. Dabei wird schnell klar, wie komplex die Domäne ist: Feine Details wie die Unterscheidung zwischen Aufdruck und Stempel, die Einordnung von Fehldrucken oder die Bewertung von Erhaltungszuständen sind maßgeblich für den Wert von Briefmarken relevant und erfordern daher präzise Instruktionen an die KI. Gleichzeitig muss die Anleitung offen genug bleiben, um auch bei unerwarteten Fällen möglichst gute Ergebnisse zu erzielen.
Aus dem intensiven Domänenverständnis werden gezielte Anforderungen abgeleitet, die sowohl die Vielfalt philatelistischer Besonderheiten als auch die sprachlichen Konventionen des Auktionsmarktes berücksichtigen.

02 Entwickeln

Auf Basis dieser Anforderungen wurde in enger Abstimmung mit dem Auktionshaus ein Lösungsansatz entwickelt und schrittweise validiert. Im Zentrum steht eine Pipeline, die aus Bildquellen – Briefmarken, Briefe, Gutachten und weitere Dokumente – relevante Informationen automatisiert extrahiert. Ergänzend wurde eine API-Anbindung an ein bereits vorhandenes Ähnlichkeitsmodell zum Abgleich mit dem historischen Bestand an Briefmarken geschaffen, um übergeordnete Informationen wie Katalognummern oder Serieneinordnungen bei einem potenziellen Treffer im Abgleich zu identifizieren.
Ein Proof-of-Concept bestätigte die grundsätzliche Machbarkeit des Ansatzes. Dabei wurde der Prototyp gemeinsam mit dem Auktionshaus Heinrich Köhler evaluiert und iterativ verfeinert, um die Balance zwischen Präzision und Flexibilität der KI-Instruktionen sicherzustellen.

03 Umsetzen

Im Rahmen der Machbarkeitsstudie wurde ein funktionsfähiger Prototyp entwickelt, der mehrere zentrale Bausteine kombiniert: die Extraktion visueller und textueller Informationen aus diversen Bildquellen, eine Integrationslogik zur Zusammenführung der gesammelten Daten in einem strukturierten Format (JSON) sowie den Einsatz generativer KI unter Einbindung vordefinierter Templates zur Erstellung marktgerechter Katalogbeschreibungen. Ergänzend wurde eine prozessbegleitende Evaluationspipeline aufgebaut, um philatelistische Besonderheiten fachlich fundiert zu berücksichtigen und die Qualität der generierten Beschreibungen auf Basis einer Ground Truth systematisch zu überprüfen.

Der entwickelte Prototyp bildet die Grundlage für eine Integration in das bestehende Ökosystem des Auktionshauses. Darüber hinaus eröffnen sich Potenziale für weiterführende Optimierungen einzelner Verarbeitungsschritte, um die Qualität und Effizienz der automatisierten Beschreibungserstellung weiter zu steigern.

Ausblick

Die Machbarkeitsstudie zeigt, dass eine KI-gestützte Katalogisierung philatelistischer Exponate trotz der hohen fachlichen Komplexität der Domäne grundsätzlich realisierbar ist und durch die Automatisierung der initialen Beschreibung eine spürbare Entlastung für das Auktionshaus erzielen kann. Das Projekt zeigt eindrucksvoll, wie moderne Data Science und generative KI traditionelles Expertenwissen ergänzen können, anstatt es zu ersetzen. Unter dem Motto „Katalogtexte neu gedacht“ wird demonstriert, wie intelligente Automatisierung selbst in hochspezialisierten Nischenmärkten den Aufwand bei repetitiven Arbeiten enorm reduzieren kann.