In vielen Branchen werden hohe Anforderungen an die Produktsicherheit und die vollständige Rückverfolgbarkeit einzelner Produkte gestellt. Hier werden Produkte bzw. deren Verpackungen mit relevanten Produktionsdaten wie Produktionsdatum, Haltbarkeit, Produktionsstandort, Chargen- und Seriennummer etc. beschriftet.
Im Rahmen der Rückverfolgbarkeit steigt parallel zur vermehrten Kennzeichnung auch die Anzahl der einzelnen Rücklese-Schritte, die ein Produkt durchläuft. Schon lange wird nicht mehr nur einmalig beim Endverbraucher oder Anwender rückgelesen, vielmehr wird entlang des gesamten Produktions- und Transportweges ein einzelnes Produkt wieder und wieder identifiziert, so dass jederzeit eine lückenlose Rückverfolgbarkeit gewährleistet ist.
Speziell bei Produkten, die in hohen Volumina produziert werden, hat sich ein Verfahren zur Beschriftung stark durchgesetzt: Continuous Inkjet, ein berührungsloses Tintenstrahl-Verfahren, bei dem die einzelnen Buchstaben und Zeichen in Form einer Punktematrix gebildet werden. Bekannte Beispiele sind Lebensmittel und pharmazeutische Produkte aber auch Datenkabel oder Adresseindrucke in Werbematerialien.
Das Continuous Inkjet Verfahren ist extrem schnell bis 600m pro Sekunde, flexibel, serialisierbar und sehr kostengünstig. Die Qualität dieses Hochgeschwindigkeits-Drucks kann jedoch stark schwanken. Die Ursachen für einen nicht-optimalen Druck sind zahlreich. So können durch ungenaue Synchronisation von Produktvorschub und Druckgeschwindigkeit Dehnungen/Stauchungen entstehen. Durch unterschiedliche Oberflächenbeschaffenheit und Oberflächenstruktur/-form können Buchstaben und Ziffern verzerrt werden. Darüber hinaus können einzelne Düsen aus verschiedenen Gründen ausfallen, zu fehlenden Punkten und damit zu unvollständigen Zeichen führt.
Für die Entwickler von Rücklese- und Track-und-Trace Systemen stellt deswegen das robuste, stabile und schnelle Lesen von Dot-Matrix Schrift eine große Herausforderung dar. Bisherige OCR Algorithmen in Machine Vision sind eher allgemein gehalten und lesen und verifizieren Schriften in vielen unterschiedlichen Anwendungsgebieten. Genau deshalb stoßen sie aber im Bereich der Dot-Print Schrift schnell an Ihre Grenzen.
Das konventionelle, template-based OCR auf Basis einer Grauwertkorrelation ist zwar ungeschlagen schnell und kommt mit wenig CPU-Ressourcen aus, arbeitet aber am besten unter konstanten Aufnahmebedingungen und nicht gut mit degradierten Zeichenketten. Häufig unterbrochene Zeichen wie im Beispiel der Dot-Matrix Schrift erschwert das Lesen zusätzlich. Das neuere geometric OCR basiert nicht auf einem Mustervergleich, sondern beschreibt anhand von Form und Features die einzelnen Zeichen. Dies erhöht die Flexibilität bezüglich Skalierung, Verzerrung, degradierten Buchstaben etc. deutlich. Beide Ansätze jedoch benötigen in jedem Fall für ein erfolgreiches Lesen eine in sich geschlossene Zeichenform. Werden Zeichen aus mehreren „Elementen“ zusammengesetzt können sie ohne Vorverarbeitung nicht gelesen werden.
Genau in dieser Vorverarbeitung - dem Schließen der einzelnen Zeichen - liegt das bisher nicht optimal gelöste Problem: Üblicherweise ist dem Leseprozess eine Kombination aus morphologischen Filteroperationen vorgeschaltet um die Zeichen in sich zu schließen ohne sie jedoch miteinander zu verbinden. Nur selten jedoch ist eine Vorverarbeitung zu finden, die mit den Spezifika der Dot-Matrix Schrift zurecht kommt. Es gibt zu viele Ausprägungen, wie einzelne Zeichen verzerrt, skaliert, unvollständig, gedehnt oder gestaucht sein können als dass sich ohne weiteres eine allgemein gültige Vorschrift für die Vorverarbeitung finden ließe. In der Praxis muss die Vorverarbeitung daher immer wieder angepasst werden oder sogar mit mehreren Vorverarbeitungsschritten experimentiert werden. Das Anpassen der Vorverarbeitung erfordert zudem Know-how in der Bildverarbeitung und ist für den Operator/Bediener im Feld kaum durchführbar.
Matrox löst jetzt dieses Problem mit einem völlig neuartigen Ansatz: einem Software-Modul, das spezifisch für Dot Print OCR entwickelt wurde und nun zum Patent angemeldet ist: SureDOT OCR.
Die Anwendung ist denkbar einfach: zunächst werden die Dot-Print Character definiert. Hierzu lädt man entweder vorhandene Definitionen z.B. für Domino Drucker oder man definiert seine eigene Punktematrix. Alle Zeichen, Sonderzeichen und Umlaute können angelegt werden. Zusätzlich gibt der Benutzer die zu erwartende Punktgröße sowie die grobe Position des zu lesenden Textes vor.
Das Modul lokalisiert daraufhin selbständig die Position, Anzahl der Textzeilen und Anzahl der zu lesenden Zeichen. Ungleichmäßiger Hintergrund, deformierte, verzerrte, gekippte und sich berührende Zeichen sind genauso wenig ein Problem wie rotierter Text, Kontrastschwankungen, unvollständige Zeichen, wellige Hintergründe etc.
Die große Stärke des neuen Algorithmus liegt in der Kombination aus der hohen Leserate zusammen mit der einfachen und eingängigen Parametrisierung. Bereits ab einer Punktgröße von 4 Pixeln wird stabil und sicher gelesen mit einer erlaubten Skalierung von 10%. Alle auftretenden Effekte und Degradierungen wie sie für Continuous Inkjet üblich sind, werden toleriert, obwohl auf jede weitere Vorverarbeitung durch die „üblichen“ Schritte der morphologischen Operationen verzichtet werden kann.
Dies ist auch der Grund, weshalb dieser neue Matrox Algorithmus Bestandteil der CIVCore Plattform von Mettler-Toledo – einem der führenden Hersteller von kamerabasierten Inspektionssystemen von Lebensmittelverpackungen – wird, wie Tobias Vancura (Head of R&D, SBU Vision Inspection) bestätigt: „Wir erwarten mit großer Spannung die neue SureDotOCR Bibliothek von Matrox, die wir in unserem nächsten Release integrieren werden. Dies wird eine Reihe neuer Anwendungen für Verpackungsindustrie ermöglichen, die es unseren Kunden erlaubt, die Produktsicherheit noch weiter zu erhöhen.“
Für Kunden in allen Branchen lassen sich mit dem neuen Tool Dot Print OCR Reader entwickeln, die im Feld robust arbeiten, äußerst leicht anpassbar sind und vor allem ohne Parametrisierung auskommen. Ein unschätzbarer Vorteil in einem Gebiet der Bildverarbeitung, das immer mehr Bedeutung gewinnt.