Bilddatensätze mit Trainingsbeispielen

Die ViDi-Werkzeuge basieren auf Deep Learning. Dabei wird ein neuronales Netz eingelernt, indem Daten eingespeist werden, aus denen die Maschine ableitet, was erreicht werden soll. Daher sind die in das Netz eingespeisten Daten von grundlegender Bedeutung. Fragen Sie sich daher: „Was bringe ich dem Netz bei?“

Was Sie dem Netz beibringen, basiert auf dem Bilddatensatz mit den Trainingsbeispielen. Der Bilddatensatz mit Trainingsbeispielen stellt die Daten dar, die Sie in das Netz einspeisen. Für die ViDi-Werkzeuge stellen Bilder das Rückgrat des Datensatzes dar, der für das Training der Werkzeuge verwendet wird. Beim Deep Learning wird ein großer Datensatz in das System eingespeist, und das System leitet anschließend aus den Daten ab, was eigentlich erreicht werden soll. Daher sind die Daten – in unserem Fall Bilder – absolut entscheidend.

Im Deep-Learning-Bereich sind die Bildlerndatensätze die Daten, die in das Netz eingespeist werden. Wenn Sie den Bildlerndatensatz zusammenstellen, müssen folgende Aspekte beachtet werden:

Ist mein Bildlerndatensatz für Laufzeitbilder repräsentativ? Das umfasst Folgendes:
- Beleuchtung – Wenn die Beleuchtung variieren kann, sollte der Lerndatensatz die Beleuchtungsvarianten enthalten, die in der Laufzeit erwartet werden.
- Farbe – Ändern Teile in der Laufzeit ihre Farbe? Dann sollten alle Farbvarianten enthalten sein.
- Drehung/Skalierung – Kann ein Teil gedreht sein oder kann seine Größe unterschiedlich sein, wenn es vor die Kamera gelangt? Dann sollten diese Varianten enthalten sein.
- Teilevarianten – Wenn an den inspizierten Teilen kleine Abweichungen auftreten können, sollten diese in den Lerndatensatz aufgenommen werden.
- Hintergrund – In vielen Fällen werden die Bilder Ihres Teils auf dem Schreibtisch aufgenommen. In der Laufzeit laufen die Teile jedoch auf einem Förderband, das wesentlich interessantere Hintergründe für die ViDi-Werkzeuge bietet. In diesem Fall benötigen Sie einen Lerndatensatz mit dem Teil auf dem Förderband. Wenn der Hintergrund bei der Inspektion nicht wichtig ist, können Sie ihn maskieren. Dadurch wird in der Regel die Leistung des Werkzeugs verbessert, weil das Netz nicht mit belanglosen Informationen trainiert wird.
Enthält mein Bildlerndatensatz genug Daten? Viele Probleme, die bei der Programmierung von ViDi-Werkzeugen auftreten, können durch mehr Bilder und Daten und das anschließende Neutrainieren der Werkzeuge gelöst werden.

Tipp: Wenn Sie Bilder kennzeichnen, d. h. beschreibende Informationen in den Dateinamen (z. B. „gültig“, „ungültig“ usw.) angeben, können Sie den Prozess des Labelns der Bilder beschleunigen.

Nachdem die Bilder kategorisiert und zusammengestellt wurden, können Sie einen Bildbeispielsatz erstellen und diesen in Ihrem Lerndatensatz verwenden.