Zusammenstellung von Bilddatensätzen

Wenn Sie mit der Zusammenstellung von Bildern für das ViDi-Projekt beginnen, sollten die Bilder mit Angaben zur Fertigungsstraße, zum Datum, zum Produkt usw. versehen werden.

Tipp: Je mehr Informationen Sie – insbesondere durch die Benennung der Bilddatei – angeben, desto flüssiger kann ViDi programmiert werden. Nachdem die Bilder zusammengestellt wurden, können sie in Datensätze mit Beispielbildern organisiert werden.

Der wichtigste Faktor bei der Programmierung von ViDi ist die Erstellung eines Bilddatensatzes, der darauf basiert, was die Software in der Bereitstellungsphase vermutlich antreffen wird. Die Bilder sollten alle Informationen enthalten, die dafür notwendig sind, dass ViDi die richtige Entscheidung trifft. Suchen Sie nach Szenarien, in denen menschliche Inspektoren die Teile in die Hand nehmen und zur Prüfung auf Fehler hierhin und dahin drehen würden. Das weist darauf hin, dass Sie vermutlich gedrehte Aufnahmen oder Beleuchtung benötigen, um diese Fehler zu erfassen.

In einem anderen Szenario würde ein menschlicher Inspektor Staub oder Öl auf einem Teil sehen, es in die Hand nehmen und den Staub bzw. das Öl abwischen. Wenn Staub bzw. Öl mit einem Fehler verwechselt werden können, muss ViDi über den Staub/das Öl in Kenntnis gesetzt werden.

Dieses Bilddatensatz muss das gesamte Spektrum möglicher Varianten enthalten, die von der Kamera aufgenommen werden können. Das Ziel ist es, den Datensatz ordnungsgemäß zu verallgemeinern.

Die Verallgemeinerung bezeichnet ein Deep-Learning-Konzept, mit dem bestimmt wird, wie effektiv die Werkzeuge sein werden, wenn sie auf neu aufgenommene Bilder angewendet werden, die nicht während des Trainings verwendet wurden. Ein gut verallgemeinertes Werkzeug funktioniert bei neuen Daten gut. In diesem Szenario passt das Modell, das vom neuronalen Netz geformt wurde, auf den ursprünglichen Lerndatensatz und auf neue Daten, die es in neuen Bildern findet.