Wie einen zusätzlichen Parameter zu einem CNN hinzufügen während des Trainings

stimmen
0

Also, ich habe ein Netzwerk zu trainieren, wo ich ein Bild, Boden-Wahrheit, und einen zusätzlichen Parameter im Zusammenhang mit einem Bild (aktuelle Bildzustand).

Es gibt eine Kamera, die Bilder mit verschiedenen Zoom-Ebene erfasst. Für eine bestimmte Umgebung, habe ich vier Bilder mit verschiedenen Zoomstufen (0,25,50,75). Ich brauche das Netzwerk, so dass gegebene ein Testbild zu trainieren, ich klassifizieren kann, wenn ich aus vergrößern oder verkleinern möge.

Also, der Datensatz ich habe, ist das Bild, Ground-Truth (vergrößern oder verkleinern oder kein Zoom) und die aktuelle Zoomstufe.

Wie kann ich diese aktuelle Zoomstufe in meinem Netzwerk hinzufügen, so dass das Netzwerk richtig trainiert?

Ich plane VGG oder AlexNet jetzt zu verwenden und dann zu Inception oder RESNET in Zukunft zu bewegen.

Veröffentlicht am 19/12/2018 um 14:20
quelle vom benutzer
In anderen Sprachen...                            


1 antworten

stimmen
2

Was Sie tun können, ist es, ein Modell erstellen, die das Bild über CNN verarbeitet und kombiniert dann irgendwie andere Eingaben in das Modell. So Ihr Modell ein paar Eingänge haben sollte: Bild (vergrößern oder verkleinern oder keinen Zoom), aktuelle Zoomstufe. So passieren Sie das Bild auf CNN (oder wenige CNN-Schichten) und dann die Merkmalskarte abflachen und andere Eingabewerte anhängen und dann durch einige andere Schichten fortsetzen. Oder erweitern Sie das Bild auf dem Anfang (wenn Sie verkleinern haben, zoom out ...) und dann das Bild auf CNN übergeben. Ich weiß nicht, welchen Rahmen verwenden Sie, aber ich weiß, ich würde versuchen, es mit funktionalen API in Keras bis zum Prototyp.

Beantwortet am 19/12/2018 um 15:12
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more