docs/ps-bericht-ibm

changeset 25:969a0359b72a

added pictures and new content about the vision module
author schnalke@localhost.localdomain
date Fri, 13 Jun 2008 08:37:45 +0200
parents b974f5895449
children 9d9e198cf876
files pics/101balls.png pics/captured-area.png taetigkeit.tex
diffstat 3 files changed, 28 insertions(+), 1 deletions(-) [+]
line diff
     1.1 Binary file pics/101balls.png has changed
     2.1 Binary file pics/captured-area.png has changed
     3.1 --- a/taetigkeit.tex	Thu Jun 12 15:35:28 2008 +0200
     3.2 +++ b/taetigkeit.tex	Fri Jun 13 08:37:45 2008 +0200
     3.3 @@ -113,7 +113,34 @@
     3.4  Dieses Problem löste sich ziemlich gut, indem wir deine wahrscheinliche Ballposition (ausgehend von der bisherigen Bewegung) annahmen, falls er nicht gefunden wurde. Wurde er jedoch über mehrere Zyklen nicht gefunden, sollte zuerst der Roboter der dem Ball wahrscheinlich am nächsten war, eine Befreiungsbewegung ausführen. War der Ball dann immer noch verschwunden, sollten alle Roboter die Bewegung ausführen. Brachte dies den Ball noch immer nicht zum Vorschein, dann war er vermutlich außerhalb des Spielfeldes und die Roboter sollten in ihre Ruhestellung fahren und warten \dots bis der Ball wieder auftauchen würde.
     3.5  
     3.6  
     3.7 -\section{Bilderkennung}
     3.8 +\section{Die Vision}
     3.9 +Für dieses Modul war zwar hauptsächlich meine Kollegin zuständig, jedoch möchte ich der Vollständigkeit halber ein paar Informationen dazu hier anführen.
    3.10 +
    3.11 +In jedem Zyklus holte das Vision-Modul zunächst ein Bild von der Kamera. Dieses wurde auf etwa 200x150 Pixel verkleinert um Rechenzeit zu sparen und noch invertiert. Dann wurde mit \emph{Haar-like features} nach einem Ball gesucht. Von den gefundenen Bällen wurden diejenigen aussortiert, die außerhalb der Spielfläche waren. Waren dann noch immer mehr als ein erkannter Ball übrig, wurde derjenige Ball ausgewählt, der ausgehend von der letzten Position am wahrscheinlichsten war. Als Resultat lieferte das Modul die Koordinaten des Balles, oder zeigte, dass kein Ball gefunden wurde.
    3.12 +
    3.13 +\begin{figure}[hbt]
    3.14 +	\centering
    3.15 +	\label{fig:captured-area}
    3.16 +	\includegraphics[width=0.5\textwidth]{pics/captured-area.png}
    3.17 +	\caption{Von der Kamera aufgenommener Bereich}
    3.18 +\end{figure}
    3.19 +
    3.20 +\paragraph{Heuristik}
    3.21 +Bilderkennung ist nicht deterministisch und so können bei mehreren Durchläufen mit gleichen Eingangsbild unterschiedliche Bälle gefunden werden. Dies führte dazu, dass bei uns manchmal kein Ball gefunden wurde obwohl einer vorhanden war, ebenso wie gefundene Bälle an Stellen, wo keine waren. Insbesondere die Roboterarme wurden von Zeit zu Zeit als Ball erkannt.
    3.22 +
    3.23 +Auch sonst lief bei der Bilderkennung nicht alles so, wie wir uns das dachten --- es scheint fast, als gäbe es dafür ganz eigene Regeln. Unsere Trainingsbilder waren allesamt von einem ganz anderen Ball, als wir nacher verwendeten. Das beste Ergebnis lieferte dann ein früher Test mit nur etwa hundert Fotos; mit mehr Fotos wurde das Ergebnis nur schlechter. Die Größe des Balles war (abgesehen von der Helligkeit natürlich) der wichtigste Einflussfaktor auf den Erkennungserfolg. Das Oberflächenmaterial und die -bemalung wirkten sich kaum aus. Unser Ball hatte am Ende sogar große schwarze Punkte auf weißem Untergrund (in Anlehnung an den ``Europass'', den Ball der EM 2008), ohne dass die Erkennungsrate merklich schlechter wurde.
    3.24 +
    3.25 +\begin{figure}[hbt]
    3.26 +	\centering
    3.27 +	\label{fig:101balls}
    3.28 +	\includegraphics[width=0.7\textwidth]{pics/101balls.png}
    3.29 +	\caption{Unsere Trainingsbilder}
    3.30 +\end{figure}
    3.31 +
    3.32 +\paragraph{Ergebnis}
    3.33 +Alles in allem können wir aber sehr zufrieden mit unserer Ballerkennung sein. Wir haben eine konstante Erfolgsrate von über 90\% und schlechtes Licht oder ein teilweise verdeckter Ball wirken sich wenig aus. Gleichzeitig ist auch die Rate der Fehlerkennungen recht gering. Durch das invertierte Bild und hellem Ball auf dunklem Grund haben wir sowieso fast alle Fehlermöglichkeiten ausgeschlossen. Mit einem matten Untergrund war dann wirklich die letzte Irritationsgefahr gebannt und unser Vision-Modul arbeitete äußerst zuverlässig.
    3.34 +
    3.35 +% FIXME: add picture of facedetect
    3.36  
    3.37  
    3.38  \section{Auf der Messe}