docs/ps-bericht-ibm: taetigkeit.tex comparison

comparison taetigkeit.tex @ 41:f72c9230d988

put label after includegraphics, for correct numbering; corrected som typos

author	meillo@marmaro.de
date	Wed, 02 Jul 2008 10:39:44 +0200
parents	c64bd51d3dd6
children	529211206f10

comparison

equal deleted inserted replaced

-:089e7feb937d
+:f72c9230d988
 Der Algorithmus sollte möglichst allgemein sein und nicht nur mit genau unserer Roboteranordnung funktionieren.
 \begin{figure}[hbt] %FIXME: where put this picture?
 	\centering
-	\label{fig:robot-terminology}
 	\includegraphics[width=0.8\textwidth]{pics/lynx6-terminology.png}
 	\caption[Terminologie des Roboterarms \source{http://lynxmotion.com, bearbeitet}]{Terminologie des Roboterarms}
+	\label{fig:robot-terminology}
 \end{figure}
 \paragraph{Das Problem}
 Kollisionserkennung ist einfach Abstandsberechnung von Objekten. Unsere Objekte sind Roboterarme, die sich als vier aneinander hängende Linien ansehen lassen --- jedenfalls aus Sicht der Kollisionserkennung. Das eigentliche Problem besteht also aus Abstandsberechnungen von Strecken (nicht Geraden) im Raum. Um nicht die komplizierte Berechnung von Streckenabständen durchführen zu müssen, habe ich jede Strecke durch eine Anzahl Punkte auf ihr ersetzt. Somit musste ich nur Punktabstände berechnen, was einfach ist; allerdings in größerer Anzahl.
 Mit unseren vier Robotern konnte ich 16 Kollisionspunkte pro Knochen einfügen, ohne besonders viel Zeit zu verbrauchen; 32 Punkte waren noch machbar. Ich entschied mich für vier Kollisionspunkt pro Knochen, denn dies führte zu einer voll ausreichenden Genauigkeit, wie Abbildung \ref{fig:kollisionszone} %FIXME: bildnr stimmt nicht!
 zeigt.
 \begin{figure}[hbt]
 	\centering
-	\label{fig:kollisionszone}
 	\includegraphics[width=0.4\textwidth]{pics/collision-zones.png}
 	\caption[Kollisionszonen]{Hervorgehobene Kollisionszone bei vier Kollisionspunkt pro Knochen}
+	\label{fig:kollisionszone}
 \end{figure}
 \paragraph{Programmablauf}
 Als Ausgangsdaten habe ich die Position und Ausrichtung der Roboter in der ``Welt'' und sämtliche Gelenkwinkel. Aus diesen Daten habe ich die Welt-Koordinaten, also Koordinaten bezogen auf das globale Koordinatensystem, aller Gelenke berechnet. Mit den globalen Koordinaten führe ich die Kollisionsberechnung durch, denn diese liegen im gleichen Koordinatensystem und Abstandberechnungen sind somit einfach: $distance = \sqrt{\Delta x^{2} + \Delta y^{2} + \Delta z^{2}}$.
 Ich habe die SVG-Generierung als separates Modul implementiert, das bei Bedarf aktiviert werden kann und dann in jedem Programm-Cycle ein Bild der Roboterstellungen zeichnet. Die Darstellung im Bild ist zwei-dimensional, da 3D-Abbilder nur bei beweglicher Kamera sinnvoll nutzbar sind. Ich habe deshalb eine Dreitafelprojektion verwendet, die auch technischen Zeichnungen und Bauplänen bekannt ist.
 \begin{figure}[hbt]
 	\centering
-	\label{fig:svg-named}
 	\includegraphics[width=0.8\textwidth]{pics/svg-named.png}
 	\caption[Generierte SVG-Grafik]{Die generierte SVG-Grafik mit Beschriftungen}
+	\label{fig:svg-named}
 \end{figure}
 \paragraph{Animation}
 Wenig später waren dann selbst die Einzelbilder teilweise zu umständlich, so dass der Wunsch nach einer animierten Darstellung des Geschehens aufkam. SVG-Animationen ausgeben zu lassen wäre deutlich komplizierter geworden, und diese können auch nur von wenigen Programmen dargestellt werden. Deshalb habe ich mit der Programmsammlung \emph{ImageMagick} aus dem SVG-Bildern ein animiertes GIF gemacht. Dieses stellte dann auch die Zeitdimension in den Bewegungen dar. Später wurden die GIFs dann durch komprimierte AVI-Filme (mit \emph{MEncoder} erstellt) ersetzt, da diese deutlich weniger Speicher verbrauchen und schneller erzeugt werden konnten.
 In jedem Zyklus holte das Vision-Modul zunächst ein Bild von der Kamera. Dieses wurde auf etwa 200x150 Pixel verkleinert um Rechenzeit zu sparen und noch invertiert. Dann wurde mit \emph{Haar-like features} nach einem Ball gesucht. Von den gefundenen Bällen wurden diejenigen aussortiert, die außerhalb der Spielfläche waren. Waren dann noch immer mehr als ein erkannter Ball übrig, wurde derjenige Ball ausgewählt, der ausgehend von der letzten Position am wahrscheinlichsten war. Als Resultat lieferte das Modul die Koordinaten des Balles, oder zeigte, dass kein Ball gefunden wurde.
 \begin{figure}[hbt]
 	\centering
-	\label{fig:captured-area}
 	\includegraphics[width=0.5\textwidth]{pics/captured-area.png}
 	\caption[Blickfeld der Kamera]{Von der Kamera aufgenommener Bereich}
+	\label{fig:captured-area}
 \end{figure}
 \paragraph{Heuristik}
 Bilderkennung ist nicht deterministisch und so können bei mehreren Durchläufen mit gleichen Eingangsbild unterschiedliche Bälle gefunden werden. Dies führte dazu, dass bei uns manchmal kein Ball gefunden wurde obwohl einer vorhanden war, ebenso wie gefundene Bälle an Stellen, wo keine waren. Insbesondere die Roboterarme wurden von Zeit zu Zeit als Ball erkannt.
 Auch sonst lief bei der Bilderkennung nicht alles so, wie wir uns das dachten --- es scheint fast, als gäbe es dafür ganz eigene Regeln. Unsere Trainingsbilder waren allesamt von einem ganz anderen Ball, als wir nacher verwendeten. Das beste Ergebnis lieferte dann ein früher Test mit nur etwa hundert Fotos; mit mehr Fotos wurde das Ergebnis nur schlechter. Die Größe des Balles war (abgesehen von der Helligkeit natürlich) der wichtigste Einflussfaktor auf den Erkennungserfolg. Das Oberflächenmaterial und die -bemalung wirkten sich kaum aus. Unser Ball hatte am Ende sogar große schwarze Punkte auf weißem Untergrund (in Anlehnung an den ``Europass'', den Ball der EM 2008), ohne dass die Erkennungsrate merklich schlechter wurde.
 \begin{figure}[hbt]
 	\centering
-	\label{fig:101balls}
 	\includegraphics[width=0.7\textwidth]{pics/101balls.png}
 	\caption[Trainingsbilder]{Unsere Trainingsbilder}
+	\label{fig:101balls}
 \end{figure}
 \paragraph{Ergebnis}
 Alles in allem können wir aber sehr zufrieden mit unserer Ballerkennung sein. Wir haben eine konstante Erfolgsrate von über 90\% und schlechtes Licht oder ein teilweise verdeckter Ball wirken sich wenig aus. Gleichzeitig ist auch die Rate der Fehlerkennungen recht gering. Durch das invertierte Bild und hellem Ball auf dunklem Grund haben wir sowieso fast alle Fehlermöglichkeiten ausgeschlossen. Mit einem matten Untergrund war dann wirklich die letzte Irritationsgefahr gebannt und unser Vision-Modul arbeitete äußerst zuverlässig.
 Erfreulich war auch, dass das Material hielt --- die Servos überstanden die hohe Belastungen.
 \begin{figure}[hbt]
 	\centering
-	\label{fig:showcase-stand}
 	\includegraphics[width=1.0\textwidth]{pics/automatica-showcase-stand.jpg}
 	\caption[Der Showcase auf der Messe \source{privat}]{Unser Showcase am Stand von Matrix Vision}
+	\label{fig:showcase-stand}
 \end{figure}
 \begin{figure}[hbt]
 	\centering
 	\includegraphics[width=0.8\textwidth]{pics/automatica-besucher.jpg}

Mercurial > docs > ps-bericht-ibm

comparison taetigkeit.tex @ 41:f72c9230d988