docs/ps-bericht-ibm

annotate das-projekt.tex @ 6:f9e5c2cf48c3

new picture
author schnalke@localhost.localdomain
date Thu, 08 May 2008 16:30:44 +0200
parents d7564f4705a9
children cfa79cdfad27
rev   line source
schnalke@0 1 \chapter{Das Projekt}
schnalke@0 2
schnalke@0 3 Das Projekt an dem ich gearbeitet habe, trägt die Bezeichnung ``Real Time Showcase mit dem Cell/B.E. Mikroprozessor: Implementierung einer optisch gesteuerten Produktionseinheit''.
schnalke@0 4
schnalke@0 5 Es war eines der \emph{IBM Speedteams} in diesem Jahr. Die offizielle Beschreibung dafür lautete folgendermaßen:
schnalke@0 6 \begin{quotation}
schnalke@0 7 Der revolutionäre Superchip Cell wurde in Kooperation von Sony, Toshiba und IBM für Sonys Playstation 3 entwickelt. Er wird derzeit in der Playstation 3 und dem IBM Blade Server QS21 eingesetzt. Aufgrund seiner herausragenden Architektur eignet sich der Cell Chip in besonderer Art und Weise für Echtzeit-Datenverarbeitung. Ziel dieses Projekts ist es einen Showcase zu implementieren, der die Leistungsfähigkeit des Cell/B.E.s für Echtzeit-Aufgaben unter Beweis stellt. Hierbei werden vier Roboterarme von zwei Kameras gesteuert. Das Speedteam wird die Ablaufsteuerung der Roboterarme implementieren, damit diese gemeinsam eine Aufgabe erledigen können. Die Kameras werden dabei die Roboterarme kontrollieren. Die Ansteuerung der Roboterarme ist bereits vorhanden, so dass sich dieses Projekt voll auf die Cell/B.E. Programmierung, die optische Datenverarbeitung mit OpenCV und die Algorithmen zur Ablaufsteuerung konzentriert. Als Student haben Sie die Möglichkeit - im wahrsten Sinn des Wortes - Ihre Programmierung anzufassen. Sie Programmieren auf dem interessantesten Prozessor der derzeit auf dem Markt ist und zudem gewinnen Sie Einblick in die Echtzeit-Datenverarbeitung.
schnalke@0 8 \end{quotation}
schnalke@0 9
schnalke@0 10
schnalke@0 11 Begonnen wurde das Projekt im April 2007. Seitdem arbeiten Studenten daran.
schnalke@0 12
schnalke@0 13 Der erste Student hatte die Grundlagen gelegt indem er die low-level Kommunikation mit dem Roboter, die Inverse Kinematik\footnote{Berechnung der Gelenkwinkel zum Erreichen eines bestimmten Punktes} und ein erstes Framework für die Programmierung des Cell-Prozessors erstellt hat. Zum Einsatz kamen Lynx6-Roboterarme, die im Abschnitt \ref{robotarme} noch genauer beschrieben werden.
schnalke@0 14
schnalke@0 15 Sein Nachfolger arbeitete während seiner Masterarbeit vor allem an den mathematischen Berechnungen der Inversen Kinematik in allgemeiner Form. Seine Arbeit bezieht sich auf einen Industrie Roboter mit sechs Freiheitsgraden, der leider nicht beschafft werden konnte. Somit simulierte er seine Berechnungen nur.
schnalke@0 16
schnalke@0 17 Student Nummer drei, und damit mein Vorgänger und Kollege, denn er verweilte ein ganzes Jahr im Unternehmen, programmierte während seiner Zeit ein umfassendes Framework um die ganzen low-level Angelegenheiten zu abstrahieren. Dies erleichterte die Programmierung ungemein. Zudem band er \emph{OpenCV} zur visuellen Erkennung mit ein.
schnalke@0 18
schnalke@0 19 Ich war nun der vierte Student der am Projekt arbeitete. Einen Monat nach mit kam noch eine weitere Studentin hinzu. Somit waren wir in der Zeit zwischen April und FIXME zu Dritt.
schnalke@0 20
schnalke@0 21
schnalke@0 22 \section{Zielsetzung}
schnalke@0 23
schnalke@4 24 Ziel des Projekts ist es, ein Robotsteuerungs Framework zu erstellen, das auf der Cell/B.E. basiert.
schnalke@0 25
schnalke@4 26 Üblicherweise werden Roboter momentan über DSPs\footnote{Digitale Signalprozessoren} gesteuert. Diese erfordern spezielle Fachkenntnisse in der Programmierung. Mit Hilfe der Cell-Architektur soll eine Alternative geschaffen werden, die es ermöglicht auf einfache Weise Robotersteuerungen zu entwickeln. Als Werkzeuge sollen die Programmiersprache \emph{C} und das Betriebssystem \emph{GNU/Linux} zum Einsatz kommen, da diese vom Cell unterstützt werden und zudem in der Industrie bekannt sind.
schnalke@0 27
schnalke@4 28 Die Echtzeitfähigkeit die bisher für DSPs sprach kann mit dem Cell-Prozessor ebenso erreicht werden. Seine hohe Skalierbarkeit und die geringen Latenzen ermöglichen es dann sogar eine Vielzahl von Robotern, eventuell sogar ganze Fertigungsstraßen, mit nur einem Cell zu steuern.
schnalke@4 29
schnalke@4 30 Dass dies realistische Vorstellungen sind, soll nun gezeigt werden, indem ein Showcase mit vier Robotern und einer visuellen Komponente an einem System erstellt wird.
schnalke@2 31
schnalke@2 32
schnalke@0 33 \section{Verwendete Technologie}
schnalke@0 34
schnalke@4 35 Unser Entwicklungssystem war ein angepasster IBM \emph{QS21}\footnote{beherbergt zwei Cell-Prozessoren mit je einem Gigabyte Arbeitsspeicher} Cell/B.E. Blade-Server. An diesem waren vier Lynx6-Roboterarme von Lynxmotion\footnote{http://lynxmotion.com} angeschlossen, und außer dem noch eine \emph{mvBlueFOX} Kamera von \emph{Matrix Vision}\footnote{http://matrix-vision.com}. Als Betriebsystem lief ein auf den Cell portiertes \emph{Fedora\ 7}\footnote{http://fedoraproject.org} GNU/Linux.
schnalke@4 36
schnalke@4 37 \begin{figure}[hbt]
schnalke@4 38 \centering
schnalke@4 39 \label{fig:qs21}
schnalke@4 40 \includegraphics[width=0.6\textwidth]{pics/qs21.jpg}
schnalke@4 41 \caption{Ein QS21 Blade-Server mit zwei Cell-Prozessoren}
schnalke@4 42 \end{figure}
schnalke@0 43
schnalke@0 44
schnalke@2 45 \subsection{Cell-Prozessor}
schnalke@0 46
schnalke@0 47 Ausgeschrieben \emph{Cell Broadband Engine Architecture} genannt, werde ich hier meist die Kurzformen \emph{Cell/B.E.} oder einfach nur \emph{Cell-Prozessor} verwenden.
schnalke@0 48
schnalke@0 49 Dieser Chip wurde, zwischen 2001 und 2005, in einer Kooperation von Sony, Toshiba und IBM entwickelt. Der Hauptteil der Entwicklungsarbeit wurde dabei von \ibm\ übernommen.
schnalke@0 50
schnalke@2 51 \begin{figure}[hbt]
schnalke@2 52 \centering
schnalke@2 53 \label{fig:cellbe-chip}
schnalke@2 54 \includegraphics[width=0.6\textwidth]{pics/cellbe-chip.png}
schnalke@2 55 \caption{Der Cell/B.E. Chip}
schnalke@2 56 \end{figure}
schnalke@2 57
schnalke@0 58 Bei der Cell/B.E. handelt es sich um eine heterogene Multicore-Architektur. Das bedeutet, dass der Prozessor aus mehreren Kernen besteht, die (im Gegensatz zu den x86-Multicores aber) aus verschiedenen Kerntypen bestehen. Der Cell verfügt über einen PowerPC-Kern (PPE/PPU) und acht sogenannten Synergistic Prozessor Elemente (SPE/SPU). Die PPE ist ein vollwertiger 64-bit PowerPC Kern. Er kann in herkömmlicher Weise verwendet werden, so kann darauf zum Beispiel ein Betriebsystem oder eine beliebige Anwendung laufen. Die SPEs dagegen sind für große Rechenleistung optimiert, Datentransfer-Operationen sind eher langsam.
schnalke@0 59
schnalke@2 60 \begin{figure}[hbt]
schnalke@2 61 \centering
schnalke@2 62 \label{fig:cellbe-structure}
schnalke@2 63 \includegraphics[width=0.8\textwidth]{pics/cellbe-structure.png}
schnalke@2 64 \caption{Schematischer Aufbau der Cell/B.E.}
schnalke@2 65 \end{figure}
schnalke@2 66
schnalke@4 67 \begin{figure}[hbt]
schnalke@4 68 \centering
schnalke@4 69 \includegraphics[width=0.8\textwidth]{pics/cellbe-ppe-spe.png}
schnalke@4 70 \caption{Schematischer Aufbau von PPE und SPE}
schnalke@4 71 \end{figure}
schnalke@4 72
schnalke@0 73 Üblicherweise übernimmt die PPE die Kontrolle und verteilt die Arbeit auf die einzelnen SPEs die dann unabhängig von einander arbeiten. Die Ergebnisse fließen dann an die PPE zurück.
schnalke@0 74
schnalke@2 75 Zur Kommunikation zwischen den einzelnen Kernen stehen drei verschiedene Kommunikationsarten zur Verfügung, welche alle über den Element Interconnect Bus (EIB) abgewickelt werden.
schnalke@0 76
schnalke@2 77 \begin{itemize}
schnalke@2 78 \item \textbf{Mailboxen} Sie sind Hardwareimplementierungen von Nachrichtenwarteschlangen. Jede SPE hat drei davon. Nachrichten haben eine feste Größe von 32 Bit.
schnalke@2 79 \item \textbf{Signale} Wie auch Nachrichten umfasst ein Signal ebenfalls 32 Bit, jedoch existieren keine Warteschlangen, so dass pro Signalkanal genau ein definierter Zustand aktiv sein kann. Jede SPE hat zwei Signalkanäle.
schnalke@2 80 \item \textbf{DMA-Transfers} Hierbei wird den SPEs ermöglicht auf den allgemeinen Hauptspeicher zuzugreifen, ebenso kann die PPE so auf den lokalen Speicher einer SPE zugreifen. DMA\footnote{Direct Memory Access}-Transfers können mit bis zu 16 Kilobyte an Daten übertragen werden. Die Transfers werden vom Memory Flow Controller (MFC) der SPE durchgeführt und können somit parallel zu den aktuellen Instruktionen ablaufen.
schnalke@2 81 \end{itemize}
schnalke@0 82
schnalke@2 83 Für DMA-Transfers empfiehlt es sich, die Technik \emph{Double-Buffering} einzusetzen, bei der die nächsten Daten schon geholt werden, während mit den aktuellen noch gerechnet wird. Auf diese Weise kann die SPE nahezu voll ausgelastet werden.
schnalke@0 84
schnalke@2 85 Mailboxen und Signale werden üblicherweise vor allem für die Übertragung von Statusinformatinen verwendet.
schnalke@0 86
schnalke@0 87
schnalke@0 88
schnalke@2 89 Der Cell ist ein sehr leistungsstarker Prozessor mit einer Maximalleistung von 230 GigaFLOPS\footnote{FLoating point Operations Per Second --- übliches Maß zum Vergleich von Prozessorleistung}.
schnalke@0 90
schnalke@2 91 Er wird momentan vor allem in Sonys \emph{Playstation 3} und IBM Blade-Servern verbaut. Aber auch für Supercomputer, wie dem \emph{IBM Roadrunner}, der dieses Jahr noch fertig gestellt werden und zum ersten Mal ein PetaFLOP erreichen soll, wird er eingesetzt. Zudem plant die IBM ihn künftig in ihre Mainframes zu integrieren.
schnalke@2 92
schnalke@2 93
schnalke@2 94
schnalke@4 95 \subsection{Roboterarm} \label{robotarme}
schnalke@2 96
schnalke@2 97 Die von uns verwendeten Roboterarme sind das Modell \emph{Lynx6} vom Hersteller Lynxmotion. Die Roboter sind aus Lexan gefertigt und werden als Bausatz geliefert. Sie sind etwa 20 Zentimeter hoch und 40 lang.
schnalke@2 98
schnalke@2 99 \begin{figure}[hbt]
schnalke@2 100 \centering
schnalke@2 101 \label{fig:lynx6}
schnalke@2 102 \includegraphics[width=0.6\textwidth]{pics/lynx6.jpg}
schnalke@2 103 \caption{Die von uns verwendeten Roboterarme}
schnalke@2 104 \end{figure}
schnalke@2 105
schnalke@2 106 Sie haben fünf Freiheitsgrade (Basisdrehung, Schulter, Ellenbogen, Handgelenk, Handdrehung) und damit einen weniger als gängige Industrieroboter oder der menschliche Arm. Die Zahl ``6'' in der Modellbezeichnung rührt von einem sechsten Gelenk her, das jedoch nur ein Greifer ist und damit keinen weiteren Freiheitsgrad darstellt.
schnalke@2 107
schnalke@2 108 Die Bewegung der Gelenke wird von Servomotoren\footnote{Motoren die bestimmte Positionen anfahren und halten können. Häufig im Modellbau eingesetzt.} (kurz ``Servos'') übernommen.
schnalke@2 109
schnalke@2 110 Angeschlossen sind die Roboterarme über USB am Cell-Blade und per serieller Schnittstelle am Roboter, dazwischen sitzt ein USB-zu-Seriell-Konverter.
schnalke@2 111
schnalke@2 112
schnalke@2 113
schnalke@2 114 \subsection{Kamera}
schnalke@2 115
schnalke@2 116 Die optische Komponente wurde erst kurz vor meiner Zeit in das Projekt eingeführt. Anfangs wurde noch eine handelsübliche Webcam verwendet. Später wurde diese durch eine professionelle CCD-Kamera der Firma \emph{Matrix Vision} ersetzt. Bei dieser handelt es sich um eine \emph{mvBlueFOX}, die 100 Mal pro Sekunde ein Schwarz-Weiß-Bild mit ein einer Auflösung von 640x480 Pixeln liefert.
schnalke@2 117
schnalke@2 118 \begin{figure}[hbt]
schnalke@2 119 \centering
schnalke@2 120 \label{fig:mvbluefox}
schnalke@2 121 \includegraphics[width=6cm]{pics/mvbluefox.jpg}
schnalke@2 122 \caption{Unsere Kamera}
schnalke@2 123 \end{figure}
schnalke@2 124
schnalke@2 125 Zur Bilderkennung verwendeten wir die Open Source Bibliothek \emph{OpenCV}, welche auf den Cell portiert und dafür optimiert ist.
schnalke@2 126
schnalke@2 127
schnalke@2 128 % FIXME: Echtzeit-Umgebung
schnalke@0 129
schnalke@0 130
schnalke@0 131 \section{Ausgangssituation}
schnalke@0 132
schnalke@2 133 Als ich meine Arbeit antrat waren folgende Dinge bereits vorhanden.
schnalke@2 134 \begin{itemize}
schnalke@2 135 \item Framework das die ganze low-level Kommunikation zwischen den SPEs regelt
schnalke@2 136 \item Scheduler der die einzelnen Programmmodule verwaltet und die Echtzeiteinhaltung kontrolliert
schnalke@2 137 \item Inverse Kinematik für den Roboterarm
schnalke@2 138 \item Programme mit statischen Bewegungsanweisungen für den Roboter
schnalke@2 139 \item Einfache dynamische Bewegungen anhand von Gesichtserkennung mit OpenCV
schnalke@2 140 \end{itemize}
schnalke@0 141
schnalke@2 142 Die alten Arbeiten meiner Vorgänger waren abgeschlossen und mein Teampartner, der schon ein halbes Jahr bei IBM war und während dieser Zeit das Framework ausgearbeitet hatte, feilte daran nur noch herum. Somit fand mit mir eine Art Neubeginn statt. Das Ziel war die \emph{Automatica} eine Messe für Automatisierungstechnik in München. Dafür sollte ein neuer Showcase erstellt werden.
schnalke@0 143
schnalke@2 144 Innerhalb unseres Teams hatte jeder ein Fachgebiet, für das er sich zuständig fühlte. Jedoch arbeiteten wir natürlich gemeinsam am Ganzen und in einer so kleinen Gruppe ist es normal, dass jeder an beliebiger Stelle anpackt wenn es erforderlich ist. Dennoch formierte es sich so, dass mein Teampartner hauptsächlich für das (sein) Framework und Installationen aller Art verantworklich war, zudem hatte er als der mit der meisten Erfahrung die Rolle des Projektleiters inne. Unsere Mitarbeiterin, die einen Monat nach mir dazu stieß, kümmerte sich um die visuelle Thematik. Ich übernahm den Teil der eigentlichen Anwendungsprogrammierung. Das heißt, dass ich die Arbeit der Anderen als Basis nahm um darauf die Anwendungsteile zu konstruieren, die spezifisch für unseren Showcase waren.
schnalke@0 145