rev |
line source |
schnalke@0
|
1 \chapter{Das Projekt}
|
schnalke@0
|
2
|
schnalke@0
|
3 Das Projekt an dem ich gearbeitet habe, trägt die Bezeichnung ``Real Time Showcase mit dem Cell/B.E. Mikroprozessor: Implementierung einer optisch gesteuerten Produktionseinheit''.
|
schnalke@0
|
4
|
schnalke@0
|
5 Es war eines der \emph{IBM Speedteams} in diesem Jahr. Die offizielle Beschreibung dafür lautete folgendermaßen:
|
schnalke@0
|
6 \begin{quotation}
|
schnalke@0
|
7 Der revolutionäre Superchip Cell wurde in Kooperation von Sony, Toshiba und IBM für Sonys Playstation 3 entwickelt. Er wird derzeit in der Playstation 3 und dem IBM Blade Server QS21 eingesetzt. Aufgrund seiner herausragenden Architektur eignet sich der Cell Chip in besonderer Art und Weise für Echtzeit-Datenverarbeitung. Ziel dieses Projekts ist es einen Showcase zu implementieren, der die Leistungsfähigkeit des Cell/B.E.s für Echtzeit-Aufgaben unter Beweis stellt. Hierbei werden vier Roboterarme von zwei Kameras gesteuert. Das Speedteam wird die Ablaufsteuerung der Roboterarme implementieren, damit diese gemeinsam eine Aufgabe erledigen können. Die Kameras werden dabei die Roboterarme kontrollieren. Die Ansteuerung der Roboterarme ist bereits vorhanden, so dass sich dieses Projekt voll auf die Cell/B.E. Programmierung, die optische Datenverarbeitung mit OpenCV und die Algorithmen zur Ablaufsteuerung konzentriert. Als Student haben Sie die Möglichkeit - im wahrsten Sinn des Wortes - Ihre Programmierung anzufassen. Sie Programmieren auf dem interessantesten Prozessor der derzeit auf dem Markt ist und zudem gewinnen Sie Einblick in die Echtzeit-Datenverarbeitung.
|
schnalke@0
|
8 \end{quotation}
|
schnalke@0
|
9
|
schnalke@0
|
10
|
schnalke@0
|
11 Begonnen wurde das Projekt im April 2007. Seitdem arbeiten Studenten daran.
|
schnalke@0
|
12
|
schnalke@0
|
13 Der erste Student hatte die Grundlagen gelegt indem er die low-level Kommunikation mit dem Roboter, die Inverse Kinematik\footnote{Berechnung der Gelenkwinkel zum Erreichen eines bestimmten Punktes} und ein erstes Framework für die Programmierung des Cell-Prozessors erstellt hat. Zum Einsatz kamen Lynx6-Roboterarme, die im Abschnitt \ref{robotarme} noch genauer beschrieben werden.
|
schnalke@0
|
14
|
schnalke@0
|
15 Sein Nachfolger arbeitete während seiner Masterarbeit vor allem an den mathematischen Berechnungen der Inversen Kinematik in allgemeiner Form. Seine Arbeit bezieht sich auf einen Industrie Roboter mit sechs Freiheitsgraden, der leider nicht beschafft werden konnte. Somit simulierte er seine Berechnungen nur.
|
schnalke@0
|
16
|
schnalke@0
|
17 Student Nummer drei, und damit mein Vorgänger und Kollege, denn er verweilte ein ganzes Jahr im Unternehmen, programmierte während seiner Zeit ein umfassendes Framework um die ganzen low-level Angelegenheiten zu abstrahieren. Dies erleichterte die Programmierung ungemein. Zudem band er \emph{OpenCV} zur visuellen Erkennung mit ein.
|
schnalke@0
|
18
|
schnalke@0
|
19 Ich war nun der vierte Student der am Projekt arbeitete. Einen Monat nach mit kam noch eine weitere Studentin hinzu. Somit waren wir in der Zeit zwischen April und FIXME zu Dritt.
|
schnalke@0
|
20
|
schnalke@0
|
21
|
schnalke@0
|
22 \section{Zielsetzung}
|
schnalke@0
|
23
|
schnalke@0
|
24 % FIXME: refactor that text
|
schnalke@0
|
25 Momentan werden in der Industrie Roboter über DSPs angesteuert, welche nur schwierig programmiert werden können, da spezielle Kenntnisse nötig sind. Grundgedanke dieses Projektes ist es, dieses Manko durch den Einsatz der SPUs des Cell- Prozessors aufzuheben. Da die Cell-Architektur die Programmiersprache C und Linux unterstützt, können so auf einfachem Wege schnell Robotersteuerungen entwickelt werden ohne spezielle DSP und FPGA Entwicklung zu betreiben. Dies würde den Zeitfaktor neuer Entwicklung dramatisch senken.
|
schnalke@0
|
26 Ein weiterer Aspekt der Cell-Architektur ist die extrem hohe Skalierbarkeit und die äußerst geringe Latenz dank mehrerer Prozessorelemente auf einem Chip. Da eine SPU das vielfache eines DSPs leistet und bis zu acht SPUs auf einem Cell-Core Platz finden ist es denkbar komplette Fertigungsstraßen durch dieses System zu ersetzen.
|
schnalke@0
|
27 Kombiniert man nun beide Welten, DSP und Standard Computer, erhält man DSP-ähnliche Applikationen unter einem Linux Betriebssystem gekoppelt mit einer enormen Rechenleistung der nächsten Generation.
|
schnalke@0
|
28
|
schnalke@0
|
29
|
schnalke@2
|
30 Im Laufe des Praktikums soll ein Roboter Controller Framework entstehen, welches auf der Cell-
|
schnalke@2
|
31 Architektur von IBM basieren soll. Momentan werden in der Industrie Roboter über DSPs
|
schnalke@2
|
32 angesteuert, welche nur schwierig programmiert werden können, da spezielle Kenntnisse nötig sind.
|
schnalke@2
|
33 Grundgedanke dieses Projektes ist es, dieses Manko durch den Einsatz der SPUs des Cell-
|
schnalke@2
|
34 Prozessors aufzuheben. Da die Cell-Architektur die Programmiersprache C und Linux unterstützt,
|
schnalke@2
|
35 können so auf einfachem Wege schnell Robotersteuerungen entwickelt werden ohne spezielle DSP
|
schnalke@2
|
36 und FPGA Entwicklung zu betreiben. Dies würde den Zeitfaktor neuer Entwicklung dramatisch
|
schnalke@2
|
37 senken.
|
schnalke@2
|
38 Ein weiterer Aspekt der Cell-Architektur ist die extrem hohe Skalierbarkeit und die äußerst geringe
|
schnalke@2
|
39 Latenz dank mehrerer Prozessorelemente auf einem Chip. Da eine SPU das vielfache eines DSPs
|
schnalke@2
|
40 leistet und bis zu acht SPUs auf einem Cell-Core Platz finden ist es denkbar komplette
|
schnalke@2
|
41 Fertigungsstraßen durch dieses System zu ersetzen.
|
schnalke@2
|
42 Kombiniert man nun beide Welten, DSP und Standard Computer, erhält man DSP-ähnliche
|
schnalke@2
|
43 Applikationen unter einem Linux Betriebssystem gekoppelt mit einer enormen Rechenleistung der
|
schnalke@2
|
44 nächsten Generation.
|
schnalke@2
|
45
|
schnalke@2
|
46
|
schnalke@0
|
47 \section{Verwendete Technologie}
|
schnalke@0
|
48
|
schnalke@2
|
49 Unser Entwicklungssystem war ein angepasster IBM \emph{QS21}\footnote{beherbergt zwei Cell-Prozessoren mit je einem Gigabyte Arbeitsspeicher} Cell/B.E. Blade-Server. An diesem waren vier Lynx6-Roboterarme von Lynxmotion\footnote{http://lynxmotion.com} angeschlossen, und außer dem noch eine \emph{mvBlueFOX} Kamera von \emph{Matrix Vision}\footnote{http://matrix-vision.com}. Als Betriebsystem lief ein \emph{Fedora 7}\footnote{http://fedoraproject.org}.
|
schnalke@0
|
50
|
schnalke@0
|
51
|
schnalke@2
|
52 \subsection{Cell-Prozessor}
|
schnalke@0
|
53
|
schnalke@0
|
54 Ausgeschrieben \emph{Cell Broadband Engine Architecture} genannt, werde ich hier meist die Kurzformen \emph{Cell/B.E.} oder einfach nur \emph{Cell-Prozessor} verwenden.
|
schnalke@0
|
55
|
schnalke@0
|
56 Dieser Chip wurde, zwischen 2001 und 2005, in einer Kooperation von Sony, Toshiba und IBM entwickelt. Der Hauptteil der Entwicklungsarbeit wurde dabei von \ibm\ übernommen.
|
schnalke@0
|
57
|
schnalke@2
|
58 \begin{figure}[hbt]
|
schnalke@2
|
59 \centering
|
schnalke@2
|
60 \label{fig:cellbe-chip}
|
schnalke@2
|
61 \includegraphics[width=0.6\textwidth]{pics/cellbe-chip.png}
|
schnalke@2
|
62 \caption{Der Cell/B.E. Chip}
|
schnalke@2
|
63 \end{figure}
|
schnalke@2
|
64
|
schnalke@0
|
65 Bei der Cell/B.E. handelt es sich um eine heterogene Multicore-Architektur. Das bedeutet, dass der Prozessor aus mehreren Kernen besteht, die (im Gegensatz zu den x86-Multicores aber) aus verschiedenen Kerntypen bestehen. Der Cell verfügt über einen PowerPC-Kern (PPE/PPU) und acht sogenannten Synergistic Prozessor Elemente (SPE/SPU). Die PPE ist ein vollwertiger 64-bit PowerPC Kern. Er kann in herkömmlicher Weise verwendet werden, so kann darauf zum Beispiel ein Betriebsystem oder eine beliebige Anwendung laufen. Die SPEs dagegen sind für große Rechenleistung optimiert, Datentransfer-Operationen sind eher langsam.
|
schnalke@0
|
66
|
schnalke@2
|
67 \begin{figure}[hbt]
|
schnalke@2
|
68 \centering
|
schnalke@2
|
69 \label{fig:cellbe-structure}
|
schnalke@2
|
70 \includegraphics[width=0.8\textwidth]{pics/cellbe-structure.png}
|
schnalke@2
|
71 \caption{Schematischer Aufbau der Cell/B.E.}
|
schnalke@2
|
72 \end{figure}
|
schnalke@2
|
73
|
schnalke@0
|
74 Üblicherweise übernimmt die PPE die Kontrolle und verteilt die Arbeit auf die einzelnen SPEs die dann unabhängig von einander arbeiten. Die Ergebnisse fließen dann an die PPE zurück.
|
schnalke@0
|
75
|
schnalke@2
|
76 Zur Kommunikation zwischen den einzelnen Kernen stehen drei verschiedene Kommunikationsarten zur Verfügung, welche alle über den Element Interconnect Bus (EIB) abgewickelt werden.
|
schnalke@0
|
77
|
schnalke@2
|
78 \begin{itemize}
|
schnalke@2
|
79 \item \textbf{Mailboxen} Sie sind Hardwareimplementierungen von Nachrichtenwarteschlangen. Jede SPE hat drei davon. Nachrichten haben eine feste Größe von 32 Bit.
|
schnalke@2
|
80 \item \textbf{Signale} Wie auch Nachrichten umfasst ein Signal ebenfalls 32 Bit, jedoch existieren keine Warteschlangen, so dass pro Signalkanal genau ein definierter Zustand aktiv sein kann. Jede SPE hat zwei Signalkanäle.
|
schnalke@2
|
81 \item \textbf{DMA-Transfers} Hierbei wird den SPEs ermöglicht auf den allgemeinen Hauptspeicher zuzugreifen, ebenso kann die PPE so auf den lokalen Speicher einer SPE zugreifen. DMA\footnote{Direct Memory Access}-Transfers können mit bis zu 16 Kilobyte an Daten übertragen werden. Die Transfers werden vom Memory Flow Controller (MFC) der SPE durchgeführt und können somit parallel zu den aktuellen Instruktionen ablaufen.
|
schnalke@2
|
82 \end{itemize}
|
schnalke@0
|
83
|
schnalke@2
|
84 Für DMA-Transfers empfiehlt es sich, die Technik \emph{Double-Buffering} einzusetzen, bei der die nächsten Daten schon geholt werden, während mit den aktuellen noch gerechnet wird. Auf diese Weise kann die SPE nahezu voll ausgelastet werden.
|
schnalke@0
|
85
|
schnalke@2
|
86 Mailboxen und Signale werden üblicherweise vor allem für die Übertragung von Statusinformatinen verwendet.
|
schnalke@0
|
87
|
schnalke@0
|
88
|
schnalke@0
|
89
|
schnalke@2
|
90 Der Cell ist ein sehr leistungsstarker Prozessor mit einer Maximalleistung von 230 GigaFLOPS\footnote{FLoating point Operations Per Second --- übliches Maß zum Vergleich von Prozessorleistung}.
|
schnalke@0
|
91
|
schnalke@2
|
92 Er wird momentan vor allem in Sonys \emph{Playstation 3} und IBM Blade-Servern verbaut. Aber auch für Supercomputer, wie dem \emph{IBM Roadrunner}, der dieses Jahr noch fertig gestellt werden und zum ersten Mal ein PetaFLOP erreichen soll, wird er eingesetzt. Zudem plant die IBM ihn künftig in ihre Mainframes zu integrieren.
|
schnalke@2
|
93
|
schnalke@2
|
94
|
schnalke@2
|
95
|
schnalke@2
|
96 \subsection{Roboterarme} \label{robotarme}
|
schnalke@2
|
97
|
schnalke@2
|
98 Die von uns verwendeten Roboterarme sind das Modell \emph{Lynx6} vom Hersteller Lynxmotion. Die Roboter sind aus Lexan gefertigt und werden als Bausatz geliefert. Sie sind etwa 20 Zentimeter hoch und 40 lang.
|
schnalke@2
|
99
|
schnalke@2
|
100 \begin{figure}[hbt]
|
schnalke@2
|
101 \centering
|
schnalke@2
|
102 \label{fig:lynx6}
|
schnalke@2
|
103 \includegraphics[width=0.6\textwidth]{pics/lynx6.jpg}
|
schnalke@2
|
104 \caption{Die von uns verwendeten Roboterarme}
|
schnalke@2
|
105 \end{figure}
|
schnalke@2
|
106
|
schnalke@2
|
107 Sie haben fünf Freiheitsgrade (Basisdrehung, Schulter, Ellenbogen, Handgelenk, Handdrehung) und damit einen weniger als gängige Industrieroboter oder der menschliche Arm. Die Zahl ``6'' in der Modellbezeichnung rührt von einem sechsten Gelenk her, das jedoch nur ein Greifer ist und damit keinen weiteren Freiheitsgrad darstellt.
|
schnalke@2
|
108
|
schnalke@2
|
109 Die Bewegung der Gelenke wird von Servomotoren\footnote{Motoren die bestimmte Positionen anfahren und halten können. Häufig im Modellbau eingesetzt.} (kurz ``Servos'') übernommen.
|
schnalke@2
|
110
|
schnalke@2
|
111 Angeschlossen sind die Roboterarme über USB am Cell-Blade und per serieller Schnittstelle am Roboter, dazwischen sitzt ein USB-zu-Seriell-Konverter.
|
schnalke@2
|
112
|
schnalke@2
|
113
|
schnalke@2
|
114
|
schnalke@2
|
115 \subsection{Kamera}
|
schnalke@2
|
116
|
schnalke@2
|
117 Die optische Komponente wurde erst kurz vor meiner Zeit in das Projekt eingeführt. Anfangs wurde noch eine handelsübliche Webcam verwendet. Später wurde diese durch eine professionelle CCD-Kamera der Firma \emph{Matrix Vision} ersetzt. Bei dieser handelt es sich um eine \emph{mvBlueFOX}, die 100 Mal pro Sekunde ein Schwarz-Weiß-Bild mit ein einer Auflösung von 640x480 Pixeln liefert.
|
schnalke@2
|
118
|
schnalke@2
|
119 \begin{figure}[hbt]
|
schnalke@2
|
120 \centering
|
schnalke@2
|
121 \label{fig:mvbluefox}
|
schnalke@2
|
122 \includegraphics[width=6cm]{pics/mvbluefox.jpg}
|
schnalke@2
|
123 \caption{Unsere Kamera}
|
schnalke@2
|
124 \end{figure}
|
schnalke@2
|
125
|
schnalke@2
|
126 Zur Bilderkennung verwendeten wir die Open Source Bibliothek \emph{OpenCV}, welche auf den Cell portiert und dafür optimiert ist.
|
schnalke@2
|
127
|
schnalke@2
|
128
|
schnalke@2
|
129 % FIXME: Echtzeit-Umgebung
|
schnalke@0
|
130
|
schnalke@0
|
131
|
schnalke@0
|
132 \section{Ausgangssituation}
|
schnalke@0
|
133
|
schnalke@2
|
134 Als ich meine Arbeit antrat waren folgende Dinge bereits vorhanden.
|
schnalke@2
|
135 \begin{itemize}
|
schnalke@2
|
136 \item Framework das die ganze low-level Kommunikation zwischen den SPEs regelt
|
schnalke@2
|
137 \item Scheduler der die einzelnen Programmmodule verwaltet und die Echtzeiteinhaltung kontrolliert
|
schnalke@2
|
138 \item Inverse Kinematik für den Roboterarm
|
schnalke@2
|
139 \item Programme mit statischen Bewegungsanweisungen für den Roboter
|
schnalke@2
|
140 \item Einfache dynamische Bewegungen anhand von Gesichtserkennung mit OpenCV
|
schnalke@2
|
141 \end{itemize}
|
schnalke@0
|
142
|
schnalke@2
|
143 Die alten Arbeiten meiner Vorgänger waren abgeschlossen und mein Teampartner, der schon ein halbes Jahr bei IBM war und während dieser Zeit das Framework ausgearbeitet hatte, feilte daran nur noch herum. Somit fand mit mir eine Art Neubeginn statt. Das Ziel war die \emph{Automatica} eine Messe für Automatisierungstechnik in München. Dafür sollte ein neuer Showcase erstellt werden.
|
schnalke@0
|
144
|
schnalke@2
|
145 Innerhalb unseres Teams hatte jeder ein Fachgebiet, für das er sich zuständig fühlte. Jedoch arbeiteten wir natürlich gemeinsam am Ganzen und in einer so kleinen Gruppe ist es normal, dass jeder an beliebiger Stelle anpackt wenn es erforderlich ist. Dennoch formierte es sich so, dass mein Teampartner hauptsächlich für das (sein) Framework und Installationen aller Art verantworklich war, zudem hatte er als der mit der meisten Erfahrung die Rolle des Projektleiters inne. Unsere Mitarbeiterin, die einen Monat nach mir dazu stieß, kümmerte sich um die visuelle Thematik. Ich übernahm den Teil der eigentlichen Anwendungsprogrammierung. Das heißt, dass ich die Arbeit der Anderen als Basis nahm um darauf die Anwendungsteile zu konstruieren, die spezifisch für unseren Showcase waren.
|
schnalke@0
|
146
|