Intel C++-Compiler und VTune für Linux

Installation und Verwendung

Das knapp 64 MByte große Paket können Sie sich von der Intel-Website herunterladen oder gleich von der Compact-CD kopieren. Sie benötigen lediglich noch den Lizenzschlüssel, den Sie hier anfordern können und als Attachment per E-Mail erhalten.

Diese Lizenzdatei kopieren Sie nach /opt/intel/licenses, ansonsten unterbricht das Installations-Script mit einer Frage nach dem Speicherort der Datei. Das gezippte Tarball entpacken Sie in ein temporäres Verzeichnis und starten dann ./install.sh, um die eigentliche Installation anzustoßen. Je nach Prozessor wählt das Script das richtige RPM aus und richtet es auf dem System im Verzeichnis /opt/intel_cc_80/ ein.

Ein erster Test mit dem Apache-Webserver soll zeigen, dass der Compiler richtig installiert ist. Holen Sie sich dazu zunächst den Sourcecode von www.apache.org und entpacken Sie das gezippte Tarball in ein Verzeichnis.

gunzip httpd-<version>
tar -xf httpd-<version>

Damit der Intel-Compiler funktioniert, benötigt er einige Umgebungsvariablen. Diese lassen Sie am besten automatisch vom mitgelieferten Script setzen:

source /opt/intel_cc_80/bin/iccvars.sh

Im nächsten Schritt gilt es, den Build-Vorgang für den Apache zu konfigurieren. Dazu dient das Script configure im Source-Verzeichnis von Apache. Das Script entnimmt einige Informationen aus Umgebungsvariablen, so zum Beispiel den zu verwendenden Compiler (CC) und die passenden Startoptionen (CCFLAGS). Danach reichen Aufrufe von make undmake install, um den neu kompilierten Webserver zu installieren.

cd httpd-<version>
CC="icc" CCFLAGS="-O3 -xN -tpp7" ./configure
make
make install

Ein anschließender Aufruf von

/usr/local/apache2/apachectl start &

und ein Laden der URL http://localhost mit einem Browser überprüfen, ob alles wie gewünscht funktioniert hat. Die verwendeten Kommandozeilen-Parameter in CCFLAGS weisen den Compiler an, aggressive Optimierungen zu verwenden (-O3), speziellen Code für Pentium 4 zu erzeugen (-xN) und Optimierungen für Pentium 4 vorzunehmen (-tpp7). Der Parameter -xN sorgt dafür, dass das erzeugte Binary nur auf P4-Systemen läuft.

Wenn Sie stattdessen -axN angeben, generiert der Compiler im Zweifelsfall eine generische IA-32-Funktion und eine speziell auf P4 angepasste. Dadurch wird allerdings das Binary größer und etwas langsamer, weil jeweils auf die Prozessorarchitektur geprüft wird, bevor eine entsprechende Funktion aufgerufen wird. Weitere Möglichkeiten für die Schalter -x und -ax sind k für Pentium III, B für Pentium-M und P für Prescott-Systeme.