Hardware-Review

Das ThinkPad, das meine Meinung zu lokalen LLMs geändert hat

Ein skeptischer Blick auf ein Strix-Halo-ThinkPad mit Unified Memory. Ich habe es mit niedrigen Erwartungen gekauft und bin überrumpelt, wie sehr ich es mag.

Ramazan Yavuz
Ramazan Yavuz ·

Ich habe lange Maschinen mit dGPU bevorzugt für alles, was ernsthaft mit lokalen Modellen zu tun hat. Eine 16-GB-Mobil-GPU war für mich die Untergrenze brauchbarer Größe, und alles darunter hieß "ich werde sowieso die API anrufen". Das war eine vernünftige Annahme, bis Strix Halo herauskam. Das mentale Modell, das ich hatte, ist daran gescheitert.


Strix Halo bündelt eine APU mit einer großen integrierten GPU und Unified Memory. Im ThinkPad, das ich getestet habe, gibt es 64 GB LPDDR5X, von denen die GPU nehmen kann, was sie braucht. Das ist die Zahl, die mein altes mentales Modell kaputt macht. Eine 16-GB-mobile-dGPU ist eine harte Grenze: über 16 GB modellgewichten geht nichts. Bei 64 GB Unified Memory ist die Grenze stattdessen, wie groß die Inferenz vernünftig schnell läuft. Das ist eine andere Form von Limitierung.


Der Preis war was mich in den Kauf gestoßen hat. Ein ThinkPad mit Strix Halo und 64 GB ist günstiger als ein vergleichbares System mit einer 16-GB-Mobil-dGPU. Bei dGPU-Maschinen zahlst du für die GPU, den dedizierten VRAM, das Kühlsystem, das beides bändigt, und ein Chassis, das groß genug ist, all das aufzunehmen. Bei Strix Halo zahlst du für eine APU. Das macht einen mehrere-hundert-Euro-Unterschied auf der gleichen Speicher-Bandbreite und einer ähnlich performanten Inferenz für den 30B-Class von Modellen, die ich tatsächlich nutze.


Es ist nicht das, was ich für Training nutzen würde. Es ist nicht das, was ich für 70B-Class-Modelle nutzen würde. Die Speicher-Bandbreite ist hoch für integrierte GPU-Verhältnisse, aber sie liegt unter dem, was eine RTX-4090 mobile bietet. Wenn dein Workload wirklich Bandbreite-limitiert ist (und einige sind das), wirst du den Unterschied spüren.

Es ist auch nicht das, was ich kaufen würde, wenn ich auf der Couch Cyberpunk spielen wollte. Das Spielsystem für Strix Halo ist gut, aber das ist nicht, wofür ich es gekauft habe.


Mein typischer Workflow nutzt das Gerät als Mobil-Workstation für lokal-getriebene Code-Assistenten und Parsing-Lasten. Ein 14B- oder 32B-instruction-tuned Modell läuft komfortabel mit Q4_K_M, mit einer Antwortlatenz, die in Coding-Sessions nicht im Weg ist. Embedding-Modelle laufen gleichzeitig im Hintergrund. Wenn ich umsteige auf einen Wireshark- oder Profiler-Workload, geht der RAM, den die GPU genutzt hat, an die CPU zurück. Das ist die Geschichte des Unified Memory: kein dedizierter VRAM, der für andere Aufgaben unbenutzbar ist.

Drei Stunden Akkulaufzeit unter dieser Belastung sind realistisch. Acht Stunden bei reiner Schreibarbeit auch. Das Gerät ist passiv kühler unter Last als die meisten dGPU-ThinkPads, die ich besessen habe, weil es nichts tut, was eine 80-W-GPU machen würde.


Das ist immer noch ein ThinkPad. Die Tastatur ist die Tastatur. Das Trackpoint ist da. Die Service-Klappe öffnet sich mit einem normalen Schraubendreher. Die SSD ist tauschbar. Das WLAN-Modul ist tauschbar. Es gibt einen LTE-Slot, der auf eSIM und physisch beschäftigbar ist. Die Webcam hat einen physischen Verschluss. Das Gehäuse fühlt sich an wie alle ThinkPads der letzten zehn Jahre, mit dem leichten Sub-1.5kg-Gewicht der modernen P-Serie.


Linux läuft auf der Maschine, was nicht selbstverständlich war. Strix Halo ist neue Hardware, und der Kernel-Support kam in Etappen. Auf dem aktuellen 6.x-Kernel funktionieren WLAN, Audio, Suspend, Tastatur-Backlight, Lüftersteuerung und integrierte GPU out of the box. Hibernate funktioniert mit der richtigen swap-Datei. Externes HDMI funktioniert. USB-C-Display-Out funktioniert. Was fehlt: einige der herstellerspezifischen Power-Tuning-Tools. Aber TLP, auto-cpufreq und das normale powermanagement-Stack tun das, was sie immer tun.


Das Gerät ist nicht für jeden. Wenn dein Workflow auf einer 4090 oder größer aufsetzt, ist es nicht das richtige. Wenn du große Trainingsläufe lokal willst, ist es nicht das richtige. Wenn du das stillste, leichteste, am-längsten-laufende Notebook willst und keine LLM-Workloads auf der Maschine machst, gibt es bessere Optionen für deine Geldbörse.

Aber wenn du, wie ich, jeden Tag mit lokalen Modellen arbeitest, einen Mobil-Workflow brauchst und eine Maschine willst, die diese Workflows ohne dGPU-Kompromisse trägt – dann ist Strix Halo der erste Punkt im Markt, an dem die Rechnung anders aufgeht. Es hat mein mentales Modell von "lokal heißt Workstation" zu "lokal kann Laptop sein" verschoben, und das ist eine größere Änderung, als ich erwartet habe.