Test HP ZGX Nano G1n i Lenovo ThinkStation PGX – czy to najlepsza stacja robocza AI do lokalnych modeli LLM?
Rynek sztucznej inteligencji przyspiesza. Coraz więcej firm szuka rozwiązania typu stacja robocza AI, które pozwoli uruchamiać duże modele językowe lokalnie – bez chmury, bez opóźnień i bez kompromisów w zakresie bezpieczeństwa danych. Dlatego sprawdziliśmy w praktyce dwie kompaktowe jednostki oparte na układzie NVIDIA Grace GB10 Blackwell:
- HP ZGX Nano G1n
- Lenovo ThinkStation PGX
Czy rzeczywiście można mieć serwer AI na biurku? Oto nasze wnioski.
Mała obudowa, duże ambicje
Pierwsze wrażenie? Zaskoczenie. Obie jednostki są naprawdę kompaktowe – to nie klasyczny serwer ani wielka stacja robocza z kilkoma kartami GPU. Sprzęt mieści się na biurku i nie wymaga specjalnej infrastruktury. Jeśli ktoś szuka rozwiązania pod hasłem:
- „AI on-premise”
- „lokalna inferencja modeli”
- „stacja robocza do LLM”
– to dokładnie ta kategoria.
128 GB RAM robi różnicę
Największa przewaga tej platformy to 128 GB zunifikowanej pamięci RAM. Obecnie najmocniejsza profesjonalna karta Nvidia RTX PRO 6000 Blackwell, która ceną i poborem prądu znacząco przewyższa GB10 posiada jedynie 96 GB pamięci VRAM. Nvidia twierdzi, że komputery z układem Grace GB10 Blackwell pozwalają na inferencję modeli z 200 miliardami (200B) parametrów. W praktyce udało nam się przetestować GPT-OSS w wersji 120B. Model uruchomiony poprzez Ollamę wypluwał z siebie średnio 40 tokenów/s.
Wydajność – nie demon prędkości, ale…
Podczas testów skupialiśmy się głównie na wydajności w codziennych zadaniach – w tle uruchomiony był serwer Open WebUI, który w połączeniu z programem Ollama działał jak Google Gemini, czy Chat-GPT. Użytkownik loguje się, ma dostęp do hostorii czatów, może załączać pliki do zapytań, nawet tworzyć foldery i projekty. W codziennej, zwykłej pracy zdolności modelu i szybkość działania były zupełnie zadowalające, a całe środowisko można postawić w kilkadziesiąt minut. Dlatego jako serwer dla kilku użytkowników, nawet korzystających z kilku modeli jednocześnie, ZGX Nano I ThinkStation PGX spisują się wyśmienicie, szczególnie biorąc pod uwagę ich cenę i pobór prądu. Pochyliliśmy się również nad syntetycznymi benchmarkami i cyferkami.
LocaLScore.ai Medium (Llama 3.1 8B):
- BG10 Blackwell – 485 pkt
- RTX 4000 Ada – 647 pkt
- RTX 6000 ADA – 1609 pkt
- RTX 6000 Blackwell – 2000 pkt
Z suchych liczb jasno wynika, że GB10 wypada najsłabiej. W każdym z trzech testów (time to first token, prompt tokens/s, generation tokens/s) komputery z układem GB10 wypadały najsłabiej. Należy jednak pamiętać, że syntetyczne benchmarki nie zawsze oddają rzeczywiste działanie sprzętu w warynkach codziennego użytkowania. Jak więc sprawa wygląda w przypadku zwykłego odpytywania modeli? Nvidia Grace GB10 Blackwell w przypadku modelu GPT-OSS:20B generowała średnio 59 tokenów/s. RTX PRO 4500 Blackwell wyposażony w 32 GB VRAM GDDR7 dla tego samego modelu generował 145 tokenów/s, w przypadku Gemma3:27B – 180 tokenów/s (vs 12 tg/s w przypadku GB10). Niestety nie udało się przetestować karty 4500 BW przy pomocy narzędzia LocalScore.ai – pojawiały się błędy i benchmark się wyłączał. Można jednak śmiało stwierdzić, że średniopółkowa karta RTX PRO 4500 jest kilkukrotnie szybsza od układów GB10. Dopóki modele są na tyle małe, a konwersacje na tyle krótkie aby zmieściły się na 32 GB VRAM.
Podsumowaując – Nvidia GB10 zdecydowanie nie jest najszybszym układem graficznym dostępnym na rynku. To czego nie osiąga prędkością, nadrabia gabarytami, poborem prądu i ceną. Duża ilość zunifikowanej pamięci RAM pozwala na uruchamianie i dostrajanie dużych modeli bez angażowania klastra kilku kart GPU, oszczędzając miejsce i pieniądze.
Czy to komputer do wszystkiego?
Nie. To wyspecjalizowana stacja robocza AI:
- działa w środowisku Linux,
- oparta jest na architekturze ARM,
- najlepiej sprawdza się w ML, LLM, AI research.
Nie jest to komputer do grafiki, CAD czy codziennej pracy biurowej.
Kultura pracy i codzienne użytkowanie
Sprzęt jest kompaktowy i energooszczędny jak na swoje możliwości, ale nie całkowicie bezgłośny. Przy większym obciążeniu wentylatory są słyszalne. Z drugiej strony – w porównaniu do klasycznych serwerów GPU to nadal bardzo wygodne rozwiązanie do pracy w biurze.
Dla kogo taka stacja robocza AI ma sens?
Po testach możemy powiedzieć jedno: To świetna opcja dla firm, które:
- chcą uruchamiać LLM lokalnie,
- nie chcą wysyłać danych do chmury,
- budują rozwiązania AI on-premise,
- potrzebują środowiska developerskiego pod ML,
- dostrajają modele pod własne potrzeby.
Jeśli Twoja firma rozwija chatboty, systemy analizy dokumentów, agentów AI czy własne modele językowe – taka platforma może znacząco uprościć infrastrukturę.
Podsumowanie – czy warto?
HP ZGX Nano G1n i Lenovo ThinkStation PGX to nowa generacja kompaktowych stacji roboczych AI. Nie są najszybsze na rynku. Nie zastąpią klastra GPU. Nie są komputerem uniwersalnym. Ale jeśli kluczowe są:
- 128 GB RAM,
- lokalna inferencja dużych modeli,
- bezpieczeństwo danych,
- serwer AI w formacie desktop,
to jest to bardzo ciekawa i nowoczesna kategoria sprzętu. Jeżeli zastanawiasz się, czy stacja robocza AI z NVIDIA Grace GB10 Blackwell będzie odpowiednia do Twojego projektu – warto przeanalizować realne potrzeby modelowe i scenariusz wdrożenia. Technologia idzie w stronę lokalnych, kompaktowych systemów AI – i właśnie to pokazują te dwa urządzenia.
Masz pytania? Skontaktuj się z ekspertem:
a.bebenek@mat.net.pl
12 252 06 61 | 512 240 334