Akademia · Lokalne modele

LM Studio — modele LLM bez chmury, na Twoim sprzęcie.

Darmowa aplikacja desktop do uruchamiania zaawansowanych modeli językowych lokalnie: pełna prywatność, zgodność z RODO, API zgodne z OpenAI na localhost. Poniżej instalacja, korzyści dla firm oraz modele, które warto znać.

Ostatnia aktualizacja:

100% lokalniezero zbierania danych, działa offline
OpenAI APIlocalhost:1234 dla istniejących narzędzi
1000+ modelipre-konfigurowanych do pobrania

01 / Wprowadzenie · Czym jest

Aplikacja desktop do lokalnych LLM-ów na prywatnym komputerze.

LM Studio to darmowa aplikacja na macOS, Windows i Linux, która umożliwia uruchamianie zaawansowanych modeli językowych AI bezpośrednio na Twoim komputerze. Instalator waży około 400 MB i pobierasz go z lmstudio.ai.

  • Prywatność first — zero zbierania danych, wszystkie obliczenia lokalnie, brak wymogu internetu, zgodność z RODO.
  • Kluczowe możliwości — ponad 1000 pre-konfigurowanych modeli, Model Context Protocol (MCP), API zgodne z OpenAI na localhost:1234, kontrola wielu GPU i zarządzanie pamięcią VRAM.
  • Dla developerów — REST API oraz SDK TypeScript/Python, wbudowany RAG dla dokumentów, długie okna kontekstu. Biblioteki lmstudio-js i lmstudio-python na licencji MIT.
  • Korzyści biznesowe — brak vendor lock-in, pełna kontrola i customizacja, działa na sprzęcie konsumenckim (16 GB RAM oraz 4 GB+ VRAM).

Nowości 2026: OAuth dla serwerów MCP, tensor parallelism (rozkładanie modelu na wiele GPU), aplikacja mobilna oraz natywne użycie modeli LM Studio w Claude Code.

W skrócie: LM Studio demokratyzuje dostęp do LLM i sprawdza się w branżach z wymogami prywatności — dane nie opuszczają komputera, a istniejące narzędzia podłączasz przez API zgodne z OpenAI.

02 / Instalacja · Szybki start

Pobierz, zainstaluj, wybierz model.

Przejdź na lmstudio.ai i pobierz wersję dla swojego systemu (macOS, Windows lub Linux).

  • Aktualna wersja: linia 0.4.x (stabilne 0.4.18 z 26 czerwca 2026).
  • Rozmiar instalatora: około 400 MB.
  • Wymagania rekomendowane: 16 GB RAM oraz 4 GB+ VRAM.
  • Po instalacji: wybierz model z wbudowanej biblioteki, pobierz go i uruchom lokalnie.
  • API: serwer udostępnia endpoint zgodny z OpenAI na localhost:1234.

03 / Model · GLM (kodowanie)

Linia GLM-5 — aktualni mistrzowie kodowania.

GLM 4.6 (open-weight model od Zhipu AI) został wydany 30 września 2025, oferuje kontekst 200K tokenów i wynik 82,8% na LiveCodeBench. GLM 4.7 (22 grudnia 2025) osiągał 84,9% na LiveCodeBench. Oba zostały już przewyższone przez linię GLM-5 (m.in. GLM-5.2) — to obecnie wiodący open-weight do kodowania, na licencji MIT, z kontekstem rozszerzonym do 1M tokenów.

Kompatybilność: modele GLM są obecnie szeroko wspierane w LM Studio. Alternatywy: vLLM, SGLang lub API z docs.z.ai. Model ma też natywną integrację w Claude Code.

04 / Model · MiniMax (agenty)

Od MiniMax M2 do M3 — mistrzowie agentów.

MiniMax M2 wyszedł 27 października 2025. To architektura MoE: 230B parametrów total, 10B aktywnych, na licencji MIT, w czołówce rankingu Artificial Analysis. Koszt rzędu $0.30/$1.20 za milion tokenów to ułamek ceny modeli komercyjnych. Linia rozwinęła się szybko: M2.1 (22 grudnia 2025), M2.5 (luty 2026), a potem M2.7 (18 marca 2026). Najnowszy w rodzinie jest jednak MiniMax M3 z 1 czerwca 2026 — to już osobny krok, nie kolejny punkt w linii M2.

MiniMax M3 (czerwiec 2026): MoE ~428B / ~22B aktywnych, mechanizm rzadkiej uwagi MSA, kontekst do 1M tokenów i natywna multimodalność (tekst, obraz, wideo). Cennik API to $0.60/$2.40 za milion tokenów, wagi są otwarte na licencji minimax-community.

Status LM Studio: M2 ma natywne wsparcie od wersji 0.3.31 (MLX na Macu, GGUF na PC, łącznie z parsowaniem wywołań narzędzi). Dla M3 obsługa w llama.cpp jest na razie wstępna (build z PR), więc na lokalne uruchomienie poza vLLM i SGLang trzeba poczekać na stabilny build. Dla starszych wersji LM Studio te dwa silniki pozostają alternatywą.

05 / Podsumowanie · Wnioski

Co wybrać i do czego.

  • LM Studio — demokratyzuje dostęp do LLM, idealne dla branż z wymogami prywatności; API zgodne z OpenAI na localhost:1234.
  • Linia GLM-5 — aktualny lider kodowania open-weight (przewyższa GLM 4.7), licencja MIT, kontekst do 1M tokenów.
  • MiniMax M2 / M3 — mistrz zadań agentowych; M2 (MoE 230B/10B) działa lokalnie w LM Studio od 0.3.31+, M3 (MoE ~428B, 1M kontekstu, multimodal) to najnowszy krok linii. Ułamek ceny modeli komercyjnych.

Wdrożenie u Was

Chcecie modele AI u siebie, bez wycieku danych?

Akademia to materiały. Wdrożenie lokalnego modelu na infrastrukturze firmy projektujemy i prowadzimy z Waszym zespołem. 30 minut wystarczy, żeby sprawdzić, czy ma to u Was sens.