Google vydal Gemma 4 — free AI modely, co běží na překvapivě levném hardware
Google DeepMind vydal Gemma 4 jako kompletně free a open source — čtyři AI modely od maličkého pro Raspberry Pi až po tak výkonný, že konkuruje největším jménům v AI, a to bez potřeby datacentra.
Co se stalo
Google DeepMind 2. dubna 2026 vydal Gemma 4. Čtyři AI modely, kompletně zdarma (Apache 2.0 licence) a výkon, který je řadí do stejné ligy jako modely firem, co utrácejí miliardy za infrastrukturu.
To hlavní: nejsilnější model z rodiny běží na jedné výkonné grafické kartě — typ, co si pronajmete v cloudu za pár dolarů na hodinu. Před rokem jste na podobné výsledky potřebovali hardware za tisíce dolarů za hodinu.
Čtyři modely pro čtyři různé situace
Google nevydal jen jeden model. Postavili čtyři, každý pro jiný účel:
- E2B (nejmenší) — Tak lehký, že běží na mobilu nebo i na Raspberry Pi. Taková "funguje všude" varianta.
- E4B (malý) — O stupeň výš, dělaný na laptopy a tablety. Pořád hodně přenosný.
- 26B (ten chytrý) — Tohle je nejzajímavější model. Používá trik zvaný Mixture of Experts — aktivuje jen malou část svého "mozku" pro každý úkol. Výsledek: je skoro tak chytrý jako největší model, ale běží zhruba dvakrát rychleji. Na AI žebříčcích je #6 na světě — před modely, co potřebují mnohem víc výpočetního výkonu.
- 31B (tahoun) — Plnohodnotný model. Nejlepší surový výkon, ideální, když ho chcete přizpůsobit na konkrétní úkol.
Všechny čtyři zvládají text, obrázky i video. Ty dva nejmenší navíc umí zpracovat audio — to konkurenční modely v téhle velikosti nenabízí.
Stavěný na to, aby něco dělal, ne jen chatoval
Většina AI modelů je dělaná na konverzace. Gemma 4 je dělaná na akce. Google ho přímo trénoval na volání externích nástrojů a služeb — zjistit počasí, dotázat se databáze, zarezervovat něco. Není to žádný hack nalepený navrch; je to součást toho, jak model funguje.
Taky jde přepnout režim "ukaž, jak přemýšlíš". U složitých úkolů model krok po kroku vysvětlí svůj postup, než začne jednat. U jednoduchých požadavků to vypnete a dostanete rychlejší odpověď. Tahle flexibilita je důležitá, když stavíte reálné aplikace.
Google k tomu přidal i demo appku Agent Skills, co běží celá na telefonu — bez internetu. Umí vyhledávat na Wikipedii, dělat shrnutí, vytvářet kartičky a řetězit tyhle kroky automaticky. Je to proof of concept, ale ukazuje to, kam to směřuje: AI asistenti, co fungují offline.
Jde to spustit z příkazové řádky
Google vydal nástroj litert-lm, kterým model pustíte jedním příkazem v terminálu — žádné programování:
litert-lm run --from-huggingface-repo=litert-community/gemma-4-E2B-it-litert-lm gemma-4-E2B-it.litertlm --prompt="Vysvětli quicksort ve třech větách"Nejmenší model běží na Raspberry Pi 5 — počítači za dva tisíce korun velký jako kreditka. Potřebuje míň než 1.5 GB paměti. Není to blesk, tak 8 slov za sekundu, ale funguje to. Na moderním mobilním čipu s AI akcelerací je to o dost svižnější.
Srovnání s konkurencí
Open-source AI scéna je teď dost nabitá. Krátká verze:
- vs Meta Llama 4: Llama umí zpracovat extrémně dlouhé dokumenty (miliony slov), to je unikátní. Ale potřebuje mnohem silnější hardware. Gemma 4 vám dá podobnou inteligenci za zlomek výpočetních nákladů. A Llama licence má omezení pro hodně velké aplikace — Gemma žádná.
- vs Alibaba Qwen 3.5: Hodně vyrovnané v benchmarcích. Qwen je o chlup lepší v testech obecných znalostí, Gemma je lepší v matice a kódování. Oba plně open source.
Pointa není, kdo vyhraje v jednom konkrétním testu. Chytré řešení Gemma 4 vám dá 90 % výkonu za malý zlomek ceny. Pokud jste firma, co chce do produktu přidat AI, ale nechce za cloud platit jmění — tahle matematika dává smysl.
Proč je to důležité
Před rokem byly takhle schopné AI modely zamčené za drahými API od OpenAI nebo Anthropicu. Teď si jeden stáhnete, pustíte na vlastním hardware a nemusíte nikam posílat svá data.
Nejmenší model běží na mobilu. Střední na běžném herním počítači. Největší na jedné cloudové GPU za pár dolarů na hodinu. Všechno kompletně zdarma, bez háčků.
Google má za sebou 400 milionů stažení Gemma modelů. Očividně sází na to, že rozdávat modely buduje větší ekosystém než prodávat přístup. A pro vývojáře, výzkumníky a firmy, co chtějí mít AI pod kontrolou — to je fakt dobrá zpráva.
Jestli jste se ptali, kdy free AI modely doženou ty placené — ten rozdíl nikdy nebyl menší.
Další články
Anthropic zabil přístup pro third-party agenty přes Claude předplatné — co se stalo a co s tím
Claude Mythos Preview od Anthropic umí sám najít zero-day zranitelnosti — a proto kolem něj postavili koalici
