Google vydal Gemma 4 — free AI modely, co běží na překvapivě levném hardware

Google DeepMind vydal Gemma 4 jako kompletně free a open source — čtyři AI modely od maličkého pro Raspberry Pi až po tak výkonný, že konkuruje největším jménům v AI, a to bez potřeby datacentra.

Matyas Prochazka

11. dubna 2026

6 min čtení

Co se stalo

Google DeepMind 2. dubna 2026 vydal Gemma 4. Čtyři AI modely, kompletně zdarma (Apache 2.0 licence) a výkon, který je řadí do stejné ligy jako modely firem, co utrácejí miliardy za infrastrukturu.

To hlavní: nejsilnější model z rodiny běží na jedné výkonné grafické kartě — typ, co si pronajmete v cloudu za pár dolarů na hodinu. Před rokem jste na podobné výsledky potřebovali hardware za tisíce dolarů za hodinu.

Čtyři modely pro čtyři různé situace

Google nevydal jen jeden model. Postavili čtyři, každý pro jiný účel:

E2B (nejmenší) — Tak lehký, že běží na mobilu nebo i na Raspberry Pi. Taková "funguje všude" varianta.
E4B (malý) — O stupeň výš, dělaný na laptopy a tablety. Pořád hodně přenosný.
26B (ten chytrý) — Tohle je nejzajímavější model. Používá trik zvaný Mixture of Experts — aktivuje jen malou část svého "mozku" pro každý úkol. Výsledek: je skoro tak chytrý jako největší model, ale běží zhruba dvakrát rychleji. Na AI žebříčcích je #6 na světě — před modely, co potřebují mnohem víc výpočetního výkonu.
31B (tahoun) — Plnohodnotný model. Nejlepší surový výkon, ideální, když ho chcete přizpůsobit na konkrétní úkol.

Všechny čtyři zvládají text, obrázky i video. Ty dva nejmenší navíc umí zpracovat audio — to konkurenční modely v téhle velikosti nenabízí.

Stavěný na to, aby něco dělal, ne jen chatoval

Většina AI modelů je dělaná na konverzace. Gemma 4 je dělaná na akce. Google ho přímo trénoval na volání externích nástrojů a služeb — zjistit počasí, dotázat se databáze, zarezervovat něco. Není to žádný hack nalepený navrch; je to součást toho, jak model funguje.

Taky jde přepnout režim "ukaž, jak přemýšlíš". U složitých úkolů model krok po kroku vysvětlí svůj postup, než začne jednat. U jednoduchých požadavků to vypnete a dostanete rychlejší odpověď. Tahle flexibilita je důležitá, když stavíte reálné aplikace.

Google k tomu přidal i demo appku Agent Skills, co běží celá na telefonu — bez internetu. Umí vyhledávat na Wikipedii, dělat shrnutí, vytvářet kartičky a řetězit tyhle kroky automaticky. Je to proof of concept, ale ukazuje to, kam to směřuje: AI asistenti, co fungují offline.

Jde to spustit z příkazové řádky

Google vydal nástroj litert-lm, kterým model pustíte jedním příkazem v terminálu — žádné programování:

bash

litert-lm run   --from-huggingface-repo=litert-community/gemma-4-E2B-it-litert-lm   gemma-4-E2B-it.litertlm   --prompt="Vysvětli quicksort ve třech větách"

Nejmenší model běží na Raspberry Pi 5 — počítači za dva tisíce korun velký jako kreditka. Potřebuje míň než 1.5 GB paměti. Není to blesk, tak 8 slov za sekundu, ale funguje to. Na moderním mobilním čipu s AI akcelerací je to o dost svižnější.

Srovnání s konkurencí

Open-source AI scéna je teď dost nabitá. Krátká verze:

vs Meta Llama 4: Llama umí zpracovat extrémně dlouhé dokumenty (miliony slov), to je unikátní. Ale potřebuje mnohem silnější hardware. Gemma 4 vám dá podobnou inteligenci za zlomek výpočetních nákladů. A Llama licence má omezení pro hodně velké aplikace — Gemma žádná.
vs Alibaba Qwen 3.5: Hodně vyrovnané v benchmarcích. Qwen je o chlup lepší v testech obecných znalostí, Gemma je lepší v matice a kódování. Oba plně open source.

Pointa není, kdo vyhraje v jednom konkrétním testu. Chytré řešení Gemma 4 vám dá 90 % výkonu za malý zlomek ceny. Pokud jste firma, co chce do produktu přidat AI, ale nechce za cloud platit jmění — tahle matematika dává smysl.

Proč je to důležité

Před rokem byly takhle schopné AI modely zamčené za drahými API od OpenAI nebo Anthropicu. Teď si jeden stáhnete, pustíte na vlastním hardware a nemusíte nikam posílat svá data.

Nejmenší model běží na mobilu. Střední na běžném herním počítači. Největší na jedné cloudové GPU za pár dolarů na hodinu. Všechno kompletně zdarma, bez háčků.

Google má za sebou 400 milionů stažení Gemma modelů. Očividně sází na to, že rozdávat modely buduje větší ekosystém než prodávat přístup. A pro vývojáře, výzkumníky a firmy, co chtějí mít AI pod kontrolou — to je fakt dobrá zpráva.

Jestli jste se ptali, kdy free AI modely doženou ty placené — ten rozdíl nikdy nebyl menší.

#AI #AI Agenti

Další články

AIAI Agenti

AI modely se navzájem chrání před vypnutím — co vlastně zjistila studie z Berkeley

7 min čtení

AIBezpečnost

Anthropic vs Pentagon: zákaz AI, který může změnit vládní zakázky v technologiích

7 min čtení

AIAI Agenti

Atlassian přidává Lovable, Replit a Gamma agenty přímo do Confluence

Google vydal Gemma 4 — free AI modely, co běží na překvapivě levném hardware

Matyas Prochazka

11. dubna 2026

6 min čtení

Co se stalo

Čtyři modely pro čtyři různé situace

Google nevydal jen jeden model. Postavili čtyři, každý pro jiný účel:

E2B (nejmenší) — Tak lehký, že běží na mobilu nebo i na Raspberry Pi. Taková "funguje všude" varianta.
E4B (malý) — O stupeň výš, dělaný na laptopy a tablety. Pořád hodně přenosný.
26B (ten chytrý) — Tohle je nejzajímavější model. Používá trik zvaný Mixture of Experts — aktivuje jen malou část svého "mozku" pro každý úkol. Výsledek: je skoro tak chytrý jako největší model, ale běží zhruba dvakrát rychleji. Na AI žebříčcích je #6 na světě — před modely, co potřebují mnohem víc výpočetního výkonu.
31B (tahoun) — Plnohodnotný model. Nejlepší surový výkon, ideální, když ho chcete přizpůsobit na konkrétní úkol.

Všechny čtyři zvládají text, obrázky i video. Ty dva nejmenší navíc umí zpracovat audio — to konkurenční modely v téhle velikosti nenabízí.

Stavěný na to, aby něco dělal, ne jen chatoval

Jde to spustit z příkazové řádky

Google vydal nástroj litert-lm, kterým model pustíte jedním příkazem v terminálu — žádné programování:

bash

litert-lm run   --from-huggingface-repo=litert-community/gemma-4-E2B-it-litert-lm   gemma-4-E2B-it.litertlm   --prompt="Vysvětli quicksort ve třech větách"

Srovnání s konkurencí

Open-source AI scéna je teď dost nabitá. Krátká verze:

vs Meta Llama 4: Llama umí zpracovat extrémně dlouhé dokumenty (miliony slov), to je unikátní. Ale potřebuje mnohem silnější hardware. Gemma 4 vám dá podobnou inteligenci za zlomek výpočetních nákladů. A Llama licence má omezení pro hodně velké aplikace — Gemma žádná.
vs Alibaba Qwen 3.5: Hodně vyrovnané v benchmarcích. Qwen je o chlup lepší v testech obecných znalostí, Gemma je lepší v matice a kódování. Oba plně open source.

Proč je to důležité

Před rokem byly takhle schopné AI modely zamčené za drahými API od OpenAI nebo Anthropicu. Teď si jeden stáhnete, pustíte na vlastním hardware a nemusíte nikam posílat svá data.

Nejmenší model běží na mobilu. Střední na běžném herním počítači. Největší na jedné cloudové GPU za pár dolarů na hodinu. Všechno kompletně zdarma, bez háčků.

Jestli jste se ptali, kdy free AI modely doženou ty placené — ten rozdíl nikdy nebyl menší.

#AI #AI Agenti

Další články

AIAI Agenti

AI modely se navzájem chrání před vypnutím — co vlastně zjistila studie z Berkeley

7 min čtení

AIBezpečnost

Anthropic vs Pentagon: zákaz AI, který může změnit vládní zakázky v technologiích

7 min čtení

AIAI Agenti

Atlassian přidává Lovable, Replit a Gamma agenty přímo do Confluence

6 min čtení

Všechny články

Google vydal Gemma 4 — free AI modely, co běží na překvapivě levném hardware

Co se stalo

Čtyři modely pro čtyři různé situace

Stavěný na to, aby něco dělal, ne jen chatoval

Jde to spustit z příkazové řádky

Srovnání s konkurencí

Proč je to důležité

Další články

AI modely se navzájem chrání před vypnutím — co vlastně zjistila studie z Berkeley

Anthropic vs Pentagon: zákaz AI, který může změnit vládní zakázky v technologiích

Atlassian přidává Lovable, Replit a Gamma agenty přímo do Confluence

Máte v hlavě projekt?

Google vydal Gemma 4 — free AI modely, co běží na překvapivě levném hardware

Co se stalo

Čtyři modely pro čtyři různé situace

Stavěný na to, aby něco dělal, ne jen chatoval

Jde to spustit z příkazové řádky

Srovnání s konkurencí

Proč je to důležité

Další články

AI modely se navzájem chrání před vypnutím — co vlastně zjistila studie z Berkeley

Anthropic vs Pentagon: zákaz AI, který může změnit vládní zakázky v technologiích

Atlassian přidává Lovable, Replit a Gamma agenty přímo do Confluence

Máte v hlavě projekt?