Matyas.
SlužbyProjektyZkušenostiBlogKontakt
ENOzvěte se
Zpět na slovník
ai

Generativní AI

Generativní AI je kategorie umělé inteligence, která vytváří nový obsah — text, obrázky, kód, hudbu nebo video — místo pouhé analýzy nebo klasifikace existujících dat. Poháněná architekturami jako transformery a difuzní modely, generativní AI transformovala vývoj softwaru nástroji jako GitHub Copilot, Claude a Cursor. Představuje posun od AI jako klasifikačního nástroje k AI jako kreativnímu spolupracovníkovi.

#ai

Související pojmy

Difuzní model

Difuzní model je typ generativní AI, která vytváří data učením se reverzovat postupný proces přidávání šumu. Během trénování se model učí postupně odšumovat náhodný šum do koherentních výstupů jako obrázky, zvuk nebo video. Difuzní modely pohánějí nástroje jako Stable Diffusion, DALL-E a Midjourney a staly se dominantní architekturou pro kvalitní generování obrázků.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

RAG

Retrieval-Augmented Generation (RAG) je technika, která vylepšuje odpovědi LLM tím, že před generováním odpovědi načte relevantní dokumenty z externí znalostní báze. Model tak může zakládat svůj výstup na aktuálních, doménově specifických informacích místo spoléhání pouze na trénovací data. RAG se široce používá v podnikových chatbotech, dokumentačních asistentech a AI aplikacích s vyhledáváním.

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Počítačové vidění

Počítačové vidění je oblast AI, která trénuje stroje k interpretaci a porozumění vizuálním informacím z obrázků a videí. Aplikace zahrnují detekci objektů, rozpoznávání obličejů, autonomní řízení a analýzu medicínských snímků. Moderní počítačové vidění využívá modely hlubokého učení jako CNN a vision transformery (ViT) a stále více se integruje s jazykovými modely v multimodálních AI systémech.

Všechna slova
Matyas.

Weby, mobilní appky a automatizace s AI. Pomáhám firmám šetřit čas i peníze technologií, která opravdu funguje.

Odkazy

  • Služby
  • Projekty
  • Zkušenosti
  • Blog
  • Slovník
  • Kontakt

Připravuji

  • Případové studieBrzy
  • Zdroje

© 2026 Matyas Prochazka. Všechna práva vyhrazena.