Generativní AI

Generativní AI je kategorie umělé inteligence, která vytváří nový obsah — text, obrázky, kód, hudbu nebo video — místo pouhé analýzy nebo klasifikace existujících dat. Poháněná architekturami jako transformery a difuzní modely, generativní AI transformovala vývoj softwaru nástroji jako GitHub Copilot, Claude a Cursor. Představuje posun od AI jako klasifikačního nástroje k AI jako kreativnímu spolupracovníkovi.

#ai

Související pojmy

Počítačové vidění

Počítačové vidění je oblast AI, která trénuje stroje k interpretaci a porozumění vizuálním informacím z obrázků a videí. Aplikace zahrnují detekci objektů, rozpoznávání obličejů, autonomní řízení a analýzu medicínských snímků. Moderní počítačové vidění využívá modely hlubokého učení jako CNN a vision transformery (ViT) a stále více se integruje s jazykovými modely v multimodálních AI systémech.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Velký jazykový model

Velký jazykový model (LLM) je model hlubokého učení trénovaný na rozsáhlých textových datech, který rozumí přirozenému jazyku a generuje lidsky znějící text. Modely jako GPT, Claude a LLaMA pohánějí chatboty, programátorské asistenty a nástroje pro generování obsahu. Fungují na principu predikce dalšího tokenu v sekvenci na základě naučených statistických vzorů napříč miliardami parametrů.

Multimodální AI

Multimodální AI označuje modely, které dokáží zpracovávat a generovat více typů dat — text, obrázky, zvuk a video — v rámci jednoho systému. Modely jako GPT-4o a Claude přijímají textové i obrazové vstupy, což umožňuje vizuální odpovídání na otázky, analýzu dokumentů a porozumění UI. Tato konvergence stírá hranice mezi dříve oddělenými AI disciplínami.

Fine-tuning

Fine-tuning je proces dalšího trénování předtrénovaného AI modelu na menší, doménově specifické datové sadě za účelem přizpůsobení konkrétnímu úkolu. Místo trénování od nuly se upravují existující váhy modelu, což je výrazně levnější a rychlejší. Mezi běžné přístupy patří úplný fine-tuning, LoRA (Low-Rank Adaptation) a instruction tuning pro sladění chování modelu s konkrétními požadavky.

Všechna slova

Generativní AI

Související pojmy

Počítačové vidění

Embedding

Chain of Thought

Velký jazykový model

Multimodální AI

Fine-tuning

Máte v hlavě projekt?

Generativní AI

Související pojmy

Počítačové vidění

Embedding

Chain of Thought

Velký jazykový model

Multimodální AI

Fine-tuning

Máte v hlavě projekt?