Matyas.
SlužbyProjektyZkušenostiBlogKontakt
ENOzvěte se
Zpět na slovník
ai

RAG

Retrieval-Augmented Generation (RAG) je technika, která vylepšuje odpovědi LLM tím, že před generováním odpovědi načte relevantní dokumenty z externí znalostní báze. Model tak může zakládat svůj výstup na aktuálních, doménově specifických informacích místo spoléhání pouze na trénovací data. RAG se široce používá v podnikových chatbotech, dokumentačních asistentech a AI aplikacích s vyhledáváním.

#ai

Související pojmy

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Velký jazykový model

Velký jazykový model (LLM) je model hlubokého učení trénovaný na rozsáhlých textových datech, který rozumí přirozenému jazyku a generuje lidsky znějící text. Modely jako GPT, Claude a LLaMA pohánějí chatboty, programátorské asistenty a nástroje pro generování obsahu. Fungují na principu predikce dalšího tokenu v sekvenci na základě naučených statistických vzorů napříč miliardami parametrů.

Token

V kontextu AI jazykových modelů je token základní jednotka textu, kterou model zpracovává — obvykle slovo, část slova nebo znak v závislosti na tokenizéru. Ceny LLM, kontextová okna i limity rychlosti se měří v tokenech. Pochopení tokenizace je klíčové pro optimalizaci nákladů a dodržení limitů kontextu modelu při vývoji AI aplikací.

Neuronová síť

Neuronová síť je výpočetní model inspirovaný lidským mozkem, složený z vrstev propojených uzlů (neuronů), které zpracovávají data úpravou vážených spojení během trénování. Hluboké neuronové sítě s mnoha vrstvami tvoří základ moderní AI a pohánějí vše od rozpoznávání obrazu po porozumění jazyku. Mezi běžné architektury patří dopředné sítě, konvoluční sítě (CNN) a transformery.

Vektorová databáze

Vektorová databáze je specializovaná databáze optimalizovaná pro ukládání, indexování a dotazování vícerozměrných vektorových embeddingů. Umožňuje rychlé vyhledávání podobnosti, které je klíčové pro RAG systémy, doporučovací enginy a sémantické vyhledávání. Mezi populární vektorové databáze patří Pinecone, Weaviate, Qdrant a pgvector pro PostgreSQL.

Počítačové vidění

Počítačové vidění je oblast AI, která trénuje stroje k interpretaci a porozumění vizuálním informacím z obrázků a videí. Aplikace zahrnují detekci objektů, rozpoznávání obličejů, autonomní řízení a analýzu medicínských snímků. Moderní počítačové vidění využívá modely hlubokého učení jako CNN a vision transformery (ViT) a stále více se integruje s jazykovými modely v multimodálních AI systémech.

Všechna slova
Matyas.

Weby, mobilní appky a automatizace s AI. Pomáhám firmám šetřit čas i peníze technologií, která opravdu funguje.

Odkazy

  • Služby
  • Projekty
  • Zkušenosti
  • Blog
  • Slovník
  • Kontakt

Připravuji

  • Případové studieBrzy
  • Zdroje

© 2026 Matyas Prochazka. Všechna práva vyhrazena.