Matyas.
SlužbyProjektyZkušenostiBlogKontakt
ENOzvěte se
Zpět na slovník
ai

RAG

Retrieval-Augmented Generation (RAG) je technika, která vylepšuje odpovědi LLM tím, že před generováním odpovědi načte relevantní dokumenty z externí znalostní báze. Model tak může zakládat svůj výstup na aktuálních, doménově specifických informacích místo spoléhání pouze na trénovací data. RAG se široce používá v podnikových chatbotech, dokumentačních asistentech a AI aplikacích s vyhledáváním.

#ai

Související pojmy

Neuronová síť

Neuronová síť je výpočetní model inspirovaný lidským mozkem, složený z vrstev propojených uzlů (neuronů), které zpracovávají data úpravou vážených spojení během trénování. Hluboké neuronové sítě s mnoha vrstvami tvoří základ moderní AI a pohánějí vše od rozpoznávání obrazu po porozumění jazyku. Mezi běžné architektury patří dopředné sítě, konvoluční sítě (CNN) a transformery.

Multimodální AI

Multimodální AI označuje modely, které dokáží zpracovávat a generovat více typů dat — text, obrázky, zvuk a video — v rámci jednoho systému. Modely jako GPT-4o a Claude přijímají textové i obrazové vstupy, což umožňuje vizuální odpovídání na otázky, analýzu dokumentů a porozumění UI. Tato konvergence stírá hranice mezi dříve oddělenými AI disciplínami.

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

Zpracování přirozeného jazyka

Zpracování přirozeného jazyka (NLP) je odvětví AI zaměřené na umožnění počítačům porozumět, interpretovat a generovat lidský jazyk. NLP pohání aplikace jako chatboty, překladové služby, analýzu sentimentu a sumarizaci textu. Moderní NLP bylo transformováno modely založenými na architektuře transformer, které dosahují pozoruhodných výsledků na úlohách, jež dříve vyžadovaly rozsáhlá ručně vytvořená pravidla.

Všechna slova

Máte v hlavě projekt?

Ať už potřebujete webovou appku, mobilní appku nebo automatizaci s AI — ozvěte se a probereme, jak vám můžu pomoct.

Ozvěte se
Matyas.

Weby, mobilní appky a automatizace s AI. Pomáhám firmám šetřit čas i peníze technologií, která opravdu funguje.

Odkazy

  • Služby
  • Projekty
  • Zkušenosti
  • Blog
  • Slovník
  • Kontakt

Připravuji

  • Případové studieBrzy
  • Zdroje

© 2026 Matyas Prochazka. Všechna práva vyhrazena.