RAG

Retrieval-Augmented Generation (RAG) je technika, která vylepšuje odpovědi LLM tím, že před generováním odpovědi načte relevantní dokumenty z externí znalostní báze. Model tak může zakládat svůj výstup na aktuálních, doménově specifických informacích místo spoléhání pouze na trénovací data. RAG se široce používá v podnikových chatbotech, dokumentačních asistentech a AI aplikacích s vyhledáváním.

#ai

Související pojmy

Neuronová síť

Neuronová síť je výpočetní model inspirovaný lidským mozkem, složený z vrstev propojených uzlů (neuronů), které zpracovávají data úpravou vážených spojení během trénování. Hluboké neuronové sítě s mnoha vrstvami tvoří základ moderní AI a pohánějí vše od rozpoznávání obrazu po porozumění jazyku. Mezi běžné architektury patří dopředné sítě, konvoluční sítě (CNN) a transformery.

Multimodální AI

Multimodální AI označuje modely, které dokáží zpracovávat a generovat více typů dat — text, obrázky, zvuk a video — v rámci jednoho systému. Modely jako GPT-4o a Claude přijímají textové i obrazové vstupy, což umožňuje vizuální odpovídání na otázky, analýzu dokumentů a porozumění UI. Tato konvergence stírá hranice mezi dříve oddělenými AI disciplínami.

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

Zpracování přirozeného jazyka

Zpracování přirozeného jazyka (NLP) je odvětví AI zaměřené na umožnění počítačům porozumět, interpretovat a generovat lidský jazyk. NLP pohání aplikace jako chatboty, překladové služby, analýzu sentimentu a sumarizaci textu. Moderní NLP bylo transformováno modely založenými na architektuře transformer, které dosahují pozoruhodných výsledků na úlohách, jež dříve vyžadovaly rozsáhlá ručně vytvořená pravidla.

Všechna slova

RAG

Související pojmy

Neuronová síť

Multimodální AI

Chain of Thought

Embedding

Kontextové okno

Zpracování přirozeného jazyka

Máte v hlavě projekt?

RAG

Související pojmy

Neuronová síť

Multimodální AI

Chain of Thought

Embedding

Kontextové okno

Zpracování přirozeného jazyka

Máte v hlavě projekt?