Transformer

Transformer je architektura neuronové sítě představená v článku „Attention Is All You Need" z roku 2017, která zásadně změnila zpracování přirozeného jazyka. Na rozdíl od rekurentních sítí zpracovává transformery celé sekvence paralelně pomocí mechanismu self-attention, což umožňuje efektivně zachytit závislosti na velké vzdálenosti. Prakticky všechny moderní LLM, včetně GPT a Claude, jsou postaveny na architektuře transformer.

#ai

Související pojmy

Vektorová databáze

Vektorová databáze je specializovaná databáze optimalizovaná pro ukládání, indexování a dotazování vícerozměrných vektorových embeddingů. Umožňuje rychlé vyhledávání podobnosti, které je klíčové pro RAG systémy, doporučovací enginy a sémantické vyhledávání. Mezi populární vektorové databáze patří Pinecone, Weaviate, Qdrant a pgvector pro PostgreSQL.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

Fine-tuning

Fine-tuning je proces dalšího trénování předtrénovaného AI modelu na menší, doménově specifické datové sadě za účelem přizpůsobení konkrétnímu úkolu. Místo trénování od nuly se upravují existující váhy modelu, což je výrazně levnější a rychlejší. Mezi běžné přístupy patří úplný fine-tuning, LoRA (Low-Rank Adaptation) a instruction tuning pro sladění chování modelu s konkrétními požadavky.

ETL pipeline

ETL (Extract, Transform, Load) je automatizovaný vzor zpracování dat, kdy se data extrahují ze zdrojových systémů, transformují do požadovaného formátu a nahrají do cílového systému jako datový sklad. Moderní variace zahrnují ELT, kde se surová data nejprve nahrají a transformují se na místě. ETL pipeline jsou nezbytné pro automatizaci datové integrace, reportingu a přípravu čistých dat pro ML trénovací workflow.

Zpětnovazební učení

Zpětnovazební učení (RL) je paradigma strojového učení, kde se agent učí optimálnímu chování interakcí s prostředím a přijímáním odměn nebo penalizací. RLHF (Reinforcement Learning from Human Feedback) je klíčová technika používaná k alignmentu LLM s lidskými preferencemi, díky níž jsou výstupy modelů užitečnější a bezpečnější. RL stojí také za průlomy v herní AI a robotice.

Všechna slova

Transformer

Související pojmy

Vektorová databáze

Kontextové okno

Embedding

Fine-tuning

ETL pipeline

Zpětnovazební učení

Máte v hlavě projekt?

Transformer

Související pojmy

Vektorová databáze

Kontextové okno

Embedding

Fine-tuning

ETL pipeline

Zpětnovazební učení

Máte v hlavě projekt?