Zpětnovazební učení

Zpětnovazební učení (RL) je paradigma strojového učení, kde se agent učí optimálnímu chování interakcí s prostředím a přijímáním odměn nebo penalizací. RLHF (Reinforcement Learning from Human Feedback) je klíčová technika používaná k alignmentu LLM s lidskými preferencemi, díky níž jsou výstupy modelů užitečnější a bezpečnější. RL stojí také za průlomy v herní AI a robotice.

#ai

Související pojmy

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

ETL pipeline

ETL (Extract, Transform, Load) je automatizovaný vzor zpracování dat, kdy se data extrahují ze zdrojových systémů, transformují do požadovaného formátu a nahrají do cílového systému jako datový sklad. Moderní variace zahrnují ELT, kde se surová data nejprve nahrají a transformují se na místě. ETL pipeline jsou nezbytné pro automatizaci datové integrace, reportingu a přípravu čistých dat pro ML trénovací workflow.

n8n

n8n je open-source platforma pro automatizaci workflow, která umožňuje propojovat API, služby a databáze prostřednictvím vizuálního editoru založeného na uzlech. Na rozdíl od proprietárních alternativ jako Zapier lze n8n hostovat vlastně, což dává plnou kontrolu nad daty a spouštěním. Podporuje stovky integrací, vlastní JavaScript/Python kódové uzly a AI agentní workflow, díky čemuž je oblíbený mezi vývojáři, kteří potřebují automatizaci s flexibilitou a transparentností.

Fine-tuning

Fine-tuning je proces dalšího trénování předtrénovaného AI modelu na menší, doménově specifické datové sadě za účelem přizpůsobení konkrétnímu úkolu. Místo trénování od nuly se upravují existující váhy modelu, což je výrazně levnější a rychlejší. Mezi běžné přístupy patří úplný fine-tuning, LoRA (Low-Rank Adaptation) a instruction tuning pro sladění chování modelu s konkrétními požadavky.

Počítačové vidění

Počítačové vidění je oblast AI, která trénuje stroje k interpretaci a porozumění vizuálním informacím z obrázků a videí. Aplikace zahrnují detekci objektů, rozpoznávání obličejů, autonomní řízení a analýzu medicínských snímků. Moderní počítačové vidění využívá modely hlubokého učení jako CNN a vision transformery (ViT) a stále více se integruje s jazykovými modely v multimodálních AI systémech.

Všechna slova

Zpětnovazební učení

Související pojmy

Chain of Thought

Kontextové okno

ETL pipeline

n8n

Fine-tuning

Počítačové vidění

Máte v hlavě projekt?

Zpětnovazební učení

Související pojmy

Chain of Thought

Kontextové okno

ETL pipeline

n8n

Fine-tuning

Počítačové vidění

Máte v hlavě projekt?