Vektorová databáze

Vektorová databáze je specializovaná databáze optimalizovaná pro ukládání, indexování a dotazování vícerozměrných vektorových embeddingů. Umožňuje rychlé vyhledávání podobnosti, které je klíčové pro RAG systémy, doporučovací enginy a sémantické vyhledávání. Mezi populární vektorové databáze patří Pinecone, Weaviate, Qdrant a pgvector pro PostgreSQL.

#ai

Související pojmy

Halucinace

V kontextu AI se halucinací rozumí situace, kdy jazykový model generuje sebejistě znějící, ale fakticky nesprávné nebo vymyšlené informace. Dochází k tomu, protože LLM predikují statisticky pravděpodobný text, místo aby ověřovaly fakta. Mezi strategie zmírnění patří RAG, zakotvení odpovědí ve zdrojových dokumentech, validace strukturovaného výstupu a nastavení teploty pro snížení kreativní odchylky.

Kontextové okno

Kontextové okno je maximální množství textu (měřené v tokenech), které LLM může zpracovat v jedné interakci, zahrnující vstupní prompt i generovaný výstup. Větší kontextová okna umožňují modelům zpracovávat delší dokumenty, udržovat rozsáhlé konverzace a uvažovat nad více informacemi najednou. Velikost kontextových oken rychle roste — od 4K tokenů u raných GPT modelů po více než 1M tokenů u současných modelů jako Claude.

Chain of Thought

Chain of Thought (CoT) je technika promptování, která vybízí LLM k rozložení složitého uvažování na mezikroky před dosažením konečné odpovědi. Explicitním uvažováním přes jednotlivé kroky modely dosahují výrazně lepší přesnosti u matematických, logických a vícekrokových problémů. Rozšířené myšlení a „thinking" tokeny u modelů jako Claude představují zabudovanou formu chain-of-thought uvažování.

ETL pipeline

ETL (Extract, Transform, Load) je automatizovaný vzor zpracování dat, kdy se data extrahují ze zdrojových systémů, transformují do požadovaného formátu a nahrají do cílového systému jako datový sklad. Moderní variace zahrnují ELT, kde se surová data nejprve nahrají a transformují se na místě. ETL pipeline jsou nezbytné pro automatizaci datové integrace, reportingu a přípravu čistých dat pro ML trénovací workflow.

Embedding

Embedding je hustá numerická vektorová reprezentace dat — textu, obrázků nebo kódu — ve vícerozměrném prostoru, kde sémanticky podobné položky jsou umístěny blíže u sebe. Embeddingy jsou základem sémantického vyhledávání, doporučovacích systémů a RAG pipeline. Generují je specializované modely a typicky se ukládají do vektorových databází pro efektivní vyhledávání podobnosti.

RAG

Retrieval-Augmented Generation (RAG) je technika, která vylepšuje odpovědi LLM tím, že před generováním odpovědi načte relevantní dokumenty z externí znalostní báze. Model tak může zakládat svůj výstup na aktuálních, doménově specifických informacích místo spoléhání pouze na trénovací data. RAG se široce používá v podnikových chatbotech, dokumentačních asistentech a AI aplikacích s vyhledáváním.

Všechna slova

Vektorová databáze

Související pojmy

Halucinace

Kontextové okno

Chain of Thought

ETL pipeline

Embedding

RAG

Máte v hlavě projekt?

Vektorová databáze

Související pojmy

Halucinace

Kontextové okno

Chain of Thought

ETL pipeline

Embedding

RAG

Máte v hlavě projekt?