Chain of Thought — magie dvou slov
- Ukázal(a) jsi sobě, jak CoT opraví halucinaci v matematickém problému
- Umíš 3 různé frázování CoT (zero-shot CoT, step-by-step, scratchpad)
- Poznáš úkoly, kde CoT NENÍ potřeba (a neplýtváš tokeny)
🧪 Experiment 1: Problém, na kterém LLM BEZ CoT selže (7 min)
Sekce “🧪 Experiment 1: Problém, na kterém LLM BEZ CoT selže (7 min)”-
Otevři claude.ai, nový chat.
-
Napiš přesně tohle:
V košíku mám 5 jablek. Snědl jsem 2. Přidal jsem ještě 3 broskve.Pak mi soused dal 4 švestky. Kolik kusů ovoce celkem mám teď v košíku? -
Sleduj odpověď.
Odpověď je nejspíš správná (10 kusů). Moderní modely (Claude 4, GPT-4) často trefí. Ale:
- Starší modely to trefovaly jen asi v 40-60 %.
- Důvod: LLM „skočí rovnou” k odpovědi místo aby si to spočítalo.
Zkus teď těžší problém:
V obchodě byly slevy:- Každé 3. zboží je zdarma.- Pokud celkem utratíš přes 1000 Kč, dostaneš navíc 10% slevu z finální ceny.
Koupil jsem 7 triček po 199 Kč. Kolik zaplatím?Tady modely pravidelně halucinují. Zkus to a podívej se, jestli odpověď dává smysl (správně je, že dostaneš 2 trička zdarma — tzn. platíš za 5 × 199 = 995 Kč, to je pod 1000, takže žádná 10% sleva. Finální cena: 995 Kč).
🧪 Experiment 2: Jedno kouzlo — „think step by step” (8 min)
Sekce “🧪 Experiment 2: Jedno kouzlo — „think step by step” (8 min)”-
Nový chat. Stejný problém, ale přidej jednu větu na konec:
V obchodě byly slevy:- Každé 3. zboží je zdarma.- Pokud celkem utratíš přes 1000 Kč, dostaneš navíc 10% slevu z finální ceny.Koupil jsem 7 triček po 199 Kč. Kolik zaplatím?Think step by step. -
Sleduj odpověď.
Odpověď teď bude postupná:
- „Nejdřív spočítám, kolik triček dostanu zdarma…”
- „Pak spočítám cenu po slevě na kusy…”
- „Pak zkontroluji, jestli přesáhla 1000 Kč…”
- „Finální částka: …”
A bude správně. Tohle je Chain of Thought v nejjednodušší podobě — jedna magická fráze.
📚 Proč to funguje (5 min teorie)
Sekce “📚 Proč to funguje (5 min teorie)”Intuice: student na tabuli
Sekce “Intuice: student na tabuli”Student, co má rovnou napsat výsledek, to často plácne. Student, co má napsat postup, je nucený si to rozmyslet a dojít ke správné odpovědi.
LLM je stejné. Každé slovo, které generuje, se opírá o předchozí slova. Když napíše postup, každý další krok staví na logice předchozího. Bez postupu jen hádá výsledek podle vzorů.
Paper (Wei et al., 2022)
Sekce “Paper (Wei et al., 2022)”Fráze „Think step by step” pochází z paperu Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., Google Research, 2022). Zjistili, že:
- Matematické úkoly: přesnost se zvýšila o 18–38 % s CoT
- Logické úkoly: podobné zlepšení
- Simple tasks (překlad, shrnutí): CoT nepomáhá nebo škodí (jen plýtvá tokeny)
Varianty formulace CoT
Sekce “Varianty formulace CoT”Stejný efekt má víc frází — použij tu, co ti zní přirozeně:
- „Think step by step.” (klasika, EN — nejsilnější)
- „Mysli krok za krokem.” (česky — funguje, ale o trochu slabší)
- „Let’s work through this step by step.” (komunitní)
- „Rozepiš postup, pak dej výsledek.” (explicitnější)
- „Před odpovědí si to rozmysli v hlavě.”
🧪 Experiment 3: Non-math reasoning — rozhodnutí mezi variantami (10 min)
Sekce “🧪 Experiment 3: Non-math reasoning — rozhodnutí mezi variantami (10 min)”CoT není jen na matiku. Funguje stejně dobře na lidská rozhodnutí, kde musíš zvážit víc kritérií. Zkus:
-
Nový chat:
Rozhoduju se, který kurz angličtiny si vzít na rok. 3 možnosti:A) Jazyková škola Klub (6 500 Kč/rok, 2× týdně 90 min večer,rodilý mluvčí, 8 lidí ve skupině, u mě v Praze 15 min)B) Online Preply s konkrétním učitelem (15 Kč/min, cca 1 500 Kčměsíčně, flexibilní časy, individuálně, 1 na 1)C) Duolingo Plus (150 Kč/měsíc, kdykoli, sám, hodně opakování,ale bez mluvení s živým člověkem)Moje priority: chci zlepšit mluvení do maturity (za 8 měsíců),mám 2000 Kč/měsíc budget, 4-5 hodin týdně na angličtinu.Pomoz mi rozhodnout. Mysli krok za krokem — porovnej postupně podlemých priorit, pak dej doporučení. -
Sleduj, jak model projde kritérium po kritériu (cena, čas, efektivita na mluvení, motivace) a pak teprve dá doporučení.
-
Nový chat:
Rozhoduju se, kam dát syna (8 let) do kroužku. 3 možnosti:A) Plavání (ZŠ, pátky 16-17, 300 Kč/měsíc, syn má kamarádaze třídy, ale plachý z vody)B) Judo (sportovní klub, úterky+čtvrtky 17-18, 700 Kč/měsíc,skvělý trenér, ale náročné pro syna — rychle odpadá)C) Šachy (komunitní centrum, středy 17-18, 200 Kč/měsíc,syn je analyticky schopný, ale potřebuje fyzický pohyb)Moje priority: syn potřebuje pohyb (sedí u tabletů), chci zlepšitjeho sebevědomí, rozpočet max 500 Kč/měsíc, 1-2× týdně je OK.Pomoz mi rozhodnout. Mysli krok za krokem — zvaž postupně mojepriority a syna osobnost, pak dej doporučení. -
Sleduj, jak model analyzuje postupně každé kritérium (pohyb, sebevědomí, rozpočet, časová nabídka) a dá doporučení s odůvodněním.
Tohle je reálné rozhodování — nic matematického. CoT pomáhá, protože donutí model zvážit všechno, ne jen skočit k názoru. Bez CoT dostaneš odpověď typu: „Doporučuju A.” Bez odůvodnění. S CoT: strukturovaná analýza + doporučení, které si můžeš zpochybnit.
🧪 Experiment 4: Pokročilejší — few-shot + CoT (7 min)
Sekce “🧪 Experiment 4: Pokročilejší — few-shot + CoT (7 min)”Kombinace obou technik je ještě silnější. Ukaž modelu příklady s postupem — tentokrát na non-math úkolu (posouzení variant).
-
Nový chat:
Posuď nabídky letních brigád. Ukaž POSTUP (kritéria + váhy), pak DOPORUČENÍ.PŘÍKLAD 1:Brigáda: Pokladní v Kauflandu, 150 Kč/h, dojezd 30 min autobusem,červenec 8-16, zkušenost: potřebná, školení ano.Postup:- Plat: 150 Kč/h × 160 h = 24 000 Kč / měsíc (slušné)- Dojezd: 30 min autobusem tam+zpět = 1 h ztráty denně- Zkušenost: školení je OK start, ale pokladna není atraktivní do CV- Dostupnost: plný úvazek = OK, zapadne do letního plánuDoporučení: BERU POKUD nic lepšího nenajdu (60/100).PŘÍKLAD 2:Brigáda: Pomocník v IT startupu, 200 Kč/h, home office, srpenflexibilní čas 20 h/týden, zkušenost: Python/Linux vítán.Postup:- Plat: 200 Kč/h × 80 h = 16 000 Kč / měsíc (méně hrubého, ale z home office)- Dojezd: 0 (home office velká plus)- Zkušenost: Python/Linux = dramatic CV boost pro další- Dostupnost: 20 h/týden = víc času na vlastní projekty / odpočinekDoporučení: BERU (85/100) — menší plat, ale CV a flexibilita vyhrávají.---Teď ty:Brigáda: Obsluha v kavárně, 130 Kč/h + spropitné cca 50 Kč/h,dojezd 10 min pěšky, červenec a srpen, 6 dní/týden 10-18, zkušenostne potřebná.Postup: -
Model napíše přesně v tvém formátu — postup + doporučení. Few-shot vzor + CoT reasoning.
-
Nový chat:
Posuď nabídky dovolené. Ukaž POSTUP (kritéria + váhy), pak DOPORUČENÍ.PŘÍKLAD 1:Dovolená: All-inclusive Egypt, 7 nocí, 4* hotel u moře,cena 18 000 Kč/osoba, termín červenec, přímý let z Prahy.Postup:- Cena: 18 000 × 4 = 72 000 Kč (středně drahé)- Koupání/počasí: garantované slunce, moře- Pohodlí: all-inclusive = nemusím řešit jídla ani večerní nudu- Děti: animace v hotelu ano- Autentičnost: minimální, turistická enklávaDoporučení: BERU POKUD chceme odpočinek, ne objevování (65/100).PŘÍKLAD 2:Dovolená: Chorvatsko auto, apartmán u moře, 14 nocí,cena 22 000 Kč/rodina celkem, termín srpen, 12 h autem z Prahy.Postup:- Cena: 22 000 Kč (výrazně levnější, na rozdíl od AI jídlo zvlášť)- Koupání: Jadran, čisté moře, přímo u apartmánu- Pohodlí: vlastní kuchyně = úspora + flexibilita s dětmi- Děti: pláž + procházky, volnost- Autentičnost: poznání místních měst a hospodDoporučení: BERU (85/100) — levnější, flexibilní, autentičtější.Auto je náročné, ale vyplatí se.---Teď ty:Dovolená: Itálie Lago di Garda, 10 nocí v apartmánu,cena 16 000 Kč/rodina, termín září, 8 h autem z Prahy,poblíž historické městečko.Postup: -
Model napíše přesně v tvém formátu — postup + doporučení. Few-shot vzor + CoT reasoning.
Meta-lekce: Tohle je přesně to, co budeš dělat v Bloku 04 — kombinace few-shot (formát analýzy) + CoT (postup hodnocení) + 5 komponent. Dnes jen pocit, zítra produkce.
⚠️ Kdy NEPOUŽÍVAT CoT
Sekce “⚠️ Kdy NEPOUŽÍVAT CoT”CoT škodí nebo plýtvá tokeny, když:
- ❌ Úkol je triviálně jednoduchý (překlad, shrnutí, klasifikace krátkého textu)
- ❌ Chceš stručnou odpověď — CoT vygeneruje 500 slov postupu před 10-slovní odpovědí
- ❌ Kreativní úkoly — „napiš básničku step by step” je fail
- ❌ Moderní reasoning modely (Claude 4 Extended Thinking, o1) to dělají samy interně — explicitní CoT je zbytečný
Pro tvoje použití (dnes): CoT je super na reasoning, plánování, math. Pro běžné shrnutí / extrakci je to overkill.
🧠 Tři praktické situace, kdy použít CoT
Sekce “🧠 Tři praktické situace, kdy použít CoT”- Plánování tvého času / rozpočtu — více proměnných, váhání
- Rozhodnutí mezi variantami — ceny, preference, omezení
- Otázky, kdy LLM „skáče k odpovědi” — vědecké výpočty, statistiky, logické hádanky