Chain of Thought — magie dvou slov

⏱ Odhadovaný čas 45 min

📍 Pozice Den 2, blok 4 / 7

🎯 Po tomto bloku budeš umět

Ukázal(a) jsi sobě, jak CoT opraví halucinaci v matematickém problému
Umíš 3 různé frázování CoT (zero-shot CoT, step-by-step, scratchpad)
Poznáš úkoly, kde CoT NENÍ potřeba (a neplýtváš tokeny)

🧪 Experiment 1: Problém, na kterém LLM BEZ CoT selže (7 min)

Otevři claude.ai, nový chat.

Napiš přesně tohle:

V košíku mám 5 jablek. Snědl jsem 2. Přidal jsem ještě 3 broskve.
Pak mi soused dal 4 švestky. Kolik kusů ovoce celkem mám teď v košíku?

Sleduj odpověď.

Odpověď je nejspíš správná (10 kusů). Moderní modely (Claude 4, GPT-4) často trefí. Ale:

Starší modely to trefovaly jen asi v 40-60 %.
Důvod: LLM „skočí rovnou” k odpovědi místo aby si to spočítalo.

Zkus teď těžší problém:

V obchodě byly slevy:
- Každé 3. zboží je zdarma.
- Pokud celkem utratíš přes 1000 Kč, dostaneš navíc 10% slevu z finální ceny.

Koupil jsem 7 triček po 199 Kč. Kolik zaplatím?

Tady modely pravidelně halucinují. Zkus to a podívej se, jestli odpověď dává smysl (správně je, že dostaneš 2 trička zdarma — tzn. platíš za 5 × 199 = 995 Kč, to je pod 1000, takže žádná 10% sleva. Finální cena: 995 Kč).

🧪 Experiment 2: Jedno kouzlo — „think step by step” (8 min)

Nový chat. Stejný problém, ale přidej jednu větu na konec:

V obchodě byly slevy:
- Každé 3. zboží je zdarma.
- Pokud celkem utratíš přes 1000 Kč, dostaneš navíc 10% slevu z finální ceny.

Koupil jsem 7 triček po 199 Kč. Kolik zaplatím?

Think step by step.

Sleduj odpověď.

Odpověď teď bude postupná:

„Nejdřív spočítám, kolik triček dostanu zdarma…”
„Pak spočítám cenu po slevě na kusy…”
„Pak zkontroluji, jestli přesáhla 1000 Kč…”
„Finální částka: …”

A bude správně. Tohle je Chain of Thought v nejjednodušší podobě — jedna magická fráze.

📚 Proč to funguje (5 min teorie)

Intuice: student na tabuli

Student, co má rovnou napsat výsledek, to často plácne. Student, co má napsat postup, je nucený si to rozmyslet a dojít ke správné odpovědi.

LLM je stejné. Každé slovo, které generuje, se opírá o předchozí slova. Když napíše postup, každý další krok staví na logice předchozího. Bez postupu jen hádá výsledek podle vzorů.

Paper (Wei et al., 2022)

Fráze „Think step by step” pochází z paperu Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., Google Research, 2022). Zjistili, že:

Matematické úkoly: přesnost se zvýšila o 18–38 % s CoT
Logické úkoly: podobné zlepšení
Simple tasks (překlad, shrnutí): CoT nepomáhá nebo škodí (jen plýtvá tokeny)

Varianty formulace CoT

Stejný efekt má víc frází — použij tu, co ti zní přirozeně:

„Think step by step.” (klasika, EN — nejsilnější)
„Mysli krok za krokem.” (česky — funguje, ale o trochu slabší)
„Let’s work through this step by step.” (komunitní)
„Rozepiš postup, pak dej výsledek.” (explicitnější)
„Před odpovědí si to rozmysli v hlavě.”

🧪 Experiment 3: Non-math reasoning — rozhodnutí mezi variantami (10 min)

CoT není jen na matiku. Funguje stejně dobře na lidská rozhodnutí, kde musíš zvážit víc kritérií. Zkus:

Student A (škola/hry)
Student B (domácnost)

Nový chat:

Rozhoduju se, který kurz angličtiny si vzít na rok. 3 možnosti:

A) Jazyková škola Klub (6 500 Kč/rok, 2× týdně 90 min večer,
   rodilý mluvčí, 8 lidí ve skupině, u mě v Praze 15 min)
B) Online Preply s konkrétním učitelem (15 Kč/min, cca 1 500 Kč
   měsíčně, flexibilní časy, individuálně, 1 na 1)
C) Duolingo Plus (150 Kč/měsíc, kdykoli, sám, hodně opakování,
   ale bez mluvení s živým člověkem)

Moje priority: chci zlepšit mluvení do maturity (za 8 měsíců),
mám 2000 Kč/měsíc budget, 4-5 hodin týdně na angličtinu.

Pomoz mi rozhodnout. Mysli krok za krokem — porovnej postupně podle
mých priorit, pak dej doporučení.

Sleduj, jak model projde kritérium po kritériu (cena, čas, efektivita na mluvení, motivace) a pak teprve dá doporučení.

Nový chat:

Rozhoduju se, kam dát syna (8 let) do kroužku. 3 možnosti:

A) Plavání (ZŠ, pátky 16-17, 300 Kč/měsíc, syn má kamaráda
   ze třídy, ale plachý z vody)
B) Judo (sportovní klub, úterky+čtvrtky 17-18, 700 Kč/měsíc,
   skvělý trenér, ale náročné pro syna — rychle odpadá)
C) Šachy (komunitní centrum, středy 17-18, 200 Kč/měsíc,
   syn je analyticky schopný, ale potřebuje fyzický pohyb)

Moje priority: syn potřebuje pohyb (sedí u tabletů), chci zlepšit
jeho sebevědomí, rozpočet max 500 Kč/měsíc, 1-2× týdně je OK.

Pomoz mi rozhodnout. Mysli krok za krokem — zvaž postupně moje
priority a syna osobnost, pak dej doporučení.

Sleduj, jak model analyzuje postupně každé kritérium (pohyb, sebevědomí, rozpočet, časová nabídka) a dá doporučení s odůvodněním.

Tohle je reálné rozhodování — nic matematického. CoT pomáhá, protože donutí model zvážit všechno, ne jen skočit k názoru. Bez CoT dostaneš odpověď typu: „Doporučuju A.” Bez odůvodnění. S CoT: strukturovaná analýza + doporučení, které si můžeš zpochybnit.

🧪 Experiment 4: Pokročilejší — few-shot + CoT (7 min)

Kombinace obou technik je ještě silnější. Ukaž modelu příklady s postupem — tentokrát na non-math úkolu (posouzení variant).

Student A (škola/hry)
Student B (domácnost)

Nový chat:

Posuď nabídky letních brigád. Ukaž POSTUP (kritéria + váhy), pak DOPORUČENÍ.

PŘÍKLAD 1:
Brigáda: Pokladní v Kauflandu, 150 Kč/h, dojezd 30 min autobusem,
červenec 8-16, zkušenost: potřebná, školení ano.
Postup:
- Plat: 150 Kč/h × 160 h = 24 000 Kč / měsíc (slušné)
- Dojezd: 30 min autobusem tam+zpět = 1 h ztráty denně
- Zkušenost: školení je OK start, ale pokladna není atraktivní do CV
- Dostupnost: plný úvazek = OK, zapadne do letního plánu
Doporučení: BERU POKUD nic lepšího nenajdu (60/100).

PŘÍKLAD 2:
Brigáda: Pomocník v IT startupu, 200 Kč/h, home office, srpen
flexibilní čas 20 h/týden, zkušenost: Python/Linux vítán.
Postup:
- Plat: 200 Kč/h × 80 h = 16 000 Kč / měsíc (méně hrubého, ale z home office)
- Dojezd: 0 (home office velká plus)
- Zkušenost: Python/Linux = dramatic CV boost pro další
- Dostupnost: 20 h/týden = víc času na vlastní projekty / odpočinek
Doporučení: BERU (85/100) — menší plat, ale CV a flexibilita vyhrávají.

---

Teď ty:
Brigáda: Obsluha v kavárně, 130 Kč/h + spropitné cca 50 Kč/h,
dojezd 10 min pěšky, červenec a srpen, 6 dní/týden 10-18, zkušenost
ne potřebná.
Postup:

Model napíše přesně v tvém formátu — postup + doporučení. Few-shot vzor + CoT reasoning.

Nový chat:

Posuď nabídky dovolené. Ukaž POSTUP (kritéria + váhy), pak DOPORUČENÍ.

PŘÍKLAD 1:
Dovolená: All-inclusive Egypt, 7 nocí, 4* hotel u moře,
cena 18 000 Kč/osoba, termín červenec, přímý let z Prahy.
Postup:
- Cena: 18 000 × 4 = 72 000 Kč (středně drahé)
- Koupání/počasí: garantované slunce, moře
- Pohodlí: all-inclusive = nemusím řešit jídla ani večerní nudu
- Děti: animace v hotelu ano
- Autentičnost: minimální, turistická enkláva
Doporučení: BERU POKUD chceme odpočinek, ne objevování (65/100).

PŘÍKLAD 2:
Dovolená: Chorvatsko auto, apartmán u moře, 14 nocí,
cena 22 000 Kč/rodina celkem, termín srpen, 12 h autem z Prahy.
Postup:
- Cena: 22 000 Kč (výrazně levnější, na rozdíl od AI jídlo zvlášť)
- Koupání: Jadran, čisté moře, přímo u apartmánu
- Pohodlí: vlastní kuchyně = úspora + flexibilita s dětmi
- Děti: pláž + procházky, volnost
- Autentičnost: poznání místních měst a hospod
Doporučení: BERU (85/100) — levnější, flexibilní, autentičtější.
Auto je náročné, ale vyplatí se.

---

Teď ty:
Dovolená: Itálie Lago di Garda, 10 nocí v apartmánu,
cena 16 000 Kč/rodina, termín září, 8 h autem z Prahy,
poblíž historické městečko.
Postup:

Model napíše přesně v tvém formátu — postup + doporučení. Few-shot vzor + CoT reasoning.

Meta-lekce: Tohle je přesně to, co budeš dělat v Bloku 04 — kombinace few-shot (formát analýzy) + CoT (postup hodnocení) + 5 komponent. Dnes jen pocit, zítra produkce.

⚠️ Kdy NEPOUŽÍVAT CoT

CoT škodí nebo plýtvá tokeny, když:

❌ Úkol je triviálně jednoduchý (překlad, shrnutí, klasifikace krátkého textu)
❌ Chceš stručnou odpověď — CoT vygeneruje 500 slov postupu před 10-slovní odpovědí
❌ Kreativní úkoly — „napiš básničku step by step” je fail
❌ Moderní reasoning modely (Claude 4 Extended Thinking, o1) to dělají samy interně — explicitní CoT je zbytečný

Pro tvoje použití (dnes): CoT je super na reasoning, plánování, math. Pro běžné shrnutí / extrakci je to overkill.

🧠 Tři praktické situace, kdy použít CoT

Plánování tvého času / rozpočtu — více proměnných, váhání
Rozhodnutí mezi variantami — ceny, preference, omezení
Otázky, kdy LLM „skáče k odpovědi” — vědecké výpočty, statistiky, logické hádanky

✅ Chápu CoT, vím kdy (a kdy ne) použít

Pokračovat na blok 04: Guided kombinace →