Neučí se jazyk na školách špatně a jak pracují AI modely?

Nedávno jsem začal opět přemýšlet nad tím, jak probíhá výuka (nejen) mateřského jazyka na základních školách a proč se děti učí takový objem věcí, které jim prakticky v životě asi k ničemu nebudou. A ne, není to jenom povzdech jen tak do prázdna, ale souvisí to s tím, jak si AI za několik málo let osvojila prakticky každý jazyk na světě a jak s ním dokáže vyjádřit téměř vše. I bez toho, že by se učila větné členy a podobné konstrukty.

Pojďme se na začátek podívat na několik bodů, které hrají v neprospěch standardní výuky.

Hlavní problém školství je, že k jazyku přistupuje jako k exaktní vědě, kdy se ho učíme rozebírat na “orgány” (přísudek, přívlaste shodný, vedlejší věty,…), místo aby se v něm od mala lidé učili žít. Jinými slovy, většina rodilých mluvčí neumí pojmenovat gramatické kategorie a přitom mluví brilatně.
Školní docházka, resp. výuka jazyka trvá roky. Ale kdo po devíti letech dokáže napsat opravdu poutavý text nebo po sedmi letech angličtiny plynule komunikovat?
Systém je založen na odhalování chyb a ne na rozvíjení samotného obsahu. Jedna špatná čárka nebo špatné i/y a celý text je v tu chvíli špatně.

Jak to dělá AI?

Ai neví kam patří čárka nebo co je to přívlastková věta. Pro ni je to jen matematická pravděpodobnost. AI totiž pracuje s velkým objemem dat, ze kterého dokáže identifikovat vazby, které dávají největší “smysl”. Jinými slovy, proces trénování AI probíhá ve fázích, které mnohem více připomínají to, jak nasáváme informace v realitě.

Učení bez učitele (Unsupervised Learning): AI se „předtrénuje“ na gigantickém množství textů. Nikdo jí neříká: „Tohle je podmět.“ Ona prostě pozoruje miliardy vět a sama “pochopí”, že po slově „Mám“ pravděpodobně následuje podstatné jméno a ne sloveso v minulém čase. Nasává strukturu světa skrze statistiku a souvislosti. Je to uplně stejné, jak se dítě učí mluvit. Prostě je v nějakém prostředí a po čase začne rozumět, aniž by si přečetlo učebnici češtiny.

Fine-tuning (Ladění): Tady model dostává vzorové instrukce a správné odpovědi. Mění se parametry tak, aby jeho odpovědi byly správné z pohledu tvůrců. Je to vlastně ladění stylu a přesnosti.

Reinforcement Learning with Human Feedback (Učení s lidskou zpětnou vazbou): Zde nejde ani tak o správnost odpovědí, ale o respektování principu tří H (helpful, harmless, honest), který je dnes vlastní všem jazykovým modelům. Model by měl být nápomocný, neškodný a upřímný. Zkrátka takový ideální prototyp vašeho kolegy.

Red teaming: specializovaní experti zkoušejí modely rozbít. Hledají odpovědi, které by mohly zapříčinit skandál, žalobu nebo nějakou škodu. Potlačuje se možný výskyt určitých odpovědí.

Vygenerovaná grafika s pomocí AI. Chyby v textu nechávám záměrně jako ukázku toho, jak se AI sama naučila pracovat s textem při tvorbě vizuálních děl.

Mimochodem tyto principy má výborně vysvětlena IBM na svém Youtube.

Čas na update vzdělávání

Pohled na trénování AI nám ukazuje, že se to dá dělat jinak. Lpění na poučkách a detailních gramatických pravidlech je celkem plýtvání časem. Lidé mají tendenci nacházet ve všem řád, ale jazyk je přitom velmi organická záležitost. Vznikl časem, jak se lidé mezi sebou potřebovali dorozumívat. A i přesto, že se podařilo do určité míry nějaká pravidla definovat, stejně obsahují řadu výjimek. Nakonec jazyk se neustále vyvíjí. Stačí si přečíst novinové články staré pár desítek let a na první pohled poznáme, že se jedná o starší text (a nemám na mysli obsahově, ale stylisticky).

Kam tedy bude směřovat současný vývoj? A nestálo by za to, kdyby se děti na školách zabývaly přece jenom méně biflováním pravidel, ale naopak se učily v jazyku lépe vyjadřovat a formulovat myšlenky?