Často kladené dotazy

Jak to funguje?

V podstatě vezmu nějakej vzorek textu (právě teď to jsou  http://dl.dropbox.com/u/1054094/tem/hlasky_kaluza_update.htm ) a zbavím ho veškerejch věcí, který s vlastním textem nemají nic společnýho (HTML, Javascript). Co zbyde se rozseká na slova a z nich se udělá model N-gramů, což je něco jako zjištění všech kombinací ntic slov v textu (ngramům se dvěma slovama se říká bigram a se třema trigram) a jejich frekvencí. Na základě toho modelu se pak vygeneruje text. Na začátek textu se používá prvních pár ntic modelu. To není úplně ideální, takže generuju ještě jeden krátkej text a počáteční slova beru z něj.

Proč to děláš?

Jsem fanouškem Mgr. Radovana Kaluži.

A to je kdo?

Ja nevim.

Co je "Kaluža turbo"?

Kaluža turbo používá k vygenerování textu trigramy namísto bigramů (viz. předchozí).

Proč je to tak ošklivý?

Nemám čas ani grafický cítění. Pokud bys měl hezkej grafickej návrh, určitě se ozvi.

Jsou tyhle stránky hostovány na Banan.cz?

Samozřejmě ne.

Jsi metrosexuál?

Každým coulem.

Kolik máš luxusních vil?

Zatím bydlím v podnájmu.

Asi se nudíš, viď?

Jo.

Hele, chci udělat něco podobnýho...

Kostra těhle stránek bylo víceméně tohle. Jinak zdroják Laholátoru (obdoba) najdeš na GitHubu. Klidně si posluž.

Mojmíre?

Martine!

text Mgr. Radovan Kaluža, prgačina starenka L.P. MMXI, jede na Flask & NLTK
Už jsme sežrali 49141 banánů.