diff --git a/unicode/tahak.txt b/unicode/tahak.txt
new file mode 100644
index 0000000000000000000000000000000000000000..04a485ff2fa9263d0f54c7d791d7ebe7defbd6ab
--- /dev/null
+++ b/unicode/tahak.txt
@@ -0,0 +1,160 @@
+Unicode
+=======
+
+Historie: 5 -> 6 -> 7 -> 8 -> 16 -> 16+ bitů na znak
+
+Odkazy na Unicode 13.0.0: [s1] -> stránka standardu, [x01] -> example z code charts
+
+- snaží se reprezentovat znaky všech světových abeced
+- reprezentuje znaky (sémantiku), nikoli glyfy (konkrétní grafickou podobu)
+- snaží se o vztah 1:1 se všemi používanými kódováními => nesystematičnosti
+- též standardizováno jako ISO 10646
+
+### Codepointy ###
+
+- prostor velikosti 17 x 2^16 = 1114112
+- v Unicode 15.0 obsazeno cca 149k codepointů
+- 0000-007f: ASCII včetně řídicích znaků [x00]
+- 0080-00ff: iso-8859-1 včetně řídicích znaků [x02]
+- rozšířená latinka 1 [x05]
+    - pre-komponované znaky s diakritikou
+    - 0130, 0131: turecká i (locale-dependent vztah velké<->malé)
+- rozšířená latinka 2 [x06]
+    - podivná písmena používaná třeba v afrických jazycích
+    - 01C4-01C7: chorvatské dvojznaky (rozlišení uppercase/lowercase/titlecase)
+- fonetická abeceda (IPA) [x09]
+- řečtina a koptština [x20]
+- nejrůznější varianty cyrilice [x25]
+- hlaholice [x26]
+- gruzínština [x30]
+- futhark [x32]
+- egyptské hieroglyfy [x33]
+- CJK = unifikovaná čínština + japonština + korejština [e.g. x35]
+- disk z Faistu [x37]
+- kombinující diakritika [x40]
+    - výjimky pro i, j [s318]
+    - obecně může být shaping složitý [s83]
+- všelijaká interpunkce [x41]
+    - mezery různých šířek [s290]
+    - zero-width (no)breaking space
+    - word joiner (na tomto místě se nesmí zlomit řádek)
+    - zero-width (non-)joiner (týká se ligatur)
+    - různé pomlčky [s292]
+    - soft hyphen
+    - uvozovky [s295]
+- symboly
+    - šipky [x50]
+    - technické symboly [x51]
+    - všehochuť [x52, x53]
+    - skládačka rámečků [x55]
+    - emotikony [x58] (z toho se později vyvinulo emoji)
+- speciální notace
+    - hudební [x60]
+    - Braille [x62]
+    - domino [x63]
+    - šachy [x52, x64]
+    - karty [x65]
+- math
+    - matematické symboly [x70, x71, x72]
+    - letter-like symboly [x73]
+    - šipečky [např. x74]
+    - matematické varianty [x75]
+    - 2063 invisible separator (třeba v M_{ij})
+    - 2062 invisible times (neznačené násobení)
+    - 2064 invisible plus (třeba v "1 3/4")
+- zpětná kompatibilita
+    - pre-komponované znaky
+    - zlomky a římská čísla [x81]
+    - ligatury [x83]
+    - mnoho konců řádků: 000D CR, 000A LF, CR+LF, 0085 NEL,
+      2028 line separator, 2029 paragraph separator
+- private-use oblasti: E000-F8FF, F0000-FFFFD, 100000-10FFFD
+    - neoficiální registr privátních znaků (třeba klingonština)
+- non-characters
+    - FFF9, FFFA, FFFB: inter-lineární anotace [s938]
+    - FFFC: object replacement characters (sem se vloží objekt dodaný OOB)
+    - FFFD: replacement character
+    - FFFE není definováno, FEFF je zero-width no-break space (BOM)
+- variation sequences
+    - FE00-FE0F: selektor grafické varianty
+    - UCD/StandardizedVariants.txt
+    - také se používají pro emoji
+- embedded tags
+    - E0000-E007F je kopie ASCII používaná k tagování + introducers + cancel tag
+    - language tagy (deprecated)
+    - také se používají pro emoji
+
+### Reprezentace ###
+
+- UCS-2
+    - historické: pouze 2^16 codepointů
+    - BE+LE varianta, potřebuje BOM (standard říká, že bez BOM je to BE)
+- UCS-4 alias UTF-32 (BE+LE varianta)
+- UTF-16
+    - reprezentace všech codepointů pomocí 16bitových kódů
+    - surrogates: D800-DBFF high, DC00-DFFF low
+- UTF-8
+    - nadmnožina ASCII, ostatní znaky mají 2 až 4 byty
+    - podmínky na normalizaci: <0x110000, nejkratší kód
+    - neoficiální rozšíření na 64-bitová čísla (Perl5)
+    - samosynchronizující, zachovává lexikografické pořadí
+    - nešvar s BOM
+- UTF-7, Punycode a další
+
+### Tabulky vlastností ###
+
+- UnicodeData.txt:
+    - jméno
+    - general category [s199]
+    - způsob zobrazování (např. směr psaní)
+    - upper/lower/titlecase mappings
+    - numerická hodnota
+    - dekompozice (normální a <compat>)
+    - canonical combining class
+- PropList.txt: další binární vlastnosti
+- NamesList.txt: alternativní jména (též pokud kanonické jméno obsahuje překlep)
+- Scripts.txt: ke kterému písmu co patří
+- SpecialCasing.txt: výjimky z case-folding algoritmů
+
+### Normální formy ###
+
+- kanonická dekompozice (NFD)
+    - akcenty uspořádány podle combining class
+    - v rámci combining class pořadí zachováno
+- kanonická kompozice (NFC)
+    - používáme pre-komponované znaky, kdekoliv možno
+- kompatibilní (de)kompozice (NFKD, NFKC)
+- standard slibuje stabilitu normálních forem
+
+### Problémy ###
+
+- kódování znaků není jednoznačné (rozložené vs. složené znaky),
+  je nutné pečlivě normalizovat => problémy s bezpečností, s filesystémy
+- podobné problémy s UTF-8 / UTF-16, pokud se dekóduje ledabyle
+- stejně vypadající znaky => phishing
+
+### Emoji ###
+
+- <JP: e (obrázek) + moji (znak)
+- "obrázkové" codepointy s variation selectorem:
+    - VS16 = emoji (barevné)
+    - VS15 = text (černobílé)
+
+https://emojipedia.org/
+	-> "czechia" - flag sequences
+	-> "ch-zh" - tag sequences (momentálně jen pro vlajky regionů)
+	-> "person running" - univerzální
+	-> "man running" - person running + ZWJ + male sign
+	-> combining skin tone modifiers
+	-> ZWJ + hair color
+	-> "black cat" - cat + ZWJ + black square
+	-> "astronaut" - person + ZWJ + rocket
+	-> "polar bear" - bear + ZWJ + snowflake
+	-> "family" - složitější konstrukce se ZWJ
+	-> "roger" - pirate flag = blackflag + ZWJ + skull and crossbones
+
+### Odkazy ###
+
+https://shapecatcher.com/
+https://r12a.github.io/uniview/
+https://notofonts.github.io/