diff --git a/unicode/tahak.txt b/unicode/tahak.txt index 3eb32bc0249ad7971e0ccea107acb57c9230ef11..cb260fc0d1122126760cc40435a043385a93cb8c 100644 --- a/unicode/tahak.txt +++ b/unicode/tahak.txt @@ -133,6 +133,8 @@ Odkazy na Unicode 13.0.0: [s1] -> stránka standardu, [x01] -> example z code ch je nutné pečlivě normalizovat => problémy s bezpečností, s filesystémy - podobné problémy s UTF-8 / UTF-16, pokud se dekóduje ledabyle - stejně vypadající znaky => phishing +- LLM interpretovaly tagovací abecedu jako písmenka, přestože nemá definovanou dekompozici + a je kategorizovaná jako řídicí znaky ### Emoji ###