From 87666fc8360145482c583179f1754c6f66d49988 Mon Sep 17 00:00:00 2001
From: Martin Mares <mj@ucw.cz>
Date: Sat, 17 May 2025 21:58:31 +0200
Subject: [PATCH] =?UTF-8?q?Unicode:=20Dal=C5=A1=C3=AD=20security=20issue?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 unicode/tahak.txt | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/unicode/tahak.txt b/unicode/tahak.txt
index 3eb32bc..cb260fc 100644
--- a/unicode/tahak.txt
+++ b/unicode/tahak.txt
@@ -133,6 +133,8 @@ Odkazy na Unicode 13.0.0: [s1] -> stránka standardu, [x01] -> example z code ch
   je nutné pečlivě normalizovat => problémy s bezpečností, s filesystémy
 - podobné problémy s UTF-8 / UTF-16, pokud se dekóduje ledabyle
 - stejně vypadající znaky => phishing
+- LLM interpretovaly tagovací abecedu jako písmenka, přestože nemá definovanou dekompozici
+  a je kategorizovaná jako řídicí znaky
 
 ### Emoji ###
 
-- 
GitLab