From 87666fc8360145482c583179f1754c6f66d49988 Mon Sep 17 00:00:00 2001 From: Martin Mares <mj@ucw.cz> Date: Sat, 17 May 2025 21:58:31 +0200 Subject: [PATCH] =?UTF-8?q?Unicode:=20Dal=C5=A1=C3=AD=20security=20issue?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- unicode/tahak.txt | 2 ++ 1 file changed, 2 insertions(+) diff --git a/unicode/tahak.txt b/unicode/tahak.txt index 3eb32bc..cb260fc 100644 --- a/unicode/tahak.txt +++ b/unicode/tahak.txt @@ -133,6 +133,8 @@ Odkazy na Unicode 13.0.0: [s1] -> stránka standardu, [x01] -> example z code ch je nutné pečlivě normalizovat => problémy s bezpečností, s filesystémy - podobné problémy s UTF-8 / UTF-16, pokud se dekóduje ledabyle - stejně vypadající znaky => phishing +- LLM interpretovaly tagovací abecedu jako písmenka, přestože nemá definovanou dekompozici + a je kategorizovaná jako řídicí znaky ### Emoji ### -- GitLab