Skript na zkracování oficiálních jmen škol
Skript přečte z databáze názvy škol a vytvoří zkrácené verze. Např. místo "Základní škola T.G. Masaryka Rajhrad, okres Brno-venkov, příspěvková organizace" vytvoří "ZŠ T.G. Masaryka, Rajhrad".
Merge request reports
Activity
tqdm je pěkný trik, díky :)
Líbilo by se mi, kdyby se to dalo spustit s nějakým přepínačem (obvykle používáme
-n
neboli--dry-run
), se kterým by to nic neměnilo v DB a jenom vypsalo, co se to chystá přejmenovat.Díval jsem se na vygenerovaná jména. Vesměs dobré, je mě zarazilo:
#1335: Trojské gymnázium s.r.o. -> Trojské G, Praha 7 #977: Tyršova základní škola, Brno, Kuldova 38 -> Tyršova ZŠ Brno
V prvním případě je před městem čárka, v druhém není. Tuším systematický problém.
#2980: Gymnázium, Praha 2, Botičská 1 -> G Praha 2
Tohle není dobré zkracovat, když jsou na P2 i jiná gymnázia.
#4784: Základní škola Smržovka, okres Jablonec nad Nisou - příspěvková organizace -> ZŠkaka
Cože? :-)
Jinak na úpravu v DB by mělo stačit změnit atribut
name
v objektech, které sis přečetl z DB, a pak provéstsession.commit()
.Díky za odchycení, opraveno. Určitě tam ještě budou nějaké okrajové případy, kterých jsem si nevšiml, ale snad už jsou dostatečně vzácné.
První problém byla technická drobnost, opraveno.
Druhý případ: na P2 je jediné další gymnázium "Arcibiskupské G Praha 2", se kterým to nenašlo konflikt kvůli tomu "Arcibiskupské" - neumím vyřešit systematicky, ale dal jsem tam prostě natvrdo podmínku, že v Praze to chce přesnější identifikátor.
A krásné "ZŠkaka" vzniklo tak, že jsem zapomněl escapovat tečky v regexu obsahujícím
s.r.o.
a ukázalo se, že Smržovka ho matchuje :)Ještě se může někdy stát, že název už obsahuje město a nenajdeme ho, a pak vznikne třeba "ZŠ a MŠ v Olešnici v Orlických horách, Olešnice v Orlických horách". Těchhle případů je ale <100 a názvů, které opravdu město neobsahují, je asi 500, tak jsem to nechal plavat.
Jinak na úpravu v DB by mělo stačit
Tohle mi předtím nějak nešlo v Jupyter Notebooku, ale tady to funguje, díky.
assigned to @mj
added 1 commit
- fe5a209d - shorten-schools: Kosmetická vylepšení dry-run
Ještě tam nějaké systematické problémy jsou, například to občas generuje divné čárky za typem školy:
ZŠ Kvasice Základní škola, Kvasice, okres Kroměříž ZŠ, Lesonice Základní škola, Lesonice, okres Znojmo, příspěvková organizace
Ale asi bych to už v současné podobě nasadil. Je to dost dobré a teď spíš bude potřeba, aby ses věnoval něčemu důležitějšímu.
Takže mergeuji do master a tento MR zavírám.