Skip to content
Snippets Groups Projects

Skript na zkracování oficiálních jmen škol

Closed Václav Volhejn requested to merge shorten-schools into master

Skript přečte z databáze názvy škol a vytvoří zkrácené verze. Např. místo "Základní škola T.G. Masaryka Rajhrad, okres Brno-venkov, příspěvková organizace" vytvoří "ZŠ T.G. Masaryka, Rajhrad".

Merge request reports

Loading
Loading

Activity

Filter activity
  • Approvals
  • Assignees & reviewers
  • Comments (from bots)
  • Comments (from users)
  • Commits & branches
  • Edits
  • Labels
  • Lock status
  • Mentions
  • Merge request status
  • Tracking
  • tqdm je pěkný trik, díky :)

    Líbilo by se mi, kdyby se to dalo spustit s nějakým přepínačem (obvykle používáme -n neboli --dry-run), se kterým by to nic neměnilo v DB a jenom vypsalo, co se to chystá přejmenovat.

    Díval jsem se na vygenerovaná jména. Vesměs dobré, je mě zarazilo:

    #1335: Trojské gymnázium s.r.o. -> Trojské G, Praha 7
    #977: Tyršova základní škola, Brno, Kuldova 38 -> Tyršova ZŠ Brno

    V prvním případě je před městem čárka, v druhém není. Tuším systematický problém.

    #2980: Gymnázium, Praha 2, Botičská 1 -> G Praha 2

    Tohle není dobré zkracovat, když jsou na P2 i jiná gymnázia.

    #4784: Základní škola Smržovka, okres Jablonec nad Nisou - příspěvková organizace -> ZŠkaka

    Cože? :-)

    Jinak na úpravu v DB by mělo stačit změnit atribut name v objektech, které sis přečetl z DB, a pak provést session.commit().

  • Díky za odchycení, opraveno. Určitě tam ještě budou nějaké okrajové případy, kterých jsem si nevšiml, ale snad už jsou dostatečně vzácné.

    První problém byla technická drobnost, opraveno.

    Druhý případ: na P2 je jediné další gymnázium "Arcibiskupské G Praha 2", se kterým to nenašlo konflikt kvůli tomu "Arcibiskupské" - neumím vyřešit systematicky, ale dal jsem tam prostě natvrdo podmínku, že v Praze to chce přesnější identifikátor.

    A krásné "ZŠkaka" vzniklo tak, že jsem zapomněl escapovat tečky v regexu obsahujícím s.r.o. a ukázalo se, že Smržovka ho matchuje :)

    Ještě se může někdy stát, že název už obsahuje město a nenajdeme ho, a pak vznikne třeba "ZŠ a MŠ v Olešnici v Orlických horách, Olešnice v Orlických horách". Těchhle případů je ale <100 a názvů, které opravdu město neobsahují, je asi 500, tak jsem to nechal plavat.

    Jinak na úpravu v DB by mělo stačit

    Tohle mi předtím nějak nešlo v Jupyter Notebooku, ale tady to funguje, díky.

  • added 1 commit

    • 33d1b36c - Opravit nalezené chyby/okrajové případy

    Compare with previous version

  • assigned to @mj

  • Martin Mareš added 1 commit

    added 1 commit

    • fe5a209d - shorten-schools: Kosmetická vylepšení dry-run

    Compare with previous version

  • Maličko jsem vylepšil --dry-run.

    Ještě jedna maličkost: máme spoustu ZŠ a MŠ Město, k některým existuje i ZŠ Město. Tak ještě prosím všechny ZŠ a MŠ předělej na , ať se účastní řešení konfliktů.

    Jinak už mi to přijde dobré.

  • A krásné "ZŠkaka" vzniklo tak, že jsem zapomněl escapovat tečky v regexu obsahujícím s.r.o. a ukázalo se, že Smržovka ho matchuje :)

    Dokonalé :upside_down:

  • added 1 commit

    • 473a11f9 - Zkrátit 'ZŠ a MŠ' na 'ZŠ'

    Compare with previous version

  • Ještě tam nějaké systematické problémy jsou, například to občas generuje divné čárky za typem školy:

    ZŠ Kvasice      Základní škola, Kvasice, okres Kroměříž
    ZŠ, Lesonice    Základní škola, Lesonice, okres Znojmo, příspěvková organizace

    Ale asi bych to už v současné podobě nasadil. Je to dost dobré a teď spíš bude potřeba, aby ses věnoval něčemu důležitějšímu.

    Takže mergeuji do master a tento MR zavírám.

  • closed

Please register or sign in to reply
Loading