Idea
- Zdrojová data držet separatně od logiky výpočtu.
- Výpočet mít v jupyter notebooku z důvodu možnosti obsáhle komentovat probíhající výpočty a je snadné vykostit skriptíky do separátího souboru a ten někde pravidelě pouštět.
- Navrhuju počítat skore pro každou školu na základě zdrojových dat - ze skore následně relativně odvodit vůči zbytku škol "jak na tom je" - mám rád relativní srovnání.
- Pravidla si musíme říct - já nemám vůbec kontext co je klíčové, tak by to sneslo asi nějaký confcall si to říct.
- Vizualizaci oddělit od výpočtů - vznikne výstupní tabulka, kterou se bude dát krmit nějaké vizualizovátko (Google Data Studio, what ever)
Řešení
Technologie
- Zdroj dat: Google Sheet + Google API;
- Logika: Python v JupyterNotebooku sdílený přes GitHub (privátní / soukromý repo)
- Výstup: Google Sheet
- Vizualizace: Google Data Studio / ???
Open-pointy
Otázka | Odpověď | ||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Eva Pavlíková výstupem má být obohacení toho reportu co je tady - https://www.ucimeonline.cz/o-nas - nebo zcela nová mapa ČR, kde budou data o kterých jsme se bavili? | |||||||||||||||||||||||||||||||||||
Eva Pavlíková vadilo by kdybych vynechal kompletně Data Studio od Google v případě fungl nové mapy? Mě přijde, že by se to dalo vizualizovat i v jiném nástroji. | |||||||||||||||||||||||||||||||||||
co znamenají ty závorky? Resp. celé ty názvy - chápu ZŠ, ale nechápu Jen technika a závorka mi taky uniká. Ex post jsem našel -viz níže - tak si tak nějak říkám jstli ty listy nejsou vlastně přerozdělené školy podle té statistické tabulky. Asi jo, dává my to smysl. | |||||||||||||||||||||||||||||||||||
Eva Pavlíková koukal jsem na ty data a jako nemám pocit, že by cokoliv z toho splňovalo povahu osobních dat. Ale říkám si že asi není gut, to uplně nahrát na soukromej Google Drive. Tak pak se budeme muset domluvit, že to pod tvůj účet někam někde nahrajeme do Drive a dáš mi práva. Rád bych abys vlastníkem dokumentu byla ty a já tam případně jen pracoval. | |||||||||||||||||||||||||||||||||||
Eva Pavlíková delam si nejakou mapovaci tabulku, ktery vysvetluje vyznam jednotlivych sloupcu - u těch otázek - tam je to jednoduché jako facka co znamená klíč a co ta hodnota, ale u některých sloupců je pro mě jakožto člověk kompletně mimo školství poznat co je co, existuje možnost jak to doplnit, abych plně rozumněl významu těch hodnot? jde mi zatím o toto:
| |||||||||||||||||||||||||||||||||||
Eva Pavlíková v datech byla označená duplicita - jde o střední školu. Vypadá to jak když to vyplnili dvakrát pokaždé jinak, tak buď vezmu záznam, kde je víc dat, nebo to ručně zmerguju nebo záznam jako chybu vyhodím uplně. Osobně bych to vyhodil. Lepší než aby někde svítilo že jsou na tom blbě když to enní třeba pravda. Tak estli na to máš názor. Tkahle jak to je to bude dělat bordel. | |||||||||||||||||||||||||||||||||||
Eva Pavlíková je požadované, aby bylo možné vizualizovat progress v čase nebo nás zajímá pouze stav, který se bude dát updatnout - ručně/ automaticky. Jen dopředu říkám, že ten progress bude pro mě extra práce, to budu muset prokoumesit jak na to bo to můžeme udělat na více slotů - nejdřív hloupě a pak nějak vývoj v čase. Kardinální vlastně je, jestli bude z čeho to počítat |