23. června 2016

Nejpopulárnější písničky na Colours of Ostrava 2016 podle Spotify

Pokud se chystáte na hudební festival Colours of Ostrava, tak už asi pomalu začínáte pokukovat po programu a seznamu interpretů. Pár kapel znáte, ale možná si říkáte co dalšího by vám nemělo uniknout.  V tu chvíli si možná i postesknete, že chybí možnost poslechnout si nejlepší písničky od každého zpěváka. A toto trauma jsem vyřešil a sestavil jsem playlist nejlepších písníček podle Spotify. 

Naprogramoval jsem skript, který mi našel na Spotify 3 nejpopulárnější písničky každého zpěváka a seřadil podle popularity písníček (číslo 0-100) 





Konečný seznam je dostupný níže nebo jako playlist YouTube





A jak jsem na to šel? Zde popíšu jen stručně v bodech a snad najdu čas rozepsat více na svém anglickém blogu.

1) Vytvořil jsem si Google Apps Script projekt
2) Vložil jsem do projektu svoji knihovnu na scraping dat3) Našel jsem si jak se načítají účastníci do stránek https://www.colours.cz/4) Při requestu z Apps Scriptů jsem modifikoval Cookie, abych byl jako anglicky mluvící uživatel (kvůli budoucím screenshotům na blog)
5) Stáhnul jsem si všechny interprety do Google Tabulky
6) Našel jsem jak funguje Spotify API. Nejdříve dotaz na vyhledání zpěváka/skupiny a podle jeho ID nalezení nejlepších písníček (https://developer.spotify.com/web-api/console/get-artist-top-tracks/)
7) Uložení TOP 3 písníček od každého zpěváka do Google Tabulky.
8) Napojení na YouTube API a nalezení videa hledané písničky
9) Uložení do speciálního playlistu

Co se týče dat, původně jsem plánoval napojit se na LAST.FM, ale tam mi data nepřijdou tolik relevantní protože to poslouchá cílovka geeků. Spotify je více rozšířeno mezi běžnými uživateli a lze očekávat zajímavější data. Navíc jsem si chtěl zkusit jejich API.

Cca 24 kapel jsem nenašel (z celkových 124). Opravu a ruční hledání jsem nedělal, takže tam budou asi pouze známější.




Zajímá tě více?

18. září 2015

Vizualizace nejvytíženějších poboček České spořitelny aneb víté kdy máte jít do banky?

Rozhodl jsem se po dlouhé době pro několik věcí - napsat článek v češtině (občas bloguju anglicky na http://kutil.org),  pohrát si daty a zkusit něco nového/netradičního (čti: to co nikdo ještě nezkusil). A tak jsem si naprogramoval robota, který zjišťuje kolik lidí je na pobočce v České spořitelně (ČSAS). Výsledky najdete na konci článku.


Když jsem poprvé viděl mobilní aplikaci Lístkomat od České spořitelny, tak mě příjemně překvapilo o jak pokrokové řešení se jedná. Pro připomenutí: jde o bezplatnou aplikaci, pomocí které můžete virtuální objednat na pobočku, zjisti jak dlouho budete čekat a kolik lidí je před vámi.



Přemýšel jsem, zda by těchto dat a vztahů nešlo nějak využít.

Po dlouhé době jsem se k myšlence vrátil a během krátké chvíle vytvořil prototyp. Pomocí reverzního inženýrství (= to jsou ti lidé s titulem gni.) jsem odchytil jaké HTTP requesty mobilní aplikace posílá.

O to více byla zajímavá samotná implementace (=střeva, backend, server), protože na pozadí jde opravdu o tak dlouho avizované Web API, tj. REST URL s tokenem při zasláíní requestu a JSON na výstupu.

Informace o pobočkách jsou např na URL adrese
http://csas.cz/webapi/api/v1//qmatic/branches/ID

kde místo ID je číslo pobočky (20-780)

Připojil jsem se a do Google Tabulky stáhnul všechny veřejné a dostupné informace o pobočkách.(white hat, neasi). Pak jsem si opět v Tabulkách pana Googla a pomocí Google Apps Scriptů (=když jsem ten Google Developer Expert, howgh!) naprogramoval triggery/spouštěče, které se každých zhruba 10 minut připojí na toto API a zjisti kolik lidí je na dané pobočce.

A celý tento zázrak jsem nechal běžet od 14.9 do {dnesni_datum}. Po prvním týdnu (= 5 dní) jsem měl cca 12 000 záznamů, které jsem měl jako řádky uložené stále v Google Tabulce. Nakonec jsem udělal kontigenční tabulku s agregací podle poboček a hodin.

Výsledek? Největší nával je na Štefánikově (průměr 10 lidí ve frontě)  s odstupem pak Vítězné náměstí (průměr 3 lidi) a Sokolovská (průměr 2 a půl člověka). Časově není překvapivé, že nejvíc lidí chodí na pobočku 15-17h. Podrobná data najdete najdete zde nebo jako embed níže.









Zajímá tě více?

18. října 2014

Signal Festival 2014 - pořadí nejlepších instalací podle hodnocení návštěvníků

Již dva dny probíhá  v Praze Signal Festival, který přináší do veřejného prostoru světelné, vizuální a další umělecké artefakty až díla. Možná máte málo času nebo chcete projít jenom ty nezajímavější, tak pro tyto případy jsem udělal tabulku shrnující co se nejvíce líbilo uživatelů z oficiálních stránek.

(Foto by moje müllovaná @mullerovah)

Na každé stránce máte hlasovací tlačítko "To se mi líbí" (neplést s Facebookem - má jen stejný název), pomocí něhož může kdokoliv hlasovat. To je docela zajímavá metrika. Vytvořil jsem tedy Google Tabulku a toto hodnocení načítám v reálném čase a zobrazuji od nejpopulárnějšího. Takže hurá na festival v sobotu a neděli od 19h. Je zdarma! A je skvělý!





Zajímá tě více?