Skip to content

TomiToivio/data-aktivismin-opas

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Data-aktivismin opas

Kansalaisyhteiskunnan opas tekoälyn aikakauteen.

FLOSS Manualsin avoimen lähdekoodin opas. Julkaistaan GPL-lisenssillä.

Data-aktivismi on projektin blogi.

Suomenkielinen FLOSS Manuals on nykyisin vapaaehtoistyöhön perustuva projekti jolla ei ole minkäänlaista rahoitusta.

Tekniset kysymykset

Kirjoitusalusta

FLOSS Manuals käytti ennen Booktypeä, mutta sen kehitys on loppunut. Nyt on valinnanvaraa mitä tässä projektissa tahtoo käyttää.

BookStack, GitHub, Etherpad vai joku muu? Olen oikeastaan sitä mieltä että olisi parasta pitää GitHubia ensisijaisena alustana ja käyttää kollaboratiiviseen bookprint-kirjoittamiseen vaikka Etherpadia. Tähän tulee Jupyter Notepadeja jotka on kuitenkin pakko linkittää GitHubista. GitLab olisi kyllä oikeaoppisempi kuin GitHub.

Taitaa olla järkevintä että osallistujat käyttävät sitä kirjoitusalustaa joka tuntuu luontevimmalta. Booksprinttien kaltaiseen kollaboratiiviseen kirjoittamiseen voidaan myös valita osallistujille sopivin alusta. Etherpad olisi kyllä paras booksprintteihin. Tekstit voi kuitenkin kirjoittaa vaikka tekstinkäsittelyohjelmalla ja lähettää sähköpostilla, kuten usein tapahtuukin. Kasaan sitten sisällön tänne GitHub-repoon ja julkaisen oppaan FLOSS Manualsin sivuilla kun se on valmis.

Grafiikka

Graafikko voisi suunnitella oppaalle kansikuvan, logon ja muuta grafiikkaa. Laitoin vain jonkun hassun logon.

Koodi

Python-koodista olisi hyvä tehdä Jupyter Notebook -versiot. Lukijat voivat sitten ajaa ne lokaalisti tai vaikka Google Colabissa. Jupyter Notebooksit siis ovat GitHubissa ja oppaassa on linkki niihin. Juuri Jupyter Notebooksien vuoksi GitHub olisikin luontevin kirjoitusalusta.

Kollaboraatio

Kai GitHub-repon Issues, Discussionsja Projects riittää tällaisen kirjoitusprojektin organisoimiseen? Ei kai tähän tarvitse mitään muuta?

Tapahtumat

Booksprint-tyyppisiä kirjoitussessioita voidaan järjestää joko livenä tai etänä, jos osallistujia kiinnostaa kollaboratiivinen kirjoittaminen tuolla tasolla.

Lisäksi oppaan pohjalta voidaan järjestää työpajoja joko livenä tai etänä.

Videot

Tämä ei välttämättä ole kovin oikeaoppista open sourcea, mutta tein oppaan videoita varten YouTube-kanavan. Videoita siis ei embeddata oppaaseen vaan niihin on vain linkki. Jos on YouTubea oikeaoppisempi vaihtoehto niin voi ehdottaa. Vimeo olisi kai periaatteessa oikeaoppisempi.

Booksprinttien striimaaminen livenä on niin kutkuttava idea että tein sitä varten projektille Twitch-kanavan. Tämäkään ei ole oikeaoppinen valinta, jos keksii paremman vaihtoehdon niin sopii ehdottaa.

Viestintäkanava

Tämä on todella arveluttava valinta, mutta tein nyt testiksi Telegram-kanavan reaaliaikaista viestintää varten. Saa taas ehdottaa oikeaoppisempaa vaihtoehtoa jos keksii sellaisen.

Hostaus

Voi olla että asentelen tuonne data-aktivismi.online-domainiin oppaassa mainittuja ohjelmia, mutta ne ovat sitten siellä demona eikä kannata luottaa siihen että jaksaisin ylläpitää niitä pidemmällä tähtäimellä.

Tule mukaan

Jos tahdot osallistua kirjoitusprojektiin, ota yhteyttä!

Tomi Toivio

Open Source Coordinator

FLOSS Manuals

[email protected]

+358400604828

Sisältösuunnitelma

Selkiytettävä erilaisia päällekkäisiä konsepteja:

  • mitä on avoin lähdekoodi (open source)
  • mitä on avoin data (open data)
  • mitä on verkkosivujen haravointi (web scraping)
  • mitä on tiedonlouhinta (data mining)
  • mitä on datatiede (data science)
  • mitä on koneoppiminen (machine learning)
  • mitä on syväoppiminen (deep learning)
  • mitä on avoimien lähteiden tiedustelu (OSINT)

Erilaisten taitojen yhdistelmä:

  • yhteiskuntatiede
  • tilastotiede
  • ohjelmointi

Eettiset kysymykset:

  • yksityisyyden suoja
  • verkkosisällön tekijänoikeudet
  • tiedonlouhinnan lailliset rajoitukset

Datan löytäminen

  • hakukoneet
  • avoimen datan lähteet

Datan kerääminen

  • verkkosivujen haravointi

Datan tallentaminen

  • tietokannat

Datan analysoiminen

  • data-analyysi
  • luonnollisen kielen prosessointi (NLP)
  • koneoppiminen

Datan esittäminen

  • datan visualisoiminen