Skip to content

FuReSH/tool-usage_digital-humanities

Repository files navigation

title subtitle author affiliation date lang bibliography reference-section-title suppress-bibliography licence markdown
Readme: User Stories
Till Grallert
Sophie Eckenstaler
Future e-Research Support in the Humanities, Humboldt-Universität zu Berlin
2023-10-17
de
Literatur
true
pandoc

Dieses Repository enthält Daten und Code zu Tools, User Stories und weitere Corpora, die wir für die Kuratierung der Werkzeugliste auswerten. Die User Story für dieses Repo lautet:

Wir bauen einen Scholarly Makerspace auf und wollen eine Liste von Werkzeugen kuratieren, die auf der Häufigkeit ihrer Benutzung in der Forschung beruht.

Dieses Repository und die Operationalisierung unseres Ansatzes enstand im Frühjahr 2022 aus den Bedürfnissen des Scholarly Makerspaces an der UB der HU und unabhängig von anderen Forschungsgruppen, wie um Ulrike Henny-Krahmer [@HennyJettka2021SoftwarezitationPaper], Frank Fischer [@AlirezaEtAl2022MeasuringUseTools; @BarbotEtAl2019ToolsMentioned; @BarbotEtAl2019WhichDHTools; @FischerMoranville2020ToolsMentioned], und Manuel Burghardt [@Cebral2022InteractiveExploratoryAnalysis; @GutierrezDeLaTorreEtAl2022ManyFacesTheory; @ManuelEtAl2022ToolsEpistemologiesDH], von denen wir im Lauf des Sommers erfahren haben. Einige arbeiten mit ähnlichen Subcorpora, vor allem DH conference abstracts und DHQ.

Ordnerstruktur

Die Daten liegen in folgenden Unterordnern:

  • code/
  • data/
    • dh-conferences/:
      • 12987959/: data on mainly English DH conferences from [LincolnEtAl2021IndexDigitalHumanities; @Weingart2020IndexDHData]
      • DH2023: abstracts from the DH2022 conference in Tokyo available on GitHub
    • DHd/: data on DHd conferences from the DHd GitHub repositories
      • software-names-counts-total.csv: [@HennyJettka2021SoftwarezitationData]
    • dhq/: TEI XML files from "Digital Humanities Quarterly". A corpus of 429 articles published until 2019 is available as zipped folder at http://digitalhumanities.org/dhq/data/dhq-xml.zip.
    • nfdi4history/: a CSV/TSV dump of their user stories
    • ssh-open-marketplace/
    • tadirah/
    • tapor/
    • txt/: Plaintextdateien unserer eigenen User Stories. Unterordner für Sprachen
      • de/: deutsche Texte
      • en/: englische Texte
    • csv/
  • documentation/: mostly notes on the various data sources
  • visualization/: output from the R scripts visualising tool usage

Es gibt eine simple Dateinamenkonvention für Plaintextdatein mit einzelnen Userstories: user-story_{lang}_\d.md Dieser Name ist gleichzeitig die ID der Userstory in anderen Kontexten.

tool lists

Wir haben Listen an Werkzeugen (mehrheitlich Software und Tutorials) von folgenden Quellen heruntergeladen

  • TaPOR: data/tapor.json
  • SSH Open Marketplace
  • U of Toronto: data/utoronto-tools.csv

to do

  • results
    • R is strikingly prominent
      • add column with KWIC to the intermediate data output
  • data
    • add data from the undocumented (?) API of TAPoR at https://tapor.ca/api/tools/by_analysis, which returns JSON. We found the API through an analysis of ToolXtractor by Barbot et al.
      • [@BarbotEtAl2019ToolsMentioned]
      • [@BarbotEtAl2019WhichDHTools]
    • add DHd abstracts from the GitHub repositories
    • add metadata for all conference presentations and all journal articles in our corpus to Wikidata in order to link them to the mentioned tools
      • this will require significant work to translate bibliographic data to data models in Wikidata
    • compile our own tools lists with values from the alternative labels in Wikidata
  • analysis
    • use expanded TaPOR, SSH Open Marketplace tool list
    • write output in form of edges table, which can then be used to link certain papers to certain tools on Wikidata
      • source: paper
      • target: tool
    • use TaDiRAH classification in SSH Open Marketplace to group tools into methodologic approaches
      • TaDiRAH has 3 levels and each tool should get a level attribute as well as a parent attribute
  • R notebook
    • explain the origin of and the rationale behind the tool list

done

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published