Računalniška analiza besedil v izobraževanju

Seminarske naloge

Predstavitev literature

Naloga: preberite enega od naslednjih člankov ali si oglejte enega od naslednjih posnetkov predavanj; o članku oz. predavanju pripravite 10-minutno predstavitev.

Seznam člankov in posnetkov:

KdoČlanek oz. predavanje
M. Karlovčec, B. Lužar, D. Mladenić. Core-periphery dynamics in collaboration networks: the case study of Slovenia. Scientometrics, 2016. DOI: 10.1007/s11192-016-2154-4.
Povezava med zavestjo in umetno inteligenco, Marko Grobelnik, IJS (50 min)
Observing odor-related information in academic domain, Inna Novalija (10 min)
Observing Water-Related Events for Evidence-Based Decision-Making, Alenka Guček (14 min)
Capturing the Semantics of Smell: The Odeuropa Data Model for Olfactory Heritage Information, Pasquale Lisena (24 min)
Exploring the Impact of Lexical and Grammatical Features on Automatic Genre Identification, Taja Kuzman (15 min)
SLOmet — Slovenian Commonsense Description, Adrian Mladenić Grobelnik (15 min)
Emotion Recognition in Text using Graph Similarity Criteria, Nadezhda Komarova (15 min)

Skupinski projekt: Poskusi na zbirki besedil

Naloga 1: s pomočjo orodja OntoGen zgradite ontologijo (10–20 konceptov) za neko zbirko besedil in komentirajte rezultate.

Naloga 2: s pomočjo orodij iz paketa TextGarden izvedite na zbirki besedil naslednje korake:

[Če bodo z zgornjo verzijo težave, poskusite še z naslednjima starejšima verzijama TextGardna: 1, 2.]

Uporabo orodij iz paketa TextGarden si bomo ogledali na vajah 5. novembra 2024 in 26. novembra 2024.

Pripravite poročilo (~10 strani) in 15-minutno predstavitev. (Pri predstavitvi naj nastopijo vsi člani skupine!)

Rok za oddajo: poročila in predstavitve (PowerPoint ali PDF) pošljite na janez.brank@ijs.si do 2. januarja 2025. Predstavitve bodo potekale na predavanjih 7. januarja 2025.

Primeri uporabe orodij iz zbirke TextGarden

> Txt2Bow.exe -inlndoc:news.txt -o:news.bow -stopword:none -stemmer:none -ngramlen:1
> BowKMeans.exe -i:news.bow -clusts:5
> BowTrainBinSVM.exe -i:news.bow -o:news.bowmd -cat:GSPO
> BowClassify.exe -ibow:news.bow -imd:news.bowmd -qs:"olympic games"
> BowClassify.exe -ibow:news.bow -imd:news.bowmd -qh:article1.txt