Startsida
Hjälp
Sök i LIBRIS databas

     

 

Sökning: onr:22188528 > Using wavelet analy...

Using wavelet analysis for text categorization in digital libraries [Elektronisk resurs] a first experiment with Strathprints

Darányi, Sándor (författare)
Wittek, Peter (författare)
Dobreva, Milena (författare)
Högskolan i Borås Institutionen Biblioteks- och informationsvetenskap / Bibliotekshögskolan (utgivare)
2011
Engelska.
Ingår i: International Journal on Digital Libraries. - 1432-5012.
Läs hela texten
Läs hela texten
  • E-artikel/E-kapitel
Sammanfattning Ämnesord
Stäng  
  • Digital libraries increasingly bene t from re-search on automated text categorization for improvedaccess. Such research is typically carried out by usingstandard test collections. In this paper we present apilot experiment of replacing such test collections bya set of 6000 objects from a real-world digital repos-itory, indexed by Library of Congress Subject Head-ings, and test support vector machines in a supervisedlearning setting for their ability to reproduce the exist-ing classi cation. To augment the standard approach,we introduce a combination of two novel elements: us-ing functions for document content representation inHilbert space, and adding extra semantics from lexicalresources to the representation. Results suggest thatwavelet-based kernels slightly outperformed traditionalkernels on classi cation reconstruction from abstractsand vice versa from full-text documents, the latter out-come due to word sense ambiguity. The practical imple-mentation of our methodological framework enhancesthe analysis and representation of speci c knowledge relevant to large-scale digital collections, in this casethe thematic coverage of the collections. Representationof speci c knowledge about digital collections is one ofthe basic elements of the persistent archives and the lessstudied one (compared to representations of digital ob-jects and collections). Our research is an initial step inthis direction developing further the methodological ap-proach and demonstrating that text categorisation canbe applied to analyse the thematic coverage in digitalrepositories. 

Ämnesord

Social Sciences  (hsv)
Media and Communications  (hsv)
Information Studies  (hsv)
Samhällsvetenskap  (hsv)
Medie- och kommunikationsvetenskap  (hsv)
Biblioteks- och informationsvetenskap  (hsv)
Natural Sciences  (hsv)
Computer and Information Science  (hsv)
Naturvetenskap  (hsv)
Data- och informationsvetenskap  (hsv)
Natural Sciences  (hsv)
Computer and Information Science  (hsv)
Language Technology (Computational Linguistics)  (hsv)
Naturvetenskap  (hsv)
Data- och informationsvetenskap  (hsv)
Språkteknologi (språkvetenskaplig databehandling)  (hsv)
Library and Information Science  (hb)
Biblioteks- och informationsvetenskap  (hb)

Indexterm och SAB-rubrik

kernel methods
text classification
support vector machines
semantic enrichment
hilbert spaces
digital libraries
text categorization
machine learning
analogical information representation
wavelet analysis
Inställningar Hjälp

Beståndsinformation saknas

Om LIBRIS
Sekretess
Blogg
Hjälp
Fel i posten?
Kontakt
Teknik och format
Sök utifrån
Sökrutor
Plug-ins
Bookmarklet
Anpassa
Textstorlek
Kontrast
Vyer
LIBRIS söktjänster
SwePub
Sondera
Uppsök

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy