Startsida
Hjälp
Sök i LIBRIS databas

     

 

Sökning: onr:4g3wb4fm2vtjn639 > Web Scraping Scient...

Web Scraping Scientific Repositories for Augmented Relevant Literature Search Using CRISP-DM [Elektronisk resurs]

Hassanien, Hossam (författare)
Luleå tekniska universitet Institutionen för system- och rymdteknik (utgivare)
Publicerad: MDPI, 2019
Engelska.
Ingår i: ; 2:4
Läs hela texten
Läs hela texten
Läs hela texten
  • E-artikel/E-kapitel
Sammanfattning Ämnesord
Stäng  
  • Scientific web repositories are central cyber locations where academic papers are stored and maintained. With the nature of the unstructured and semi-structured information/metadata within these repositories, literature analysis for scholar writing becomes a challenge. Correspondingly, applying CRISP-DM poses a stance to address this challenge through formulating a rather augmented process for a relevant literature search. However, almost all repositories do not have a straight forward method where metadata could be extracted for preliminary data processing being applied as part of the CRISP-DM process. Additionally, most repositories do not follow open access standards. Until the time this paper was published, the topic of the augmented, relevant literature search had seen a methodological progress only, with the inability to apply the underlying methods on a larger scale, given data access constraints to open access repositories. The aim of this paper is to propose CRISP-DM as an augmented research methodology with a focus on web scraping as part of the data processing step. To substantiate the proposed methodology, a play role case study is conducted. This then works on alleviating these restrictions, as well as encouraging the wider adoption of the augmented analysis process for a relevant literature search within the research community. 

Ämnesord

Social Sciences  (hsv)
Media and Communications  (hsv)
Information Systems, Social aspects  (hsv)
Samhällsvetenskap  (hsv)
Medie- och kommunikationsvetenskap  (hsv)
Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning  (hsv)
Information systems  (ltu)
Informationssystem  (ltu)

Genre

government publication  (marcgt)

Indexterm och SAB-rubrik

web scraping
web crawling
CRISP-DM
text mining
relevant literature search
research methodology
Inställningar Hjälp

Beståndsinformation saknas

Om LIBRIS
Sekretess
Blogg
Hjälp
Fel i posten?
Kontakt
Teknik och format
Sök utifrån
Sökrutor
Plug-ins
Bookmarklet
Anpassa
Textstorlek
Kontrast
Vyer
LIBRIS söktjänster
SwePub
Sondera
Uppsök

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy