Deduplication of Universitat de Lleida scholarly data

View/ Open
Issue date
2017-07Author
Berga Gatius, Albert
Suggested citation
Berga Gatius, Albert;
.
(2017)
.
Deduplication of Universitat de Lleida scholarly data.
http://hdl.handle.net/10459.1/60159.
Metadata
Show full item recordAbstract
In this project we have used data science tools and techniques to detect duplicated data in GREC repository, which contains information about the articles published by University of Lleida staff. We have used Locality-sensitive hashing (LSH) to group articles in a way that those which are more likely to be duplicates are classified to the same group. Then, we have compared pairwise articles in the same group to determine which pairs are referring the same article.
European research projects
Collections
The following license files are associated with this item:
Related items
Showing items related by title, author, creator and subject.
-
Playing Ludomotor Activities in Lleida During the Spanish Civil War: An Ethnomotor Approach
Ormo i Ribes, Enric; Lavega i Burgués, Pere; Rodríguez Arregi, Rosa; Luchoro Parrilla, Rafael A.; Rillo Albert, Aaron; Pic, Miguel (Frontiers Media, 2021)The traditional ludomotor activities (LA) are recognized by UNESCO as an intangible piece of cultural heritage. The ethnomotricity analyzes LA in its sociocultural context, taking into account the proprieties of rules ... -
Estratègia docent i de formació de la Universitat de Lleida, 2014-2018
Universitat de Lleida. Vicerectorat de Docència; Universitat de Lleida. Vicerectorat d'Estudiantat, Postgrau i Formació Contínua (Universitat de Lleida, 2014)L’Estratègia Docent i de Formació de la Universitat de Lleida 2014-2018 neix de l’assumpció de la UdL de la seva responsabilitat com a institució pública al servei de la ciutadania, que ha donar resposta a les demandes ... -
Processament i visualització d'un stream de dades amb Clojure i ClojureScript
Berga Gatius, Albert (2015-06)En el projecte hem desenvolupat una aplicació web que rep dades contínues de l'stream de Twitter i les mostrem dinàmicament juntament amb estadístiques calculades sobre aquestes dades, les quals mostrem en forma de gràfiques. ...