DBpedia
URL | http://dbpedia.org/ |
---|---|
Tipus | Web semàntica |
Comerç ? | No |
Llengua | 111 idiomes |
Llicència | CC-BY-SA 3.0 i GFDL |
Llenguatge de programació | Java i Scala |
Part de | web semàntic |
Propietari | Universitat de Leipzig i Universitat de Mannheim |
Creador | Universitat de Leipzig, Universitat de Mannheim i Hasso Plattner Institute (en) |
Llançament | 10 gener 2007 |
Rànquing Alexa | 102.111 (29 novembre 2017) 53.988 (13 desembre 2021) |
DBpedia és un projecte, l'objectiu del qual és l'extracció automàtica de dades i contingut a partir de la informació creada des del projecte Viquipèdia. Aquesta informació estructurada s'entrellaça amb altres bases de coneixement i es fa disponible a la World Wide Web.[1][2]
Origen i evolució
[modifica]Aquest projecte va ser iniciat per investigadors de la Universitat Lliure de Berlín i la Universitat de Leipzig, en col·laboració amb OpenLink Software.[3] DBpedia permet als usuaris efectuar consultes semàntiques amb relacions i propietats associades als recursos en Viquipèdia, incloent-hi enllaços a altres bases de dades relacionades.[4] El primer conjunt de dades a disposició del públic va ser publicat el 2007. Està disponible mitjançant llicències lliures, permetent a altres poder tornar a utilitzar el conjunt de dades. DBpedia s'actualitza aproximadament un cop a l'any.[3]
Característiques i contingut
[modifica]DBpedia es crea a partir de la informació extreta de forma automàtica estructurada-continguda en Viquipèdia. I aquesta, al seu torn, es troba interconnectada a altres conjunts de dades com, per exemple, Freebase, OpenCyc, UMBEL, GeoNames, Musicbrainz, CIA World Factbook, DBLP, Projecte Gutenberg, Dbtune Jamendo, Eurostat, UniProt, i Bio2RDF.20. DBpedia s'utilitza àmpliament en la comunitat d'investigació de web semàntica, però també és utilitzada en entorns comercials. Així, empreses com la BBC i el New York Times l'utilitzen per a organitzar el seu contingut.[3][5] La possibilitat d'interconnexió de DBpedia amb altres conjunts de dades obertes a la web podria servir com a nucli per a una web de dades oberta emergent.[4]
Viquipèdia s'ha convertit en una de les fonts de coneixement centrals de la humanitat, mantinguda per milers de col·laboradors. El projecte DBpedia aprofita aquesta gegantina font de coneixement mitjançant l'extracció d'informació estructurada de Viquipèdia fent-la accessible a la web. Els articles de Viquipèdia consisteixen sobretot en text lliure, però, també inclouen informació estructurada incrustada en els articles, com ara "infotaules", informació de categorització, imatges, coordenades geogràfiques i enllaços a pàgines web externes. Aquesta informació estructurada s'extreu i es col·loca en un conjunt de dades uniforme que es pot consultar.[2]
El contingut de la base de dades està disponible sota llicència CC-BY-SA 3.0 i GFDL, doncs, es basa en informació extreta de Viquipèdia. Aquesta extracció de coneixement estructurat de Viquipèdia, lliurement disponible a la web utilitzant tecnologies de Linked Data Web Semàntica, és multilingüe, amb 111 edicions diferents de Viquipèdia, tot i que la base més gran de coneixement s'extreu de l'edició de la versió anglesa.[6]
DBpedia Spotlight
[modifica]El juny de 2010 els investigadors del Grup de Sistemes basats en Web a la Universitat Lliure de Berlín van iniciar un projecte anomenat DBpedia Spotlight, per anotar les mencions dels recursos DBpedia en el text. Això proporciona una solució per vincular les fonts d'informació no estructurada al núvol amb dades obertes enllaçades a través DBpedia. DBpedia Spotlight realitza una extracció d'entitats, incloent-hi la detecció i resolució de noms importants (desambiguació). També es pot utilitzar per a reconeixement d'entitats, entre altres tasques d'extracció d'informació.[7]
Referències
[modifica]- ↑ Morsey, Mohamed; Lehmann, Jens; Auer, Sören; Stadler, Claus; Hellmann, Sebastian «DBpedia and the live extraction of structured data from Wikipedia». Program, Vol. 46, Núm. 2, 2012, pàg. 157-181. ISSN: 0033-0337 [Consulta: 8 febrer 2016].
- ↑ 2,0 2,1 Bizer, Christian; Lehmann, Jens; Kobilarov, Georgi; Auer, Sören; Becker, Christian; Cyganiak, Richard; Hellmann, Sebastian «DBpedia - A Crystallization Point for the Web of Data». Web Semantics: Science, Services and Agents on the World Wide Web. Elsevier [Amsterdam], 7 (3), 9-2009, pàg. 154–165. Arxivat de l'original el 10 d’agost 2017. DOI: 10.1016/j.websem.2009.07.002. ISSN: 1570-8268 [Consulta: 8 febrer 2016]. Arxivat 10 August 2017[Date mismatch] a Wayback Machine.
- ↑ 3,0 3,1 3,2 Färber, Michael; Ell, Basil; Menne, Carsten; Rettinger, Achim «A Comparative Survey of DBpedia, Freebase, OpenCyc, Wikidata, and YAGO». Semantic Web Journal. IOS Press, 2015, pàg. 1-25. ISSN: 1141-2353 [Consulta: 8 febrer 2016].
- ↑ 4,0 4,1 Auer, Sören; Bizer, Christian; Kobilarov, Georgi; Lehmann, Jens; Cyganiak, Richard; Ives, Zachary. «DBpedia: A Nucleus for a Web of Open Data». A: The Semantic Web : 6th International Semantic Web Conference, 2nd Asian Semantic Web Conference. Berlin; New York: Springer, 2007, p. 722-735. ISBN 978-3-540-76297-3 [Consulta: 9 febrer 2016].
- ↑ Bizer, Christian «The Emerging Web of Linked Data». Journal IEEE Intelligent Systems, Vol. 24, Núm. 5, 9-2009, pàg. 87-92 [Consulta: 9 febrer 2016].[Enllaç no actiu]
- ↑ Lehmann, Jens; Isele, Robert; Jakob, Max; Jentzsch, Anja; Kontokostas, Dimitris; Mendes, Pablo N.; Hellmann, Sebastian; Morsey, Mohamed; van Kleef, Patrick; Auer, Sören; Bizer, Christian «DBpedia – A large-scale, multilingual knowledge base extracted from Wikipedia». Semantic Web, Vol. 6, Núm. 2, 2015, pàg. 167-195. DOI: 10.3233/SW-140134 [Consulta: 9 febrer 2016].
- ↑ Mnedes, P.N.; Jacob, M.; Garcia-Silva, A.; Bizer, C. «DBpedia spotlight: shedding light on the web of documents». Proceedings of the 7th International Conference of Semantic Systems, I-Semantics'11, 2011, pàg. 1-8 [Consulta: 9 febrer 2016].
Enllaços externs
[modifica]- DBpedia Arxivat 2008-07-23 a Wayback Machine. - Lloc oficial