Usuari:PereBot/robot indexa categories
Aparença
# -*- coding: utf-8 -*-
# Robot indexa categories.
import sys
sys.path.append('C:\pywikipedia')
import wikipedia,catlib,re,pagegenerators,urllib2
def main():
tcat=u"Edicions de la París-Niça" #Poseu aquí la categoria a indexar
tcats=u"París-Niça" #Poseu aquí la part del títol que no forma part de l'índex (no hi inclogueu "de", "del" i variants, que ja ho fa el programa tot sol).
inicial=tcat[0]
retcat=u"["+inicial.upper()+inicial.lower()+"]"+tcat[1:]
cat=catlib.Category(site,tcat)
for pag in pagegenerators.CategorizedPageGenerator(cat):
textvell=pag.get()
tit=pag.title()
index=tit
index=re.sub(u"^("+tcat+"|"+tcats+u") (del |de la |de l'|dels |de les )",u"",index)
index=re.sub(u"^("+tcat+"|"+tcats+u") (de |d')",u"",index)
index=re.sub(u"^("+tcat+"|"+tcats+u") ",u"",index)
print index
if index<>tit and len(index)>0:
index=index[0].upper()+index[1:]
print index
noutext=re.sub(u"\[\[ ?[Cc]ategoria: ?"+retcat+u" ?\]\]",u"[[Categoria:"+tcat+u"|"+index+u"]]",textvell)
print u"\[\[ ?[Cc]ategoria: ?"+retcat+u" ?\]\]"
print u"[[Categoria:"+tcat+u"|"+index+u"]]"
if noutext<>textvell:
pag.put(noutext,u"Robot indexant l'article a la [[Categoria:"+tcat+u"]] amb l'índex '"+index+u"'")
return
#El programa comença aquí
try:
site=wikipedia.getSite('ca')
main()
finally:
wikipedia.stopme()