Estilometria
L'estilometria és l'aplicació de l'estudi de l'estil lingüístic en el llenguatge escrit, encara que també s'ha aplicat amb èxit a la música [1] i a la pintura.[2][3]
L'estilometria es fa servir sovint per atribuir l'autoria a documents anònims o d'autor dubtós. Té aplicació legal, acadèmica i literària, des de la investigació de certes obres de Shakespeare a la lingüística forense .
Història
[modifica]La estilometria va sorgir a partir de tècniques anteriors d'anàlisi de texts per a proves d'autenticitat, identitat de l'autor i altres qüestions.
La pràctica moderna de la disciplina va rebre el seu principal impuls amb l'estudi d'autories en obres de teatre del Renaixement anglès. Investigadors i lectors van observar que algunes obres de l'època tenien patrons característics de llenguatge, i van intentar utilitzar aquests patrons per identificar autors de col·laboracions o obres anònimes. Els primers intents no sempre van tenir èxit: el 1901, un investigador va intentar utilitzar les preferències lingüístiques de John Fletcher per distingir entre ell i Philip Massinger en els seus treballs col·laboratius, però les va aplicar per error a una versió modificada per l'editor.[4]
Els fonaments de la estilometria van ser establerts pel filòsof polonès Wincenty Lutosławski a Principes de stylométrie (1890). Lutosławski va utilitzar aquest mètode per desenvolupar una cronologia dels diàlegs de Plató .[5]
El desenvolupament dels ordinadors i la seva capacitat per analitzar grans quantitats de dades va impulsar aquest tipus de feines. Tot i això, aquesta gran capacitat d'anàlisi seguia sense garantir la qualitat del resultat. A principis dels 60, el reverend AQ Morton va realitzar una anàlisi informàtica de les catorze epístoles del Nou Testament atribuïdes a Sant Pau, amb què va demostrar que les obres pertanyia a sis autors diferents. Una comprovació d'aquest mètode, amb obres de James Joyce, va revelar que l'Ulisses, l'obra mestra de l'autor, havia estat escrita per cinc persones diferents, cap de les quals, aparentment, va intervenir a la redacció de la primera novel·la de Joyce, Retrat de l'artista adolescent .[6]
Tot i això, amb el temps i la pràctica, investigadors i estudiosos han polit els seus mètodes, que avui donen resultats molt més encertats. Un dels primers èxits va ser la resolució de la controvertida autoria de dotze dels Federalist Papers, escrits per Frederick Mosteller and David Wallace.[7] Tot i que encara sorgeixen dubtes sobre la metodologia, i és possible que sempre continuïn sorgint, actualment pocs discuteixen la premissa bàsica que l'anàlisi lingüística de texts escrits pot generar informació i coneixements molt valuosos.
Aplicacions
[modifica]Les aplicacions de la estilometria inclouen estudis literaris, estudis històrics, estudis socials, recuperació d'informació i molts casos i estudis forenses.[8][9] També es pot aplicar al codi informàtic [10] i a la detecció de plagi intrínsec, que consisteix a detectar el plagi en funció dels canvis d'estil d'escriptura dins del document.[11] La estilometria també es pot utilitzar per predir si algú és nadiu o no angloparlant per la seva velocitat d'escriptura .[12]
La estilometria com a mètode és vulnerable a la distorsió del text durant la revisió.[13] També hi ha el cas de l'autor adoptant diferents estils al llarg de la seva carrera com es va demostrar en el cas de Plató, que va triar diferents polítiques estilístiques com les adoptades per als diàlegs primerencs i mitjans que abordaven el problema socràtic.[14]
Investigacions actuals
[modifica]L'estilometria moderna es recolza en els ordinadors per a l'anàlisi estadística, la intel·ligència artificial, i en l'accés al creixent corpus de texts disponibles a internet .[15] Sistemes de programari com «Signature» [16] (programa gratuït produït pel Dr. Peter Millican de la universitat d'Òxford), JGAAP [17] (programa d'atribució d'autoria gràfic de Java, aplicació gratuïta desenvolupada per Patrick Juola, de la universitat de Duquesne), stylo [18][19] (paquet de font oberta per a diverses anàlisis estilomètriques, com l'atribució d'autories desenvolupat per Maciej Eder, Jan Rybicki i Mike Kestemont), o Stylene,[20] en neerladés, (aplicació gratuïta en línia creada per Walter Daelemans, de la universitat d'Anvers, i Véronique Hoste, de la universitat de Gant) faciliten l'ús de l'estilometria, fins i tot per als no experts..[16][17][18][19][20]
Casos notables
[modifica]L'estilometria s'ha fet servir en nombrosos casos famosos. Matthew Jockers va aplicar tècniques estilomètriques a l'anàlisi del Llibre de Mormón, concloent que l'autor no era Joseph Smith, sinó Sidney Rigdon .[21] Més recentment, un altre estudi de Schaalje i el seu equip ha desmentit aquesta teoria, demostrant que Joseph Smith i les seves escribes tampoc són els seus autors més probables, alhora que revelaven múltiples autors que van treballar juntament amb els principals autors suposats del text.[22]
Simon Fuller i James O'Sullivan van publicar un estudi en el qual afirmen que l'autor de best sellers James Patterson no escriu res en les novel·les en les quals apareix com a coautor.[23][24] Segons O'Sullivan, la seva col·laboració amb l'antic president de EE.UU. Bill Clinton en el llibre El president ha desaparegut és una excepció.[25]
Al maig del 2021 va ser descoberta una nova obra literària de Lope de Vega mitjançant l'aplicació de tècniques d'estilometria computacional pel projecte ETSO. Estilometria aplicada al Teatre del Segle d'Or dirigit per Álvaro Cuéllar i Germán Vega García-Luengos .[26] Es tracta d'una comèdia anomenada "de senectute", "tan trista personalment com pletòricament en l'artístic", que figurava atribuïda a l'actor i escriptor ocasional Miguel Bermúdez, però hi ha proves contundents de l'autoria de Lope, com demostra l'estudi de Abraham Madroñal, catedràtic de Literatura Espanyola de la Universitat de Ginebra.[27]
Casos pràctics d'interès
[modifica]- El Llibre dels Jutges registra un cas, succeït entre 1370 i 1070 a. C., en què la tribu de Galaad va identificar membres de la tribu d'Efraín, amb la intenció d'executar-los, obligant-los a dir la paraula Shibboleth, que en el dialecte dels últims sonava com «siboleth».[28]
- El 1439, Lorenzo Valla va demostrar que la donació de Constantí era una falsificació amb arguments basats en part en la seva comparació amb l'estil del llatí que s'havia utilitzat en documents autèntics del segle IV.
- En 1952, el clergue suec Dick Helander va ser triat bisbe de Strängnäs. La campanya va ser competitiva, i Helander va ser acusat d'escriure més de cent cartes anònimes difamatòries sobre altres candidats al bisbat. Helander va ser condemnat per escriure aquestes cartes i va perdre el seu lloc de bisbe, però després va ser parcialment exonerat. Les cartes es van estudiar utilitzant nombroses mesures estilomètriques i característiques de les màquines d'escriure, i en els diferents casos judicials que es van dur a terme fins a la seva mort el 1978 ─diversos iniciats pel mateix Helander─ es va debatre el valor de l'estilmetria com evidència davant d'un tribunal.[29][30]
- El 1975, Ronald Reagan, després d'acabar el seu mandat com a governador de Califòrnia, va començar a fer comentaris setmanals en una ràdio amb cent d'emissores. Després que es publiquessin les seves notes personals el 2001, amb motiu del 90è aniversari, es va dur a terme un estudi per determinar quines d'aquestes xerrades havien estat escrites per ell i quines no, amb l'ajuda de mètodes estilomètrics.[31]
- En 1996, el professor Donald Foster,[32] del Vassar College, va dur a terme l'anàlisi estilomètrica del llibre Primary Colors, controvertit i anònim. Aquesta anàlisi va donar a conèixer l'estilmetria al gran públic, després d'identificar correctament Joe Klein com a autor, identitat confirmada per una anàlisi de la seva escriptura manual.
- El 1996 es van utilitzar mètodes estilomètrics per comparar el manifest d'Unabomber amb les cartes del sospitós ─Theodor Kaczynski─ al seu germà, cosa que va portar a la seva detenció i condemna.[33]
- A l'abril de 2015, els investigadors van utilitzar mètodes estilomètrics per estudiar una obra suposadament del segle XVIII titulada Double Fasehood, concloent que havia estat escrita conjuntament per William Shakespeare i John Fletcher. Aquesta obra contindria el text perdut de l'obra Cardenio, basada en un personatge de la novel·la Don Quixot de la Manxa .[34] Els investigadors van comparar la longitud mitjana de les frases a 54 obres de Shakespeare i Fletcher, van analitzar l'ús de paraules poc freqüents i van quantificar la complexitat i la diàtesi del seu llenguatge.
- El 2017, el lingüista Miguel Á. Boto publica Mapa Estilomètric de la narrativa d'Eduardo Mendoza: Aproximació a una anàlisi estilística computacional de texts literaris, on mostra l'eficàcia del tractament computacional del material lingüístic per a la classificació tipològica i estilística de texts literaris. Així mateix, realitza una anàlisi dels elements involucrats en el processament computacional de texts, com ara models estadístics, visualització gràfica, i característiques i volums de les mostres de dades que afecten els resultats de les anàlisis estilomètriques.
- El 2017, un grup de lingüistes, informàtics i acadèmics van analitzar les obres signades per Elena Ferrante. Basant-se en un recull creat per la universitat de Pàdua, formada per 150 novel·les escrites per 40 autors, van analitzar l'estil de Ferrante estudiant set de les seves novel·les. Van poder comparar el seu estil d'escriptura amb 39 novel·listes més utilitzant, per exemple, l'aplicació stylo .[18] Tots ells van arribar a la mateixa conclusió: Elena Ferrante és, en realitat, Domenico Starnone .[35]
- El 2018, Mark Glickman, professor d'estadística a la Universitat Harvard, juntament amb Ryan Song i Jason Brown, van aplicar l'estilmetria per descobrir que molt probablement, la cançó " In My Life " dels Beatles era una composició de John Lennon, però hi havia un 50% de possibilitats que Paul McCartney hagués escrit el pont .[36]
- Entre els anys 2017 i 2023, el projecte ETSO. Estilometria aplicada al Teatre del Segle d'Or, liderat per Álvaro Cuéllar i Germán Vega García-Luengos (Universitat de Valladolid) aconsegueix reunir més de 2700 obres del període aurisecular espanyol. Després de l'aplicació d'anàlisis estilomètriques s'està fent llum a l'autoria de desenes d'obres del teatre del Segle d'Or. Van ratificar l'atribució de Dones i criats a Lope de Vega .[37][38] Van detectar un problema autorial a La monja alferes, comèdia fins llavors atribuïda a Pérez de Montalbán que, gràcies a aquestes anàlisis i mitjançant la investigació historicofilològica pertinent, va acabar per atribuir-se a Juan Ruiz de Alarcón .[39][40][41][42] Van apuntar la possible atribució de La lindona de Galícia a Andrés de Claramonte.[43]
Dades i mètodes
[modifica]Com que l'estilometria s'aplica a casos descriptius per caracteritzar el contingut d'una col·lecció, ia casos identificatius, com ara la verificació d'autories o categories de text, els mètodes utilitzats per analitzar dades i característiques varien dels dissenyats per classificar elements en conjunts creats per distribuir aquests elements en un espai d'atributs variats. La major part dels mètodes són de naturalesa estadística -com l'anàlisi de grups i l'anàlisi discriminant lineal- se solen basar en característiques i dades filològiques i són productius camps d'aplicació de mètodes moderns d'aprenentatge automàtic .
Mentre que en el passat l'estilometria posa èmfasi en els elements menys freqüents o més xocants d'un text, les tècniques contemporànies poden aïllar patrons identificatius, fins i tot en parts comunes del discurs. La majoria dels sistemes es basa en estadístiques lèxiques, per exemple, la freqüència de certes paraules o termes al text per caracteritzar aquest text o el seu autor. En aquest context, a diferència de la recuperació d'informació, la freqüència dels patrons de les paraules més comuns és més interessant que els termes tòpics menys freqüents.[44][45]
El mètode estilomètric primari és la invariant d'autor: una propietat que tots els texts tenen en comú, o almenys tots els texts prou llargs per admetre resultats estadísticament flexibles significatius escrits per un autor donat. Un exemple d'invariant autor és la freqüència de paraules funcionals utilitzades per l'escriptor.
En aquest mètode, el text s'analitza per trobar les 50 paraules més comunes. Després, el text es divideix en 5000 parts, i cadascuna d'aquestes parts s'analitza per cercar la freqüència d'aquestes 50 paraules en aquest tros. Això genera un identificador únic de 50 números per a cada part. Aquests números col·loquen el tros corresponent en un punt d'un espai de 50 dimensions, que es redueix a un pla gràcies a l'anàlisi de components principals (ACP). El resultat és una mostra de punts que correspon a l'estil d'un autor. Si dos treballs literaris s'analitzen així, la comparació d'aquests patrons ens dirà si són del mateix autor o no.
Xarxes neuronals
[modifica]S'han utilitzat xarxes neuronals -un cas especial de mètode estadístic d'aprenentatge automàtic- per analitzar l'autoria de texts. S'utilitzen altres texts d'autor conegut per entrenar la xarxa neuronal per mitjà de processos com la propagació cap enrere, en què es calcula i s'usa l'error per actualitzar el procés per incrementar-ne l'exactitud. A través d'un procés similar a la regressió no lineal, la xarxa augmenta la seva capacitat de generalitzar la seva eficàcia de reconeixement a nous texts als quals encara no ha estat exposada, per classificar-los amb un determinat grau de seguretat. Aquestes tècniques es van aplicar a les històriques sospites de col·laboració entre Shakespeare i els seus contemporanis Fletcher i Christopher Marlowe,[46][47] que van confirmar l'opinió, basada en estudis més convencionals, que aquesta col·laboració s'havia produït.
En un estudi del 1999, un programa de xarxes neuronals va assolir el 70% d'exactitud determinant l'autoria de poemes que no havien estat analitzats fins aleshores. Aquest estudi, de la universitat Vrije, va examinar la identitat de poemes de tres autors holandesos utilitzant només seqüències de lletres.[48]
Un altre estudi va utilitzar xarxes de creença profunda per a un model de verificació d'autoria aplicable a l'autenticació contínua.[49] En aquest mètode, el problema és que la xarxa pot fer-se tendenciosa obeint al seu entrenament, i és possible que es decanti pels autors que ha analitzat amb més freqüència.[48]
Algorisme genètic
[modifica]Una altra tècnica d'aprenentatge automàtic utilitzada en l'estilometria és l'algorisme genètic, basat en conjunts de regles d'aquest tipus: «si la paraula X apareix més de N vegades cada mil paraules, aleshores l'autor del text és Y». El programa aplica 100 regles a un conjunt determinat de texts coneguts i cadascuna rep una puntuació d'idoneïtat. Les 50 regles amb menys puntuació es descarten i les 50 restants s'ajusten amb petits canvis. S'hi introdueixen 50 regles noves i es repeteix el procés fins que les regles evolucionades atribueixen correctament els texts.
Parells estranys
[modifica]El método denominado pares raros para identificar estilos se basa en costumbres individuales de colocación. El uso que un autor determinado hace de ciertas palabras puede conllevar el uso idiosincrásico y predecible de otras palabras.
Atribució d'autoria en missatgeria instantània
[modifica]La difusió d'internet ha inclinat l'atenció de l'atribució d'autoria als texts en línia (pàgines web, blocs, etc.), missatges electrònics (correus, tuits, comentaris, etc.) i altres tipus d'informació escrita amb texts molt més curts que un llibre de longitud mitjana, molt menys formals i més diversos quant a elements expressius, com ara colors, disseny, tipus de lletra, gràfics, emoticones, etc. Ja es treballa en models que tenen en compte aquests aspectes tant a l'estructura com a la sintaxi.[50] A més, s'han introduït dades de contingut específic i idiosincràtic (com ara models tòpics i eines de comprovació gramatical) per revelar eleccions deliberades d'estil.[51]
S'han utilitzat característiques estilomètriques estàndard per categoritzar el contingut d'un xat en una aplicació de missatgeria instantània [52] o el comportament dels participants en la conversa,[53] però els intents d'identificar aquests participants són escassos i encara estan en els seus primeres fases. A més, s'ha prestat poca atenció a les similituds entre les converses parlades i les interaccions en missatgeries instantànies,[54] encara que representen una diferència essencial entre les dades que aproten aquestes darreres i qualsevol altre tipus d'informació escrita.
Referències
[modifica]- ↑ «Making hit music into a science». , 15-06-2006.
- ↑ «Internet Archive Wayback Machine», 03-06-2006. Arxivat de l'original el 30 de juny de 2006. [Consulta: 15 octubre 2012].
- ↑ Shlomo Argamon, Kevin Burns y Shlomo Dubnov, eds. The structure of style: algorithmic approaches to understanding manner and meaning. Springer Science & Business Media, 2010.
- ↑ Samuel Schoenbaum, Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method, p. 171.
- ↑ Lutoslawski, W. Revue des Études Grecques, 11, 41, 1898, pàg. 61–81. DOI: 10.3406/reg.1898.5847. ISSN: 0035-2039.
- ↑ Samuel Schoenbaum, Internal evidence and Elizabethan dramatic authorship; an essay in literary history and method, p. 196.
- ↑ Inference and Disputed Authorship: The Federalist. Reading, MA: Addison-Wesley, 1964.
- ↑ Chaski, Carole. Solan. Author Identification in the Forensic Setting (en anglès). Oxford University Press, 2012. DOI 10.1093/oxfordhb/9780199572120.001.0001. ISBN 9780199572120.
- ↑ Chaski, Carole. Wecht. Forensic Science and Law: Investigative Applications in Criminal, Civil and Family Justice. CRC Press, 22 desembre 2005. ISBN 978-1-4200-5811-6.
- ↑ , 16-03-2018 [Consulta: 2 agost 2018].
- ↑ Bensalem, Imene; Rosso, Paolo; Chikhi, Salim Language Resources and Evaluation, 53, 3, 2019, pàg. 363–396. DOI: 10.1007/s10579-019-09444-w.
- ↑ Brizan, David International Journal of Human-Computer Studies, 82, 10-2015, pàg. 57–68. DOI: 10.1016/j.ijhcs.2015.04.005.
- ↑ Alican, Necip Fikri. Rethinking Plato: A Cartesian Quest for the Real Plato. Amsterdam: Rodopi, 2012, p. 183. ISBN 9789042035379.
- ↑ Rowe, Christopher. The Cambridge History of Greek and Roman Political Thought. Cambridge, UK: Cambridge University Press, 2000, p. 160. ISBN 0521481368.
- ↑ Shlomo Argamon, Jussi Karlgren, y James G. Shanahan. Stylistic analysis of text for information access. Documentos del taller realizado conjuntamente con la 28ª Conferencia Anual Internacional ACM sobre Investigación y Desarrollo de Recuperación de Información. del 13 al 19 de agosto de 2005, Salvador, Bahía (Brasil). Instituto Sueco de Ciencias Computacionales, 2005.
- ↑ 16,0 16,1 «The Signature Stylometric System». PhiloComp. Arxivat de l'original el 3 de gener de 2014. [Consulta: 3 gener 2014].
- ↑ 17,0 17,1 «JGAAP». JGAAP, 04-09-2012. [Consulta: 15 octubre 2012].
- ↑ 18,0 18,1 18,2 «The stylo for R package». Computational Stylistics Group, 02-10-2014. Arxivat de l'original el 21 de desembre de 2014. [Consulta: 24 octubre 2014].
- ↑ 19,0 19,1 ; Kestemont, Mike «Stylometry with R: a package for computational text analysis». R Journal, 8, 1, 2016.
- ↑ 20,0 20,1 Daelemans, Walter; Hoste, Véronique «STYLENE: an Environment for Stylometry and Readability Research for Dutch». CLiPS Technical Report Series, 2013. ISSN: 2033-3544 [Consulta: 28 juny 2019].
- ↑ Jockers, M. L.; Witten, D. M.; Criddle, C. S. «Reassessing authorship of the Book of Mormon using delta and nearest shrunken centroid classification» (en anglès). Literary and Linguistic Computing, 23, 4, 29-09-2008, pàg. 465–491. DOI: 10.1093/llc/fqn040. ISSN: 0268-1145.
- ↑ Schaalje, G. Bruce; Fields, Paul J.; Roper, Matthew; Snow, Gregory L. «Extended nearest shrunken centroid classification: A new method for open-set authorship attribution of texts of varying sizes» (en anglès). Digital Scholarship in the Humanities, 26, 1, 18-01-2011, pàg. 71–88. DOI: 10.1093/llc/fqq029. ISSN: 2055-7671.
- ↑ Fuller, Simon; O'Sullivan, James «Structure over Style: Collaborative Authorship and the Revival of Literary Capitalism». Digital Humanities Quarterly, 011, 1, 2017 [Consulta: 20 abril 2017].
- ↑ «Why you don't need to write much to be the world's bestselling author». The Conversation, 03-04-2017. [Consulta: 20 juny 2019].
- ↑ O'Sullivan, James. «Bill Clinton and James Patterson are co-authors – but who did the writing?». The Guardian, 07-06-2018. [Consulta: 20 juny 2019].
- ↑ https://www.swissinfo.ch/spa/lope-de-vega--ampliaci%C3%B3n-_descubren-en-espa%C3%B1a-una-comedia-desconocida-de-lope-de-vega/46659022
- ↑ http://www.bne.es/es/AreaPrensa/noticias2021/0528-encuentran-fondos-bne-princeps-comedia-desconocida-de-lope-de-vega.html
- ↑ [[Reina-Valera|Reina-Valera]]. «Jueces 12 - Biblia Reina Valera 1960» (en castellà). Bibliatodo, 1960. [Consulta: 21 juny 2019].
- ↑ Text processing text analysis and generation – text typology and attribution. Proceedings of Nobel symposium 51 / ed. por Sture Allén Estocolmo: Almqvist & Wiksell international 1982 653 pp. Data linguistica ; 16 Nobel symposium ; 51 ISBN 91-22-00594-3
- ↑ «Helander: An Authorship Attribution Case», 2003. [Consulta: 21 juny 2019].
- ↑ Edoardo M. Airoldi; Kiron K. Skinner «Whose Ideas? Whose Words? Authorship of Ronald Reagan's Radio Addresses». PS: Political Science & Politics, 40, 3, 7-2007, pàg. 501–506. DOI: 10.1017/S1049096507070874.
- ↑ Author Unknown por Gavin McNett Salon, 2 de noviembre de 2000
- ↑ Belluck, Pam «In Unabom Case, Pain for Suspect's Family». , 10-04-1996.
- ↑ «Atribuyen a Shakespeare una obra inspirada en un personaje de Cervantes». La Vanguardia, 16-03-2010. [Consulta: 22 juny 2019].
- ↑ Jacques Savoy. Elena Ferrante Unmasked. https://www.researchgate.net/publication/320131096_Elena_Ferrante_Unmasked
- ↑ Peter Reuell. "You say John, I say Paul. But what does stylometry say?". https://news.harvard.edu/gazette/story/2018/09/harvard-statistician-examines-beatles-mystery/
- ↑ «Rastreadores digitales en el Siglo de Oro» (en castellà). El Norte de Castilla, 23-12-2018. [Consulta: 7 agost 2019].
- ↑ «Un monstruo de la naturaleza llamado Lope» (en castellà). abc, 28-11-2018. [Consulta: 7 agost 2019].
- ↑ Real, La Tribuna de Ciudad. «Juan Ruiz de Alarcón aumenta su obra cinco siglos después» (en castellà). La Tribuna de Ciudad Real, 09-07-2019. [Consulta: 7 agost 2019].
- ↑ Chamberí, PSOE. «PSOE | PSOE Chamberí | chamberí | suplemento cultural | domingo, 28 de julio 2019 | número 06 | Daniel Migueláñez | Pág nº 08 | El Holmes de la filología.». Arxivat de l'original el 18 de juliol de 2020. [Consulta: 7 agost 2019].
- ↑ «Sor Juana Inés centró las 42 Jornadas de Teatro Clásico» (en espanyol europeu). Lanza Digital, 14-07-2019. [Consulta: 7 agost 2019].
- ↑ «'La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón» (en castellà). El Norte de Castilla, 10-07-2019. [Consulta: 7 agost 2019].
- ↑ «| A Lindona de Galicia - CONSELLO DA CULTURA GALEGA». consellodacultura.gal. [Consulta: 21 maig 2021].
- ↑ Douglas Biber. Variation across speech and writing. Cambridge University Press, 1991.
- ↑ Karlgren, Jussi; Cutting, Douglass «Recognizing Text Genres with Simple Metrics Using Discriminant Analysis». Proceedings of the International Conference on Computational Linguistics, 1994.
- ↑ [1] Neural Computation in Stylometry I: An Application to the Works of Shakespeare and Fletcher Matthews RAJ & Merriam TVN Lit Linguist Computing (1993) 8 (4): 203-209. doi: 10.1093/llc/8.4.203
- ↑ [2]Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe Merriam TVN & Matthews RAJ Lit Linguist Computing (1994) 9 (1): 1–6
- ↑ 48,0 48,1 JF HoornZ; W Kowalczyk; F van der Ham «Neural network identification of poets using letter sequences». Literary and Linguistic Computing, 14, 3, 03-09-2012, pàg. 311–338. DOI: 10.1093/llc/14.3.311 [Consulta: 27 juny 2019].
- ↑ Brocardo, ML; Traore, I; Woungang, I; Obaidat, MS «Authorship verification using deep belief network systems». Int J Commun Syst., 30, 12, 2017, pàg. e3259. DOI: 10.1002/dac.3259.
- ↑ de Vel, O.; Anderson, A.; Corney, M.; Mohay, G. «Mining e-Mail Content for Author Identification Forensics». SIGMOD Rec., 30, 4, 01-12-2001, pàg. 55–64. DOI: 10.1145/604264.604272. ISSN: 0163-5808.
- ↑ Argamon, Shlomo; Koppel, Moshe; Pennebaker, James W.; Schler, Jonathan «Automatically Profiling the Author of an Anonymous Text». Commun. ACM, 52, 2, 01-02-2009, pàg. 119–123. DOI: 10.1145/1461928.1461959. ISSN: 0001-0782.
- ↑ «Classification of Instant Messaging Communications for Forensics Analysis – TechRepublic». TechRepublic. [Consulta: 26 gener 2016].
- ↑ Zhou, L.; Zhang Can online behavior unveil deceivers? – an exploratory investigation of deception in instant messaging, 1 de gener de 2004, p. 9 pp.–. DOI 10.1109/HICSS.2004.1265079. ISBN 978-0-7695-2056-8.
- ↑ Zhou, L.; Zhang Can online behavior unveil deceivers? – an exploratory investigation of deception in instant messaging, 1 de gener de 2004, p. 9 pp.–. DOI 10.1109/HICSS.2004.1265079. ISBN 978-0-7695-2056-8.
Bibliografia
[modifica]- (2012) "2012 IEEE Symposium on Security and Privacy". : 461–475. DOI:10.1109/SP.2012.34
- Brennan, Michael; Afroz, Sadia; Greenstadt, Rachel «Adversarial stylometry: Circumventing Authorship Recognition to Preserve Privacy and Anonymity». ACM Transactions on Information and System Security, 15, 3, 2012, pàg. 1–22. Arxivat de l'original el 2024-02-11. DOI: 10.1145/2382448.2382450 [Consulta: 16 setembre 2023].
- Brennan, Michael Robert; Greenstadt, Rachel «Practical Attacks Against Authorship Recognition Techniques». Innovative Applications of Artificial Intelligence.
- Brocardo, Marcelo Luiz (2013). "Authorship Verification for Short Messages Using Stylometry" a IEEE Intl. Conference on Computer, Information and Telecommunication Systems (CITS). . DOI:10.1109/CITS.2013.6705711
- Can, Fazli; Patton, Jon M. «Change of writing style with time». Computers and the Humanities, 38, 1, 2004, pàg. 61–82. DOI: 10.1023/b:chum.0000009225.28847.77.
- Emmery, Chris; Kádár, Ákos; Chrupała, Grzegorz. «Adversarial Stylometry in the Wild: Transferable Lexical Substitution Attacks on Author Profiling». A: Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, 2021, p. 2388–2402. DOI 10.18653/v1/2021.eacl-main.203.
- Gröndahl, Tommi; Asokan, N. «Text Analysis in Adversarial Settings: Does Deception Leave a Stylistic Trace?». ACM Computing Surveys, 52, 3, 2020a, pàg. 1–36. arXiv: 1902.08939. DOI: 10.1145/3310331.
- Hope, Jonathan. The Authorship of Shakespeare's Plays. Cambridge: Cambridge University Press, 1994. ISBN 9780521417372.
- Hoy, Cyrus «The Shares of Fletcher and His Collaborators in the Beaumont and Fletcher Canon (I-VII)». Studies in Bibliography, 7-15, 1956–1962.
- Juola, Patrick «Authorship Attribution». Foundations and Trends in Information Retrieval, 1, 3, 2006, pàg. 3. Arxivat de l'original el 2020-10-24. DOI: 10.1561/1500000005 [Consulta: 16 setembre 2023].
- Kacmarcik, Gary; Gamon, Michael. «Obfuscating document stylometry to preserve author anonymity». A: Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions, 17 juliol 2006, p. 444–451.
- Kenny, Anthony. The Computation of Style: An Introduction to Statistics for Students of Literature and Humanities. Oxford: Pergamon Press, 1982.
- Mahmood, Asad; Ahmad, Faizan; Shafiq, Zubair; Srinivasan, Padmini; Zaffar, Fareed «A Girl Has No Name: Automated Authorship Obfuscation using Mutant-X». Proceedings on Privacy Enhancing Technologies, 2019, 4, 2019, pàg. 54–71. DOI: 10.2478/popets-2019-0058.
- Neal, Tempestt; Sundararajan, Kalaivani; Fatima, Aneez; Yan, Yiming; Xiang, Yingfei; Woodard, Damon «Surveying Stylometry Techniques and Applications». ACM Computing Surveys, 50, 6, 2018, pàg. 1–36. DOI: 10.1145/3132039.
- (2016) "Author Obfuscation: Attacking the State of the Art in Authorship Verification" a Conference and Labs of the Evaluation Forum.
- Romaine, Suzanne. Socio-Historical Linguistics. Cambridge: Cambridge University Press, 1982.
- Saedi, Chakaveh; Dras, Mark. «Large Scale Author Obfuscation Using Siamese Variational Auto-Encoder: The SiamAO System». A: Proceedings of the Ninth Joint Conference on Lexical and Computational Semantics, desembre 2020, p. 179–189.
- Samuels, M. L.. Linguistic Evolution: With Special Reference to English. Cambridge: Cambridge University Press, 1972.
- Schoenbaum, Samuel. Internal Evidence and Elizabethan Dramatic Authorship: An Essay in Literary History and Method. Evanston, IL, USA: Northwestern University Press, 1966.
- Van Droogenbroeck, Frans J. (2016) "Handling the Zipf distribution in computerized authorship attribution"
- Van Droogenbroeck, Frans J. (2019) "An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics"
- Wang, Haining; Juola, Patrick; Riddell, Allen «Reproduction and Replication of an Adversarial Stylometry Experiment». arXiv, 2022. arXiv: 2208.07395.
- Zenkov, Andrei V. «A Method of Text Attribution Based on the Statistics of Numerals». Journal of Quantitative Linguistics, 25, 3, 2018, pàg. 256–270. DOI: 10.1080/09296174.2017.1371915.
- Zhai, Wanyue; Rusert, Jonathan; Shafiq, Zubair; Srinivasan, Padmini. «A Girl Has A Name, And It's ... Adversarial Authorship Attribution for Deobfuscation». A: Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2022, p. 7372–7384. DOI 10.18653/v1/2022.acl-long.509.
Enllaços externs
[modifica]- Grup d'Estilístiques Computacionals Arxivat 2018-04-16 a Wayback Machine. (en anglès)
- JGAAP Programa d'atribució d'autoria (anglès)