Usuari:Mcapdevila/agent conversacional
Un bot conversacional, agent conversacional ( CA ) o sistema de diàleg natural, és un sistema informàtic destinat a conversar amb un humà. Els bots conversacionals normalment empren més d'un sistema de comunicació, com a mínim text i veu, i s'hi poden afegir altres maneres de comunicació: gràfics, hàptica, gestos, etc.., tant al canal d'entrada com al canal de sortida.
Els elements d'un agent conversacional no estan del tot definits perquè aquest concepte està en fase recerca, però, són diferents dels chatbots, que són purament de text.[1] El típic assistent de la GUI es dedica a una mena de diàleg, però inclou molt pocs components comuns del bot conversacional i l'estat del diàleg és trivial.
Rerafons
[modifica]Després dels xatbots basats només en el processament de text escrit a partir de principis dels anys seixanta, [2] el projecte DARPA va publicar el primer bot conversacional oral el 1977 [3] Un cop finalitzat aquest projecte de 5 anys, alguns projectes europeus van emetre el primer bot conversacional capaç de parlar moltes llengües (també francès, alemany i italià). [4] Aquests primers sistemes es van utilitzar a la indústria de les telecomunicacions per oferir diversos serveis telefònics en dominis específics, per exemple, agenda automatitzada i servei de taules de trens.
Components
[modifica]Quins conjunts de components s'inclouen en un bot conversacional i com aquests components divideixen les responsabilitats difereixen d'un sistema a un altre. El principal de qualsevol bot conversacional és el gestor de diàleg, que és un component que gestiona l'estat del diàleg i l'estratègia de diàleg. Un cicle d'activitat típic en un bot conversacional conté les fases següents:
- L'usuari parla i l'entrada es converteix en text sense format mitjançant el reconeixement/descodificador d'entrada del sistema, que pot incloure:
- El text s'analitza mitjançant una unitat de comprensió del llenguatge natural (NLU), que pot incloure:
- Identificació del nom propi
- etiquetatge de part del discurs
- Analitzador sintàctic/semàntic
- La informació semàntica és analitzada pel gestor de diàlegs, que manté l'historial i l'estat del diàleg i gestiona el flux general de la conversa.
- Normalment, el gestor de diàlegs contacta amb un o més gestors de tasques, que tenen coneixement del domini de la tasca específica.
- El gestor de diàleg produeix la sortida mitjançant un generador de sortida, que pot incloure:
- generador de llenguatge natural
- generador de gestos
- gestor de maquetació
- Finalment, la sortida es representa mitjançant un renderitzador de sortida, que pot incloure:
- motor de text a veu (TTS)
- cap parlant
- robot o avatar
Els bots conversacionals que es basen en una interfície només de text (per exemple, xat basat en text) només contenen les etapes 2-5.
Tipus de sistemes
[modifica]Els bots conversacionals es divideixen en les categories següents, que s'enumeren aquí en algunes dimensions. Moltes de les categories es superposen i les distincions poden no estar ben establertes.
- per modalitat
- basat en text
- bot conversacional oral
- interfaç gràfica d'usuari
- multimodal
- per dispositiu
- sistemes basats en la telefonia
- Sistemes PDA
- sistemes dins del cotxe
- sistemes robotitzats
- sistemes d'escriptori / portàtils
- autòcton
- sistemes dins del navegador
- a la màquina virtual
- entorn virtual
- robots
- per estil
- basat en comandaments
- impulsat per menús
- llenguatge natural
- grafit de parla
- per iniciativa
- iniciativa del sistema
- iniciativa de l'usuari
- iniciativa mixta
Sistema de diàleg natural
[modifica]"Un Sistema de diàleg natural és una forma de bot conversacional que intenta millorar la usabilitat i la satisfacció dels usuaris imitant el comportament humà" [5] (Berg, 2014). Aborda les característiques d'un diàleg d'humà a humà (per exemple, subdiàlegs i canvis de tema) i pretén integrar-los en bots conversacionals per a la interacció home-màquina. Sovint, els bots conversacionals (parlats) requereixen que l'usuari s'adapti al sistema perquè el sistema només és capaç d'entendre un vocabulari molt limitat, no és capaç de reaccionar als canvis de tema i no permet que l'usuari influeixi en el flux del diàleg. La iniciativa mixta és una manera de permetre que l'usuari tingui una part activa en el diàleg en lloc de respondre només preguntes . Tanmateix, la mera existència d'iniciativa mixta no és suficient per classificar-se com un bot conversacional natural. Altres aspectes importants inclouen: [5]
- Adaptabilitat del sistema
- Suport de la confirmació implícita
- Ús de preguntes de verificació
- Possibilitats de corregir la informació que ja s'ha donat
- Excés informatiu (doneu més informació de la que s'ha demanat)
- Negacions de suport
- Comprendre referències analitzant el discurs i l'anàfora
- Generació de llenguatge natural per evitar indicacions monòtones i recurrents
- Formulació adaptativa i conscient de la situació
- Comportament social (salutacions, el mateix nivell de formalitat que l'usuari, educació)
- Qualitat del reconeixement i síntesi de la parla
Encara que la majoria d'aquests aspectes són temes de molts projectes de recerca diferents, hi ha una manca d'eines que donin suport al desenvolupament de bots conversacionals que abordin aquests temes. [6] A part de VoiceXML, que se centra en sistemes interactius de resposta de veu i és la base de molts bots conversacionals parlat a la indústria (aplicacions d'atenció al client) i AIML, famós pel bot de xat ALICE, cap d'ells integra característiques lingüístiques com els actes de diàleg o la generació de llenguatge. Per tant, NADIA (un prototip de recerca) dóna una idea de com omplir aquest buit i combina alguns dels aspectes esmentats anteriorment, com ara la generació del llenguatge natural, la formulació adaptativa i els subdiàlegs.
Rendiment
[modifica]Alguns autors mesuren el rendiment del bot conversacional en termes de percentatge d'oracions completament correctes, mitjançant la comparació del model d'oracions (aquesta mesura s'anomena Concept Sentence Accuracy [7] o Sentence Understanding [4] ).
Aplicacions
[modifica]Els bots conversacionals poden suportar una àmplia gamma d'aplicacions en empreses empresarials, educació, govern, salut i entreteniment. Per exemple:
- Respondre a les preguntes dels clients sobre productes i serveis mitjançant el lloc web o el portal d'intranet d'una empresa
- Base de coneixement de l'agent d'atenció al client: permet als agents escriure la pregunta d'un client i guiar-los amb una resposta
- Venda guiada : facilitant les transaccions proporcionant respostes i orientació en el procés de venda, especialment per a productes complexos que es venen a clients novells.
- Taulell d'ajuda : responent a preguntes internes dels empleats, per exemple, respondre a preguntes de recursos humans
- Navegació del lloc web: guiar els clients a les parts rellevants de llocs web complexos: un conserge del lloc web
- Suport tècnic: resposta a problemes tècnics, com ara diagnosticar un problema amb un producte o dispositiu
- Servei personalitzat: els agents de conversa poden aprofitar les bases de dades internes i externes per personalitzar les interaccions, com ara respondre preguntes sobre saldos de comptes, proporcionar informació de cartera, lliurar informació de viatger freqüent o de membres, per exemple.
- Formació o educació: poden oferir consells per resoldre problemes mentre l'usuari aprèn
- Els bots conversacionals senzills s'utilitzen àmpliament per reduir la càrrega de treball humana als centres de trucades . En aquesta i altres aplicacions de telefonia industrial, la funcionalitat que proporcionen els bots conversacionals es coneix com a resposta de veu interactiva o IVR.
- Donar suport al científic en tasques de manipulació i anàlisi de dades, per exemple en genòmica. [8]
En alguns casos, els agents conversacionals poden interactuar amb els usuaris mitjançant personatges artificials. Aquests agents s'anomenen llavors agents encarnats .
Kits d'eines i arquitectures
[modifica]Una enquesta dels marcs, llenguatges i tecnologies actuals per definir bots conversacionals.
Nom i enllaços | Tipus de sistema | Descripció | Afiliació[s] | Medi ambient[s] | Comentaris |
---|---|---|---|---|---|
AIML | Llenguatge Chatterbot | Dialecte XML per crear agents de programari en llenguatge natural | Richard Wallace, Pandorabots, Inc. | ||
ChatScript | Llenguatge Chatterbot | Llenguatge/motor per crear agents de programari en llenguatge natural | Bruce Wilcox | ||
Kit d'eines CSLU </br> |
Un entorn de prototipatge d'interfície de parla basat en estat | OGI Escola de Ciència i Enginyeria </br> M. McTear </br> Ron Cole |
les publicacions són de 1999. | ||
Servidor NLUI | Kit d'eines independent del domini | Marc multilingüe complet per construir sistemes d'interfície d'usuari en llenguatge natural | LinguaSys | suport precoç dels diàlegs d'iniciativa mixta | |
Olimp | Marc complet per implementar bots conversacionals oral | Universitat Carnegie Mellon | [1] | ||
Nextnova | Plataforma multimodal | Plataforma per desenvolupar aplicacions de programari multimodal. Basat en XML del diagrama d'estats (SCXML) | Ponvia Technology, Inc. | ||
VXML </br> XML de veu |
Diàleg parlat | Llenguatge de marques de diàleg multimodal | Desenvolupat inicialment per AT&T, després administrat per un consorci de la indústria i finalment una especificació del W3C | Exemple | principalment per a la telefonia. |
SAL | llenguatge de marques | Llenguatge de marques de diàleg multimodal | Microsoft | "no ha assolit el nivell de maduresa de VoiceXML en el procés d'estàndards". | |
Quack.com - QXML | Entorn de desenvolupament | Empresa comprada per AOL | |||
OpenDial | Kit d'eines independent del domini | Marc híbrid simbòlic/estadístic per a bots conversacionals parlat, implementat en Java | Universitat d'Oslo | ||
NADIA | motor de diàleg i modelització de diàlegs | Creació de diàlegs/bots conversacionals naturals. Suporta actes de diàleg, iniciativa mixta, NLG. Implementat en Java. | Markus M. Berg | Creeu fitxers de diàleg basats en XML, no cal especificar gramàtiques, les publicacions són del 2014 |
Referències
[modifica]- ↑ Klüwer, Tina. "From chatbots to dialog systems." Conversational agents and natural language interaction: Techniques and Effective Practices. IGI Global, 2011. 1-22.
- ↑ McTear, Michael, Zoraida Callejas, and David Griol, The conversational interface: Talking to smart devices, Springer, 2016.
- ↑ Giancarlo Pirani (ed), Advanced algorithms and architectures for speech understanding, Vol. 1. Springer Science & Business Media, 2013.
- ↑ 4,0 4,1 Alberto Ciaramella, A prototype performance evaluation report, Sundial work package 8000 (1993).
- ↑ 5,0 5,1 , ISBN 978-3-89838-508-4, <http://nbn-resolving.de/urn:nbn:de:gbv:8-diss-167394>
- ↑ Berg, Markus M. (2015), "NADIA: A Simplified Approach Towards the Development of Natural Dialogue Systems", Natural Language Processing and Information Systems, vol. 9103, Lecture Notes in Computer Science, pàg. 144–150, ISBN 978-3-319-19580-3, DOI 10.1007/978-3-319-19581-0_12
- ↑ Bangalore, Srinivas, and Michael Johnston. "Robust understanding in multimodal interfaces." Computational Linguistics 35.3 (2009): 345-397.
- ↑ ACM Transactions on Computing for Healthcare, DOI 10.1145/3464383
[[Categoria:Bots]]