La Inteligencia Artificial Generativa (IAGen) en el Derecho: de las alucinaciones al Litigio Estratégico responsable

José Pablo Hernández Ramírez*

En los años recientes, la transición tecnológica ha dado un salto resaltable, que se refleja en la Inteligencia Artificial Generativa (IAGen), una herramienta que, en contraste con la IA tradicional, mediante prompts o comandos, es capaz de generar texto, código e imágenes, en vez de solamente clasificar o analizar los datos existentes, redefiniendo la manera en que se organiza el trabajo. Ello tiene impactos distintos en cada industria, y la “industria legal” no es la excepción. Se estima que hasta el 44% de las tareas legales actuales pueden ser automatizadas.[1]

Esta oportunidad puede permitir que pequeñas y medianas clínicas de derechos humanos, como la Clínica Jurídica del Programa Universitario de Derechos Humanos de la Universidad Nacional Autónoma de México (PUDH-UNAM), nivelen la balanza frente a grandes despachos, al poder incrementar drásticamente la productividad de cada abogado que se desempeña en estas clínicas.

En particular, las clínicas de derechos humanos pueden utilizar la IAGen para el análisis masivo de expedientes, que habilita a los abogados a ubicar discrepancias entre miles de páginas de informes y expedientes, facilitar la búsqueda de información dentro de los archivos, indicando la página y párrafo exacto, así como generar líneas del tiempo de los hechos narrados en los documentos, facilitando la comunicación de los hechos conocidos entre el personal de la clínica.

Entre los múltiples apoyos que puede proporcionar a las clínicas jurídicas, la IAGen puede servir de un simulador de estrategia, probando argumentos, actuando como la contraparte o el juzgador, criticando la solidez de los conceptos de violación propuestos, anticipando defensas. Además, puede analizar si la fundamentación jurídica de las demandas incluye todos los estándares, incluso los internacionales, aplicables al caso.

La IAGen también puede resumir volúmenes extensos de información para identificar puntos clave necesarios para comunicados o informes, y también puede generar estructuras para solicitudes de información, cartas de motivación o descripciones de hechos, que deben ser refinadas por los abogados.  Asimismo, la IAGen puede traducir documentos legales con tecnicismos a un lenguaje sencillo para la comprensión de las víctimas y también puede asistir en la revisión de jurisprudencia o tratados internacionales que no cuenten con una traducción oficial inmediata disponible.

El espejismo legal: ¿Por qué la IAGen comete errores?

La IAGen funciona a través de modelos de lenguaje (LLMs) que utilizan transformers que predicen estadísticamente la secuencia de palabras más probable, de acuerdo con el contexto que le es proporcionado.[2] Para la profesión legal, esto implica que el LLM no razona jurídicamente, solo replica patrones de lenguaje, legal en este caso. El LLM permite contextualizar palabras, pero  se basa en probabilidades de secuencia de palabras que aprendió durante su entrenamiento. A la hora de que se programa al LLM para dar una respuesta, al no encontrar la información en la memoria de entrenamiento, el LLM utiliza la predicción estadística para generar una secuencia de palabras con una forma correcta, aunque el fondo pueda ser falso.

Esto da lugar a las llamadas “alucinaciones” de la IAGen: la generación de contenido que parece perfectamente válido, pero es falso, como sentencias inexistentes o leyes derogadas, o referencias doctrinales inexistentes o mal citadas. Por lo tanto, a pesar de que esta herramienta presenta un nuevo mundo de oportunidades para quienes ejercen la profesión legal, actualmente, el mayor peligro para un abogado es confiar ciegamente en la máquina. ¿Qué se puede hacer al respecto?

Grounding y RAG: el antídoto ante las alucinaciones

La información es proporcionada al LLM a través del “prompting”, que es una instrucción que define un rol, una tarea, un contexto y un formato de salida del resultado al LLM. En el litigio estratégico, “promptear” correctamente significa saber descomponer un problema complejo en sub-tareas manejables, evitando instrucciones vagas que induzcan a la IAGen a confirmar sesgos o a rellenar vacíos con alucinaciones. Al final, un prompt bien diseñado es una pieza de redacción jurídica de alta precisión que garantiza que la IAGen funcione como un multiplicador de capacidades y no como un generador de riesgos.

Sin embargo, a pesar de hacer un uso adecuado del “prompting”, las alucinaciones persisten por el diseño de la herramienta. Para reducir las alucinaciones, particularmente al trabajar con textos, como hacemos los profesionales legales, es posible implementar el “anclaje” o “grounding” y la Generación Aumentada por Recuperación, o RAG, por sus siglas en inglés. El RAG es una arquitectura de IA que combina las capacidades de los LLMs pre-entrenados con un sistema de recuperación de información externa. El RAG busca documentos relevantes en una base de datos específica, como pueden ser leyes y expedientes, entre otros documentos, para utilizar esa información como contexto exclusivo para generar una respuesta más precisa.[3]

En términos prácticos, esta técnica permite cerrar el universo de información de la IAGen a nuestros propios documentos, que en el caso de los profesionales legales consisten mayoritariamente en PDF’s de expedientes o de leyes específicas, entre otros documentos relevantes. Al limitar su base de conocimientos, reducimos drásticamente las alucinaciones: si la información no está en el documento, la IAGen dirá “no lo encontré” en lugar de inventar una respuesta. El RAG permite a la IAGen citar la página y el párrafo exactos de donde extrae esta información, para asegurar la fiabilidad de la información y facilitar su revisión. Por otro lado, permite trabajar en ambientes cerrados, con mayores salvaguardas de confidencialidad.

Sin embargo, aunque cerremos el universo de información a nuestros documentos, las redes neuronales del LLM procesan y redactan la respuesta siguiendo el LLM original sobre el cual el RAG está basado, que finalmente fue entrenado con datos históricos, que pueden contener sesgos de género, raciales, entre muchos otros. Además, es relevante tener en cuenta que la IAGen, incluso a través de la utilización del RAG, tiende a dar la razón al usuario, por lo que buscará la premisa que el usuario le introduzca para confirmarla en sus bases de datos, ignorando diferentes argumentos o aquellos que estén en contra.

Existe evidencia de que, mientras que los modelos de lenguaje de propósito general, o sea, sin RAG, presentan tasas de error del 69 al 88% al responder consultas legales complejas,[4] los modelos de lenguaje que utilizan RAG reducen este margen a un rango entre 17% y 34%.[5] El uso del RAG mitiga ciertos riesgos, aunque persiste cierto rango de error. Este rango de error no puede ni debe ser ignorado por los abogados, quienes son responsables del uso de esta herramienta.

Uso responsable de la IAGen para el litigio estratégico

La implementación del uso de la IAGen en el litigio estratégico, además de ser un reto técnico, representa un profundo compromiso ético. Son los abogados quienes dirigen e instruyen a la IAGen y deben asumir responsabilidad sobre el contenido que este sistema pueda generar. El uso responsable de la IAGen, especialmente para el ejercicio de la profesión legal, exige ciertos pilares:

  • La eficiencia nunca debe comprometer la fidelidad a los hechos ni la protección de las personas.
  • Establecer reglas éticas y metodológicas para su uso dentro de la organización.[6] Las organizaciones deben tener un marco de gobernanza interno que defina cuáles tareas son delegables, y a qué nivel, y qué tareas deben ejecutar los humanos directamente sin apoyo de la IAGen. En esta política pueden utilizarse semáforos de riesgo, o la metodología de especialización de cada herramienta de IAGen, para asegurar que las ventanas de información y contexto sean lo más precisas posible. Es aconsejable que en estas reglas se incluya la obligación de declarar el uso de la IAGen en la elaboración de documentos de forma transparente.[7]
  • No olvidar que los modelos de lenguaje se alimentan de información, incluso aquellos que utilizan RAG, por lo que pueden replicar sesgos históricos, incluso discriminatorios.[8]
  • Nunca debemos alimentar a la IAGen con datos personales (nombres, CURP, direcciones, etc.)[9]. El derecho a la privacidad, particularmente en el ejercicio de la profesión legal, es sumamente relevante, sobre todo por el uso que puede darse a estos datos por parte de las empresas que habilitan estos sistemas. Es recomendable revisar la política de protección de datos de cada servicio de IAGen, previo a utilizarlo, para asegurarnos de que la herramienta que utilicemos no reentrene sus LLMs con los datos que ingresamos. Deben sustituirse los nombres reales y los datos sensibles por términos genéricos. Esto va en línea con la Ley Federal de Protección de Datos Personales en Posesión de los Particulares y con los principios que consagra: principio de licitud y finalidad, sensibilidad de los datos y consentimiento para su uso específico, y la responsabilidad del abogado sobre el tratamiento y la confidencialidad de los datos, incluso ante proveedores extranjeros, como resultan las empresas que ponen a la IAGen a nuestra disposición.
  • Es necesario contar con un protocolo de doble verificación:[10] esto significa que se debe revisar cada hecho, fundamento jurídico y cita bibliográfica. Es recomendable generar un “prompt” que instruya a la IAGen a citar siempre la página y el párrafo de la fuente e indicar a la IAGen que indique con una leyenda si la información no se encuentra en la base de datos proporcionada, en lugar de inventarla. Los seres humanos somos los pilotos de esta nueva tecnología. Nada debe enviarse ni presentarse sin una doble verificación. La IAGen ayuda con la lógica y la velocidad, pero carece de la sensibilidad y la visión estratégica necesaria para la defensa de los derechos humanos. Por otro lado, la IAGen puede no comprender correctamente una estrategia a largo plazo, y es posible perder el fin último de un caso o de una tarea al descomponerlo en sub-tareas. 

Conclusión La evolución de la profesión legal no se define, aún, por la sustitución del abogado por la máquina, sino por el cambio en la relación entre el abogado y sus herramientas, que siempre debe caracterizarse por un sentido crítico y ético. A pesar de que estas herramientas permiten alcanzar una productividad antes reservada para grandes plantillas, este gran poder exige una gran responsabilidad desde el rol del ser humano. Los humanos tenemos el rol de filtrar alucinaciones y aportar la sensibilidad estratégica que no puede replicarse aún, además de ser responsables del contenido que genera la IAGen a través de nuestras instrucciones, y los efectos que pueda producir en las vidas de las personas. Nuestra tarea es clara: evolucionar, verificar y proteger siempre la dignidad de las personas, recordando que la tecnología es el copiloto, pero la justicia es, y será siempre, una labor profundamente humana.


* Licenciado, maestro y doctorando en Derecho, doctorando y especialista en gestión de proyectos.

[1] Goldman Sachs. (2023). The Potentially Large Effects of Artificial Intelligence on Economic Growth. Goldman Sachs Economics Research. https://www.gspublishing.com/content/research/en/reports/2023/03/27/d64e052b-0f6e-45d7-967b-d7be35fabd16.html

[2] McKinsey & Company. (2023). The economic potential of generative AI: The next productivity frontier. McKinsey Global Institute. https://www.mckinsey.com/~/media/mckinsey/business%20functions/mckinsey%20digital/our%20insights/the%20economic%20potential%20of%20generative%20ai%20the%20next%20productivity%20frontier/the-economic-potential-of-generative-ai-the-next-productivity-frontier.pdf

[3] Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., … & Kiela, D. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems, 33, 9459-9474. https://proceedings.neurips.cc/paper_files/paper/2020/file/6b493230205f780e1bc26945df7481e5-Paper.pdf

[4] Dahl, M., Magesh, V., Suzgun, M., & Ho, D. E. (2024). Large Legal Fictions: Profiling Legal Hallucinations in Large Language Models. Journal of Legal Analysis, 16(1), 64-106. https://arxiv.org/pdf/2401.01301

[5] Dahl, M., Magesh, V., Suzgun, M., & Ho, D. E. (2024). Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools. Stanford University (Preprint/Working Paper).  https://dho.stanford.edu/wp-content/uploads/Legal_RAG_Hallucinations.pdf

[6] UNESCO. (2021). Recomendación sobre la Ética de la Inteligencia Artificial. UNESCO. https://unesdoc.unesco.org/ark:/48223/pf0000381137

[7] Parlamento Europeo. (2024). Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo, de 13 de junio de 2024, por el que se establecen normas armonizadas en materia de inteligencia artificial (Ley de Inteligencia Artificial). https://www.boe.es/doue/2024/1689/L00001-00144.pdf

[8] Noble, S. U. (2018). Algorithms of Oppression: How Search Engines Reinforce Racism. NYU Press. https://files.commons.gc.cuny.edu/wp-content/blogs.dir/6105/files/2019/01/SAFIYA-NOBLE.pdf

[9] Unión Europea. (2016). Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo, de 27 de abril de 2016, relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales (Reglamento General de Protección de Datos). https://www.boe.es/doue/2016/119/L00001-00088.pdf

[10] Id. Dahl et al.