La inteligencia artificial ya está aquí

Este post está basado en un artículo elaborado por Sissi Closs y publicado en la última edición de la revista Technische Kommunikation (05/2023, edición de septiembre-octubre: “Langes Grübeln hat ein Ende“).

Si quieres ir directamente al vídeo, haz clic aquí.

Introducción

[desplegable] La IA ya ha llegado a la Comunicación Técnica: Si quieres elaborar un manual fácilmente, puedes recurrir a la inteligencia artificial. Sin embargo, ¿qué información necesita una IA como ChatGPT para lograr resultados aceptables? Y por otro lado, ¿dónde llega la tecnología actual a sus límites?

 

Desde que DeepMind ganó al ser humano jugando al go en 2016, el mundo de la inteligencia artificial se ha acelerado. El 30 de noviembre de 2022, la empresa estadounidense OpenAI lanzó un ChatBot interactivo que se convirtió en la comidilla de la comunidad de IA en pocos días y en un fenómeno cultural global en pocas semanas. Elon Musk y Amazon están significativamente involucrados en OpenAI y, desde 2019, Microsoft también ha estado involucrado.

Con el lanzamiento de ChatGPT (Chat Generative Pretained Transformer), la IA se volvió tangible y manejable para todos de una sola vez. Una indicación (“prompt”) es todo lo que se necesita para generar informes, artículos, tratados para todo tipo de temas de forma gratuita, para recuperar ideas para preguntas de moderación, presentaciones, tareas en cuestión de segundos, para escribir programas y para llevar a cabo discusiones de expertos.

ChatGPT en pocas palabras

[desplegable] Con la ayuda de modelos lingüísticos grandes (LLM), las tecnologías de IA generativa han avanzado enormemente en los últimos años, especialmente en el campo del reconocimiento y la generación de imágenes y voz. Los LLM aprenden de grandes cantidades de datos de entrada y producen resultados basados en patrones.

ChatGPT se basa en el modelo de lenguaje GPT (Generative Pretrained Transformer). Lo que es único de ChatGPT es la enorme cantidad de datos de una variedad de fuentes que se han utilizado para entrenar a ChatGPT y la enorme cantidad de aproximadamente 175 millones de parámetros utilizados para controlar los algoritmos. Esto da como resultado una amplia gama de posibles aplicaciones. Esto se debe a que ChatGPT no está restringido temáticamente y se comunica en diferentes idiomas. En el caso de las entradas en lenguaje natural, conocidas como indicaciones, ChatGPT produce respuestas creíbles que son casi indistinguibles de las respuestas humanas.

ChatGPT no solo responde preguntas sobre una amplia variedad de temas, sino que también traduce textos, los resume, crea ensayos sobre un tema determinado, escribe poesía o programas. Otra característica especial es que ChatGPT recuerda las entradas anteriores durante un diálogo y adapta las respuestas a las indicaciones de seguimiento al contexto anterior.

Insumos específicos

La “prompt engineering” se refiere a la formulación de indicaciones en un chat con IA generativa. Por ejemplo, la elección de las palabras, la estructura y las características de la consulta juegan un papel decisivo a la hora de determinar qué función activa ChatGPT y qué tan apropiadas son las respuestas. De acuerdo con la tabla 1, se muestra una descripción general de los promts (indicaciones) y su resultado en ChatGPT. En el caso de que estemos hablando de “Few/One Shot Prompting”, entonces la especificación contiene pocos o incluso solo un ejemplo; según la especificación, ChatGPT debería proporcionar más ejemplos.

Tabla 1: Indicaciones típicas para ChatGPT (desplegable)

Indicación (promt) Función que se ejecuta
Genera… Crea… Entrega 100 caracteres para… Sugiere… Genera texto para el tema especificado
Interpreta… ¿Qué significa? ¿Qué incluye? Interpreta el contenido especificado y responde preguntas o proporciona información sobre él en función de él
Qué es… Proporciona hechos, definiciones, explicaciones
Resume… Resume el contenido
Mejora Mejora el contenido, por ejemplo, la legibilidad, la comprensibilidad, el alcance
Escribe con estilo Dame un ejemplo poco convencional de Imita el estilo o el lenguaje, por ejemplo, de autores famosos o de diferentes géneros
Reescribe el texto un poco más en serio y cambia el estilo de la dirección a “usted”. Acorta la longitud a un máximo de cinco oraciones. Reescribe textos, como cambiar el estilo o la longitud
Sugiere un título y subtítulos Proporciona instrucciones para Escribe los datos como una tabla Contenido estructurado
Por otro lado, si se utilizan varias especificaciones separadas por dos puntos, una solicitud se puede reducir a un área específica, un grupo objetivo, un estilo o incluso un idioma. A continuación, en la Tabla 2 se muestran ejemplos de combinaciones específicas.

Tabla 2: Ejemplos de combinaciones de indicaciones (desplegable)

Especificación Ejemplos de indicaciones
Estilo Profesional, formal, informal, informativo, persuasivo, humorístico
Estructura Ensayo, viñetas, esquema, diálogo, lista, tabla
Grupo objetivo Experto, Crítico
Carácter Entusiasta
Propósito Informar, persuadir, entretener
Contexto Datos, Antecedentes, Medio Ambiente
Contención Alcance, lugar, tiempo, evitación de palabras
Credibilidad Incorporación de citas, referencias, múltiples perspectivas, comparación y contraste de conceptos
Ideación Escenarios hipotéticos, tendencias futuras
Ilustración Anécdotas, ejemplos, metáforas, historias

Especificar por combinación

¿Qué resultados ofrece ChatGPT en la práctica? Veamos cuatro ejemplos con indicaciones y sus resultados:

  • La ilustración 1 muestra un discurso en inglés en la apertura de una conferencia. La indicación dice: Escríbeme un discurso de apertura para una conferencia, Estilo: Profesional, Idioma: Inglés, Tema: Inteligencia artificial.
  • La Ilustración 2 muestra un plan de clases en forma de tabla. La indicación dice: Crear un plan de clase como una tabla para el tema XML Basics. Participantes: 30. Duración total: 90 min. Grupo objetivo: Estudiantes.
  • La Ilustración 3 muestra cómo ChatGPT puede soportar la programación, en este caso el etiquetado de una dirección. La indicación es: Etiquete la siguiente dirección para envíos internacionales XML: José Fernández c/ Alcalá 1, 28001 Madrid, España.
  • La ilustración 4 muestra la gramática como DTD para el ejemplo de la dirección de la ilustración 3. La indicación dice: Dame la gramática como DTD también. Este ejemplo es una “indicación de seguimiento”.

Ilustración 1: Discurso apertura conferencia IA

Ilustración 2: Plan de clase XML basics

Ilustración 3: Etiquetado dirección XML

Ilustración 4: Grámatica DTD

Uso de herramientas

Están surgiendo nuevas herramientas impulsadas por IA a un ritmo sin precedentes. Por ejemplo, las plataformas https://www.thataicollection.com/ y https://theresanaiforthat.com/ enumeran herramientas actualizadas para todas las áreas. Incluso así, las herramientas que han estado en el mercado durante algún tiempo ya se han ampliado para incluir funciones de IA generativa. Entre ellos se encuentran los motores de búsqueda, las herramientas de redacción, las herramientas de edición de imágenes, los sistemas de gestión de contenidos y las herramientas de programación (tabla 3). Este desarrollo tiene serias implicaciones, también para la comunicación técnica, y cambiará significativamente todos los ámbitos: formación, perfiles laborales, trabajo diario, herramientas y productos de información.

Tabla 3: Aplicaciones IA (desplegable)

Campo Herramienta Ampliación IA Página web
Búsqueda Google Google Bard https://bard.google.com/
Búsqueda MS Bing Bing new https://www.bing.com/new?cc=es
Herramientas de Redacción MS Office 365 Copilot (a partir del 1 de noviembre) https://news.microsoft.com/es-es/2023/09/21/llega-microsoft-copilot-el-companero-de-inteligencia-artificial-para-el-dia-a-dia/
Syncrosoft Oxygen Editor Al positron Assistant Plugin https://blog.oxygenxml.com/topics/ai_positron.html
Procesamiento de imágenes Adobe Photoshop Generative Fill www.adobe.com/de/products/photoshop/generative-fill.html
Gestión de contenidos, programación WordPress Codewp codewp.ai
Programación GitHub GitHub Copilot docs.github.com/de/copilot

Ya está en uso en nuestro mundo

A modo de ejemplo, la autora del artículo elige una herramienta como ejemplo del uso de la IA en la Comunicación Técnica. 

Oxygen Editor, una conocida herramienta de redacción de contenidos XML y DITA, ya ofrece una integración de funciones de IA en una versión beta. El nuevo “plug-in Oxygen AI Positron Assistant” está diseñado para facilitar a los autores la creación de contenido al proporcionar acceso a herramientas impulsadas por IA. Una vez instalado, se incrustan dos vistas de Oxygen AI Positron Assistant en la interfaz de la herramienta. [1]

El complemento Oxygen AI Positron Assistant proporciona varias formas de utilizar ChatGPT para ayudar a los escritores mientras editan o revisan la documentación técnica. Por ejemplo, se puede utilizar para recibir sugerencias sobre qué escribir a continuación, mejorar la legibilidad del contenido o reestructurar el contenido de varias maneras.

En el siguiente vídeo, que ha salido hace unos pocos días, podéis ver cómo funciona:

Para utilizar las funciones de IA, el usuario debe iniciar sesión en Google o GitHub y conectar el complemento a la plataforma de servicios Oxygen AI Positron. Esto permite el acceso a ChatGPT y GPT-4 a través de la interfaz del programa OpenAI. Una vez conectado a la plataforma de servicios AI Positron, las funciones de AI Positron Assistant están disponibles. La tabla 04 muestra la función del complemento en la columna de la izquierda y la acción que inicia en ChatGPT o GPT-4 en la derecha.

Tabla 4: Funciones AI Positron Assistant Oxygen (desplegable)

Función Acción
Continue Writing Reanudar la frase iniciada
Follow Instructions Después de la entrada de solicitudes, genere el contenido correspondiente e insértelo en el documento actual
Translation Traduzca el contenido seleccionado al francés, alemán, japonés o inglés, conservando en gran medida la estructura XML
Readability Comprobar la legibilidad del contenido etiquetado y generar sugerencias de mejora
Summarize Resumir el contenido seleccionado
  Los resultados se muestran a continuación: Interfaz de usuario gráfica, Texto, Aplicación Descripción generada automáticamente Si trabaja con DITA, puede acceder a funciones adicionales con la ayuda del plug-in (tabla 5).

Tabla 5: Funciones DITA Oxygen AI Positron Assistant

Función Acción
Improve Readability Optimiza el contenido para una mejor legibilidad.
Generate Topic A partir de un encabezado <title> o el <shortdesc> se genera el contenido del tema.
Short Description Crea el elemento <shortdesc> para un tema a partir del contenido del tema.
Index Terms Cree un tema analizando el contenido del tema resaltado y extrayendo los términos relevantes de los términos del índice en la sección del prólogo.
Itemize Convertir un cuerpo de texto con opciones en una lista.
Join Items Convertir las entradas de lista de una lista en texto continuo.

Vulnerabilidades y limitaciones

Las impresionantes capacidades de ChatGPT no deben ocultar el hecho de que es un prototipo que todavía tiene debilidades. Por ejemplo, hay que tener en cuenta que ChatGPT genera sus respuestas utilizando generadores aleatorios. Por lo tanto, si se introduce repetidamente el mismo mensaje inicial, normalmente no se produce la misma respuesta. Esto hace que los diálogos sean más variados y humanos. Sin embargo, una vez que se ha generado una respuesta, no se puede reproducir.

He consultado al mismo ChatGPT al respecto de esta aseveración de la autora: (desplegable)

Consulta: ¿Qué puedes responder al párrafo anterior?

Respuesta: El concepto de “generadores aleatorios” en relación con ChatGPT no es del todo preciso. Aunque puede parecer que las respuestas de ChatGPT son generadas de forma aleatoria debido a la variabilidad en las respuestas, en realidad, se basan en un modelo de lenguaje coherente y contextual que utiliza un proceso de generación determinista basado en el aprendizaje automático. Este enfoque permite que ChatGPT produzca respuestas diversas y contextualmente relevantes en función de la entrada proporcionada, en lugar de respuestas completamente aleatorias.

Si bien es cierto que al introducir el mismo mensaje inicial varias veces no se obtendrá la misma respuesta, esto se debe a la naturaleza probabilística y no determinista de los modelos de lenguaje, así como a la influencia de varios factores, como el contexto y la semántica de la conversación. Sin embargo, el proceso de generación no se basa en la aleatoriedad pura, sino en la comprensión de patrones y estructuras lingüísticas derivadas de grandes conjuntos de datos de entrenamiento.

Es importante tener en cuenta que, si bien ChatGPT puede mostrar variabilidad en las respuestas, no se basa en generadores aleatorios en el sentido estricto del término. Sus respuestas se producen a partir de un proceso de generación complejo y sofisticado que utiliza algoritmos de aprendizaje automático para proporcionar respuestas contextualmente coherentes y relevantes.

Otro punto es la falta de transparencia en cuanto a las fuentes utilizadas. Las respuestas de ChatGPT no indican qué fuentes utilizó ChatGPT para estas respuestas. Esto conduce a otro problema importante: debido a que las fuentes de las respuestas no son rastreables, existe el riesgo de que el sesgo y el prejuicio se refuercen si los datos de entrenamiento no son objetivos o contienen un sesgo.

Respuestas de ChatGPT a esta aseveración: (desplegable)

Consulta: ¿Qué puedes responder al párrafo anterior?

Respuesta:
El punto sobre la falta de transparencia en cuanto a las fuentes utilizadas por ChatGPT para generar respuestas es relevante y ha sido objeto de discusión en el campo de la inteligencia artificial y el aprendizaje automático. Dado que ChatGPT se entrena en grandes conjuntos de datos textuales, la trazabilidad de las fuentes individuales utilizadas para la generación de respuestas puede ser compleja y difícil de rastrear.

La falta de transparencia en las fuentes plantea preocupaciones legítimas sobre la posibilidad de sesgo y prejuicio en las respuestas generadas por ChatGPT. Si los conjuntos de datos utilizados para el entrenamiento no son representativos o contienen sesgos inherentes, existe el riesgo de que estos sesgos se refuercen en las respuestas generadas, lo que podría tener implicaciones negativas en términos de equidad, imparcialidad y precisión de la información proporcionada.

Para abordar estas preocupaciones, los investigadores y desarrolladores en el campo de la inteligencia artificial y el procesamiento del lenguaje natural están trabajando en enfoques que promuevan la transparencia en el entrenamiento de modelos de lenguaje, así como en la mitigación del sesgo en los conjuntos de datos utilizados. Esto incluye técnicas como el etiquetado y la identificación de datos sesgados, así como el desarrollo de algoritmos y marcos de trabajo que fomenten la equidad y la imparcialidad en la generación de respuestas.

Es fundamental seguir avanzando en la comprensión y el abordaje de estas cuestiones para garantizar que los sistemas de inteligencia artificial, como ChatGPT, proporcionen respuestas precisas, imparciales y contextualmente relevantes, sin reforzar inadvertidamente sesgos o prejuicios en sus salidas.

Además, la propia OpenAI advierte de que ChatGPT puede “alucinar”. Esto significa que, en algunos casos, el sistema inventa hechos o proporciona información falsa sin aclararla. Lo que produce es plausible, al menos a nivel lingüístico. Pero, por impresionante que sea, no significa que los hechos y cálculos que ChatGPT presenta de manera convincente sean correctos. Si se conocen los hechos, ChatGPT se puede corregir acepta cortésmente la corrección. Sin embargo, si falta el conocimiento, el error no se detectará ni se podrá corregir.

Ya hay herramientas que no cometen esos errores. Por ejemplo, el motor de búsqueda https://www.wolframalpha.com. El inventor explica las razones de esto y las diferencias en los enfoques tecnológicos en su página web[2].

Wolfram|Alpha as the Way to Bring Computational Knowledge Superpowers to ChatGPT

Información obsoleta

El material de formación de ChatGPT se extiende hasta 2021, por lo que no contiene ninguna información actualizada. ChatGPT reconoce las consultas que obviamente se refieren a hechos actuales y da una pista correspondiente. Si de una solicitud no se desprende que la información haya cambiado desde 2021, también falta la referencia correspondiente al estado de los conocimientos y ChatGPT proporciona información obsoleta.

Riesgos y efectos secundarios

La propia GPT señala que es importante tener en cuenta las deficiencias y riesgos en su aplicación y cuestionar críticamente las respuestas. También es necesario consultar fuentes alternativas o consultar expertos humanos para obtener información fiable. La fascinante tecnología también plantea grandes peligros en términos de mal uso y violación de la protección de datos y los aspectos éticos. En mayo de 2023, la Oficina Federal Alemana de Seguridad de la Información (BSI) publicó un documento de posición sobre las oportunidades y los riesgos de los modelos grandes de lenguaje (LLM, large language models) [3].

Conclusión

Es de agradecer que ChatGPT y las herramientas basadas en él puedan utilizarse para probar el uso de esta tecnología de forma sencilla. Es de esperar que la experiencia adquirida conduzca a soluciones en las que los efectos positivos superen con creces a los efectos negativos y los efectos negativos sigan siendo manejables.

  1. https://blog.oxygenxml.com/topics/ai_positron.html
  2. Wolfram, Stephen (2023): Wolfram Alpha as the Way to Bring Computational Knowledge Superpowers to ChatGPT, Stephen Wolfram Writings. writings. https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/ .
  3. https://www.bsi.bund.de/SharedDocs/Downloads/DE/BSI/KI/Grosse_KI_Sprachmodelle.pdf Inglés: https://www.bsi.bund.de/SharedDocs/Downloads/EN/BSI/KI/AI-in-lLanguage-processing.html?nn=910042

Inicia sesión