Parcialidad en la IA: ¿qué pueden hacer las cadenas de bloques para garantizar la transparencia?
Los proyectos basados en inteligencia artificial (IA) se están convirtiendo rápidamente en parte integrante del paradigma tecnológico moderno, ayudando en los procesos de toma de decisiones en diversos sectores, desde las finanzas a la sanidad. Sin embargo, a pesar de los importantes avances, los sistemas de IA no están exentos de defectos. Uno de los problemas más críticos a los que se enfrenta la IA hoy en día es el de los sesgos de los datos, que se refiere a la presencia de errores sistémicos en un determinado conjunto de información que conducen a resultados sesgados cuando se entrenan modelos de aprendizaje automático.
Como los sistemas de IA dependen en gran medida de los datos, la calidad de los datos de entrada es de suma importancia, ya que cualquier tipo de información sesgada puede dar lugar a prejuicios dentro del sistema. Esto puede perpetuar aún más la discriminación y la desigualdad en la sociedad. Por lo tanto, es esencial garantizar la integridad y objetividad de los datos.
Por ejemplo, un artículo reciente explora cómo las imágenes generadas por IA, en concreto las creadas a partir de conjuntos de datos dominados por fuentes de influencia estadounidense, pueden tergiversar y homogeneizar el contexto cultural de las expresiones faciales. Cita varios ejemplos de soldados o guerreros de diversos periodos históricos, todos con la misma sonrisa de estilo estadounidense.
Además, el sesgo dominante no solo no capta la diversidad y los matices de la expresión humana, sino que también corre el riesgo de borrar historias y significados culturales vitales, afectando así potencialmente a la salud mental global, al bienestar y a la riqueza de las experiencias humanas. Para mitigar esta parcialidad, es esencial incorporar conjuntos de datos diversos y representativos a los procesos de entrenamiento de la IA.
Varios factores contribuyen a la parcialidad de los datos en los sistemas de IA. En primer lugar, el propio proceso de recopilación puede ser defectuoso y las muestras no ser representativas de la población objetivo. Esto puede llevar a la infrarrepresentación o sobrerrepresentación de determinados grupos. En segundo lugar, los sesgos históricos pueden filtrarse en los datos de entrenamiento, lo que puede perpetuar los prejuicios sociales existentes. Por ejemplo, los sistemas de IA entrenados con datos históricos sesgados pueden seguir reforzando los estereotipos raciales o de género.
Por último, los prejuicios humanos pueden introducirse inadvertidamente durante el proceso de etiquetado de los datos, ya que los etiquetadores pueden albergar prejuicios inconscientes. La elección de las características o variables utilizadas en los modelos de IA puede dar lugar a resultados sesgados, ya que algunas características pueden estar más correlacionadas con determinados grupos, provocando un trato injusto. Para mitigar estos problemas, los investigadores y los profesionales deben ser conscientes de las posibles fuentes de objetividad sesgada y trabajar activamente para eliminarlas.
¿Puede la cadena de bloques hacer posible una IA imparcial?
Aunque la tecnología blockchain puede ayudar en ciertos aspectos a mantener la neutralidad de los sistemas de IA, no es en absoluto la panacea para eliminar por completo los sesgos. Los sistemas de IA, como los modelos de aprendizaje automático, pueden desarrollar ciertas tendencias discriminatorias basadas en los datos con los que se entrenan. Además, si los datos de entrenamiento contienen diversas predisposiciones, es probable que el sistema las aprenda y las reproduzca en sus resultados.
Dicho esto, la tecnología blockchain puede contribuir a hacer frente a los sesgos de la IA de maneras propias. Por ejemplo, puede ayudar a garantizar la procedencia y la transparencia de los datos. Los sistemas descentralizados pueden rastrear el origen de los datos utilizados para entrenar los sistemas de IA, garantizando la transparencia en el proceso de recopilación y agregación de información. Esto puede ayudar a las partes interesadas a identificar posibles fuentes de sesgo y abordarlas.
Del mismo modo, las cadenas de bloques pueden facilitar el intercambio seguro y eficiente de datos entre múltiples partes, permitiendo el desarrollo de conjuntos de datos más diversos y representativos.
Además, al descentralizar el proceso de formación, blockchain puede permitir que múltiples partes contribuyan con su propia información y experiencia, lo que puede ayudar a mitigar la influencia de cualquier perspectiva sesgada.
Mantener la neutralidad objetiva requiere una cuidadosa atención a las diversas etapas del desarrollo de la IA, incluida la recopilación de datos, la formación de modelos y la evaluación. Además, la supervisión y actualización continuas de los sistemas de IA son cruciales para abordar los posibles prejuicios que puedan surgir con el tiempo.
Para comprender mejor si la tecnología blockchain puede hacer que los sistemas de IA sean completamente neutrales, Cointelegraph se puso en contacto con Ben Goertzel, fundador y CEO de SingularityNET, un proyecto que combina inteligencia artificial y blockchain.
En su opinión, el concepto de “objetividad completa” no es realmente útil en el contexto de los sistemas de inteligencia finita que analizan conjuntos de datos finitos.
“Lo que los sistemas de blockchain y Web3 pueden ofrecer no es objetividad completa o falta de sesgo, sino transparencia para que los usuarios puedan ver claramente qué sesgo tiene un sistema de IA. También ofrece configurabilidad abierta para que una comunidad de usuarios pueda ajustar un modelo de IA para que tenga el tipo de sesgo que prefiera y ver de forma transparente qué tipo de sesgo está reflejando”, afirmó.
Además, afirmó que en el campo de la investigación de la IA, “sesgo” no es una palabra sucia. Por el contrario, es simplemente indicativo de la orientación de un sistema de IA que busca determinados patrones en los datos. Dicho esto, Goertzel admitió que los sesgos opacos impuestos por organizaciones centralizadas a usuarios que no son conscientes de ellos —aunque se ven guiados e influidos por ellos— son algo de lo que la gente debe desconfiar. Y añadió:
“Los algoritmos de IA más populares, como ChatGPT, son deficientes en términos de transparencia y divulgación de sus propios sesgos. Por lo tanto, parte de lo que se necesita para manejar adecuadamente el problema del sesgo de la IA son redes participativas descentralizadas y modelos abiertos, no solo de código abierto sino matrices de peso abierto que son modelos entrenados y adaptados con contenido abierto”.
Del mismo modo, Dan Peterson, director de operaciones de Tenet -una red de blockchain centrada en la IA- dijo a Cointelegraph que es difícil cuantificar la neutralidad y que algunas métricas de IA no pueden ser imparciales porque no hay una línea cuantificable para cuando un conjunto de datos pierde neutralidad. En su opinión, al final todo se reduce a la perspectiva de dónde traza la línea el ingeniero, y esa línea puede variar de una persona a otra.
“El concepto de que algo sea verdaderamente ‘imparcial’ ha sido históricamente un reto difícil de superar. Aunque la verdad absoluta en cualquier conjunto de datos que se introduzca en los sistemas generativos de IA puede ser difícil de precisar, lo que podemos hacer es aprovechar las herramientas que el uso de la tecnología blockchain y Web3 pone a nuestra disposición”, afirmó.
Peterson afirmó que las técnicas creadas en torno a los sistemas distribuidos, la verificabilidad e incluso la comprobación social pueden ayudarnos a idear sistemas de IA que se acerquen “lo más posible” a la verdad absoluta. Sin embargo, aún no se trata de una solución “llave en mano”; estas tecnologías en desarrollo nos ayudan a avanzar a velocidad de vértigo mientras seguimos construyendo los sistemas del mañana”, afirmó.
Hacia un futuro basado en la inteligencia artificial
La escalabilidad sigue siendo una preocupación importante para la tecnología blockchain. A medida que aumenta el número de usuarios y transacciones, puede limitarse la capacidad de las soluciones de cadena de bloques para gestionar las cantidades masivas de datos generados y procesados por los sistemas de IA. Además, incluso la adopción e integración de soluciones basadas en blockchain en las IA existentes plantean retos significativos.
En primer lugar, existe una falta de comprensión y experiencia tanto en las tecnologías de IA como en las de blockchain, lo que puede obstaculizar el desarrollo y despliegue de soluciones que combinen ambos paradigmas de forma eficaz. En segundo lugar, convencer a las partes interesadas de las ventajas de las plataformas blockchain, sobre todo cuando se trata de garantizar una transmisión imparcial de los datos de IA, puede resultar difícil, al menos al principio.
A pesar de estos retos, la tecnología blockchain tiene un inmenso potencial para nivelar el panorama de la IA, en rápida evolución. Al aprovechar las características clave de blockchain -como la descentralización, la transparencia y la inmutabilidad- es posible reducir los sesgos en la recopilación, gestión y etiquetado de datos, lo que en última instancia conduce a sistemas de IA más equitativos. Por lo tanto, será interesante ver cómo se desarrolla el futuro de aquí en adelante.
Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión