Científicos crean una IA de gestión de inversión en criptomonedas entrenada con datos on-chain

Un par de investigadores de la Universidad de Tsukuba, Japón, acaban de crear un sistema de gestión de carteras de inversión en criptomonedas basado en inteligencia artificial que utiliza datos on-chain para entrenarse, el primero de este tipo según los científicos.

Bautizado como CryptoRLPM, abreviatura de “Cryptocurrency reinforcement learning portfolio manager”, el sistema de IA utiliza una técnica de formación denominada “aprendizaje por refuerzo” para incorporar datos on-chain a su modelo.

El aprendizaje por refuerzo (RL) es un paradigma de optimización en el que un sistema de IA interactúa con su entorno -en este caso, una cartera de criptomonedas- y actualiza su entrenamiento basándose en señales de recompensa.

CryptoRLPM aplica la retroalimentación del aprendizaje por refuerzo en toda su arquitectura. El sistema está estructurado en cinco unidades primarias que trabajan conjuntamente para procesar información y gestionar carteras estructuradas.

Estos módulos incluyen una Unidad de Alimentación de Datos, una Unidad de Perfeccionamiento de Datos, una Unidad de Agente de Cartera, una Unidad de Negociación en Tiempo Real y una Unidad de Actualización de Agentes.

Captura de pantalla de la investigación pre-impresión, “A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management”

Una vez desarrollado, los científicos probaron CryptoRLPM asignándole tres carteras. La primera contenía únicamente Bitcoin (BTC) y Storj (STORJ), la segunda mantuvo BTC y STORJ añadiendo Bluzelle (BLZ), y la tercera mantuvo las tres más Chainlink (LINK).

Los experimentos se llevaron a cabo durante un periodo comprendido entre octubre de 2020 y septiembre de 2022 con tres fases distintas (formación, validación y backtesting).

Los investigadores midieron el éxito de CryptoRLPM comparándolo con una evaluación de referencia del rendimiento estándar del mercado a través de tres métricas: “tasa de rentabilidad acumulada” (TCA), “tasa de rentabilidad diaria” (TDR) y “ratio Sortino” (RS).

La TCA y el TDR miden a simple vista cuánto ha perdido o ganado un activo en un periodo de tiempo determinado y el SR mide la rentabilidad ajustada al riesgo de un activo.

Captura de pantalla de la investigación pre-impresión, “A Scalable Reinforcement Learning-based System Using On-Chain Data for Cryptocurrency Portfolio Management”

Según el documento de investigación preimpreso de los científicos, CryptoRLPM demuestra mejoras significativas con respecto al rendimiento de referencia:

“En concreto, CryptoRLPM muestra al menos una mejora del 83.14% en TCA, al menos una mejora del 0.5603% en TDR, y al menos una mejora del 2.1767 en SR, en comparación con la referencia de Bitcoin”.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

Sigue leyendo:

Las inversiones en criptoactivos no están reguladas. Es posible que no sean apropiados para inversores minoristas y que se pierda el monto total invertido. Los servicios o productos ofrecidos no están dirigidos ni son accesibles a inversores en España.