GPT-4 Los analistas humanos pueden tener mejores resultados cuando se trata de predecir el futuro basándose en el análisis de datos financieros, según un nuevo artículo de investigación. El estudio, publicado en la revista Preprint, encontró en sus pruebas que GPT-4 dio resultados superiores en comparación con sus homólogos humanos en un período de corto plazo (que oscila entre uno y seis meses). Logró un 60,31 por ciento de precisión en sus predicciones en comparación con el 56,7 por ciento de los analistas humanos. Sin embargo, el artículo no indica que el modelo de IA pueda reemplazar a los humanos.
Objetivo del trabajo de investigación.
Fue publicado en la revista de 54 páginas de la Red de Investigación en Ciencias Sociales (SSRN). papel El curso titulado “Análisis de datos financieros utilizando modelos de lenguaje grandes” intentó explorar el papel que pueden desempeñar los modelos tradicionales de IA en el análisis de los estados financieros de una organización y en la predicción de su desempeño en el mercado de valores en el futuro cercano.
Siempre se ha entendido que dicho análisis es muy complejo ya que una amplia gama de factores pueden influir en el desempeño de las empresas. Si bien algunas empresas financieras utilizan redes neuronales artificiales (ANN) para ayudar a las personas con sus análisis, los modelos de lenguaje grande (LLM) no se utilizan para este propósito. Los investigadores querían saber si un software LLM (SOTA) de última generación como GPT-4 podría ser una valiosa adición a esto.
¿Qué encontró el artículo de investigación GPT-4?
Los investigadores alimentaron datos financieros anónimos y estandarizados de GPT-4 para empresas (para evitar que aparecieran sesgos cuando se mencionaba el nombre de la empresa). A continuación, los investigadores utilizaron dos métodos para probar las capacidades de LLM. El primero fue diseñar un mensaje simple que guiara al chatbot a analizar datos y predecir ganancias futuras. El segundo fue utilizar un mentor de “Cadena de Pensamiento” (CoT) que enseñara el modelo de IA a imitar a los analistas financieros.
El método CoT pidió a GPT-4 que identificara tendencias observables, calculara ratios financieros clave y hiciera proyecciones sobre ganancias futuras. Aunque las indicaciones simples no lograron resultados notables, las indicaciones de CoT lograron una puntuación del 60,31 por ciento, que es más alta que el desempeño promedio de un analista humano.
“Descubrimos que LLM sobresale en una tarea cuantitativa que requiere intuición y razonamiento humanos. La capacidad de realizar tareas en todos los dominios indica el surgimiento de la inteligencia artificial general”, sugiere el estudio.
Sin embargo, los investigadores se apresuraron a señalar que GPT y los analistas humanos son complementarios en lugar de que los primeros reemplacen a los segundos. Específicamente, el artículo afirma que los titulares de un LLM tienen una ventaja en áreas donde los humanos tienden a mostrar prejuicios y desacuerdos. Del mismo modo, los seres humanos añaden valor cuando el análisis requiere información contextual adicional que es poco probable que esté disponible en los estados financieros.