Caso de estudio sobre simulación de datos para investigaciones académicas mediante Inteligencia Artificial Generativa y Google Colab

Autores/as

DOI:

https://doi.org/10.62697/rmiie.v4iS1.143

Palabras clave:

Datos simulados, inteligencia artificial generativa, validación de datos, Python, ChatGPT, prompts, t de Student

Resumen

Se presenta un caso de estudio sobre simulación de datos para la investigación académica, donde con Inteligencia Artificial Generativa (IAG) y el modelo ChatGPT se logra obtener un conjunto de datos simulados con los prompts adecuados. Para la validación de datos se utilizó Google Colab para Python. La metodología empleada se enfoca en comparar dos conjuntos de datos, uno que es real y otro que no, pero construido bajo parámetros de los datos primarios como la media, desviación estándar y cantidad de datos. Se utilizaron librerías específicas de Paython como numpy y ttest_ind para el análisis de la estadística como T-Student, y otras como matplotlib y seaborn para gráficos de densidad. Los resultados arrojados contrastan que los datos simulados guardaban estrecha relación con los datos reales. Se demostró que no fue significativo las diferencias estadísticas demostrando la utilidad de la metodología empleada.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Miguel Ángel Fernández-Marín, Universidad Metropolitana. Ecuador.

 

 

Débora González-Tolmo, Empresa de software en Quito Netby. Ecuador.

 

 

Citas

Apellániz, P. A., Jiménez, A., Borja Arroyo, G., Parras, J., & Zazo, S. (2024). Synthetic Tabular Data Validation: A Divergence-Based Approach. IEEE Access, 12. https://doi.org/10.1109/ACCESS.2024.3434582

Feuerriegel, S., Hartmann, J., Janiesch, C., & Zschech, P. (2024). Generative AI. Business & Information Systems Engineering, 66(1), 111-126. https://doi.org/10.1007/s12599-023-00834-7

Garrido Elustondo, S., Cabello Ballesteros, L., Galende Domínguez, I., Riesgo Fuertes, R., Rodríguez Barrientos, R., & Polentinos Castro, E. (2012). Investigación y protección de datos personales en atención primaria. Atención Primaria, 44(3), 172-177. https://doi.org/10.1016/j.aprim.2011.02.009

Gordon, B. G. (2020). Vulnerability in Research: Basic Ethical Concepts and General Approach to Review. Ochsner Journal, 20(1), 34-38. https://doi.org/10.31486/toj.19.0079

Kwok, C. S., Muntean, E.-A., Mallen, C. D., & Borovac, J. A. (2022). Data Collection Theory in Healthcare Research: The Minimum Dataset in Quantitative Studies. Clinics and Practice, 12(6), 832-844. https://doi.org/10.3390/clinpract12060088

López Guerrero, M. M., López Guerrero, G., & Rojano Ramos, S. (2018). Uso de un simulador para facilitar el aprendizaje de las reacciones de óxido-reducción. Estudio de caso Universidad de Málaga. Educación Química, 29(3), 79-98. https://doi.org/10.22201/fq.18708404e.2018.3.63728

López, R. G. (2024). Biblioguías: Datos de investigación: Los datos de investigación. Datos de investigación: Los datos de investigación. https://uah-es.libguides.com/c.php?g=664167&p=5165387

Machuca Martínez, F. (2020). Importancia de los datos científicos y su publicación como artículo de datos. Ingeniería y Competitividad, 22(1). https://doi.org/10.25100/iyc.v22i1.8843

Marín Arraiza, P., Puerta Díaz, M., & Vidotti, S. G. (2019). Gestión de datos de investigación y bibliotecas: Preservando los nuevos bienes científicos. Hipertext.net, 19, 13-31. https://doi.org/10.31009/hipertext.net.2019.i19.02

Marin, J. (2024). Evaluating Synthetically Generated Data from Small Sample Sizes: An Experimental Study, arXiv. https://doi.org/10.48550/arXiv.2211.10760

Morillo Moreno, J. C. (2024). Guías de la BUH: Datos de investigación: Beneficios de la gestión de datos de investigación. https://guiasbuh.uhu.es/datosinvestigacion/beneficios

Sánchez Vásquez, U., Daniel Guerrero, A. B., Méndez Gutiérrez, E., Morales López, S., Tovar Lozano, I. I., Martínez-Rodríguez, M. A., Uribe-Campos, I. E., Sánchez-Vásquez, U., Daniel-Guerrero, A. B., Méndez-Gutiérrez, E., Morales-López, S., Tovar-Lozano, I. I., Martínez-Rodríguez, M. A., & Uribe-Campos, I. E. (2021). Diseño, elaboración y validación de un simulador realista y de bajo costo para exploración cardiaca. Gaceta médica de México, 157(1), 25-29. https://doi.org/10.24875/gmm.20005688

Sengar, S. S., Hasan, A. B., Kumar, S., & Carroll, F. (2024). Generative Artificial Intelligence: A Systematic Review and Applications. arXiv. https://doi.org/10.48550/arXiv.2405.11029

Vélez Torres, Á. (2019). Modelación y simulación basada en agentes en ciencias sociales: Una aproximación al estado del arte. Polis (Santiago), 18(53), 282-308. https://doi.org/10.32735/s0718-6568/2019-n53-1392

Vilches, C. (2024). Biblioguias: Gestión de datos de investigación: Protección de los datos. Gestión de Datos de Investigación. https://biblioguias.cepal.org/c.php?g=495473&p=4398118

Descargas

Publicado

2025-04-01

Cómo citar

Fernández-Marín, M. Ángel, Montero-Murillo, J. R., & González-Tolmo, D. (2025). Caso de estudio sobre simulación de datos para investigaciones académicas mediante Inteligencia Artificial Generativa y Google Colab. Revista Mexicana De Investigación E Intervención Educativa, 4(S1), 18–26. https://doi.org/10.62697/rmiie.v4iS1.143