Caso de estudio sobre simulación de datos para investigaciones académicas mediante Inteligencia Artificial Generativa y Google Colab
DOI:
https://doi.org/10.62697/rmiie.v4iS1.143Palabras clave:
Datos simulados, inteligencia artificial generativa, validación de datos, Python, ChatGPT, prompts, t de StudentResumen
Se presenta un caso de estudio sobre simulación de datos para la investigación académica, donde con Inteligencia Artificial Generativa (IAG) y el modelo ChatGPT se logra obtener un conjunto de datos simulados con los prompts adecuados. Para la validación de datos se utilizó Google Colab para Python. La metodología empleada se enfoca en comparar dos conjuntos de datos, uno que es real y otro que no, pero construido bajo parámetros de los datos primarios como la media, desviación estándar y cantidad de datos. Se utilizaron librerías específicas de Paython como numpy y ttest_ind para el análisis de la estadística como T-Student, y otras como matplotlib y seaborn para gráficos de densidad. Los resultados arrojados contrastan que los datos simulados guardaban estrecha relación con los datos reales. Se demostró que no fue significativo las diferencias estadísticas demostrando la utilidad de la metodología empleada.
Descargas
Citas
Apellániz, P. A., Jiménez, A., Borja Arroyo, G., Parras, J., & Zazo, S. (2024). Synthetic Tabular Data Validation: A Divergence-Based Approach. IEEE Access, 12. https://doi.org/10.1109/ACCESS.2024.3434582
Feuerriegel, S., Hartmann, J., Janiesch, C., & Zschech, P. (2024). Generative AI. Business & Information Systems Engineering, 66(1), 111-126. https://doi.org/10.1007/s12599-023-00834-7
Garrido Elustondo, S., Cabello Ballesteros, L., Galende Domínguez, I., Riesgo Fuertes, R., Rodríguez Barrientos, R., & Polentinos Castro, E. (2012). Investigación y protección de datos personales en atención primaria. Atención Primaria, 44(3), 172-177. https://doi.org/10.1016/j.aprim.2011.02.009
Gordon, B. G. (2020). Vulnerability in Research: Basic Ethical Concepts and General Approach to Review. Ochsner Journal, 20(1), 34-38. https://doi.org/10.31486/toj.19.0079
Kwok, C. S., Muntean, E.-A., Mallen, C. D., & Borovac, J. A. (2022). Data Collection Theory in Healthcare Research: The Minimum Dataset in Quantitative Studies. Clinics and Practice, 12(6), 832-844. https://doi.org/10.3390/clinpract12060088
López Guerrero, M. M., López Guerrero, G., & Rojano Ramos, S. (2018). Uso de un simulador para facilitar el aprendizaje de las reacciones de óxido-reducción. Estudio de caso Universidad de Málaga. Educación Química, 29(3), 79-98. https://doi.org/10.22201/fq.18708404e.2018.3.63728
López, R. G. (2024). Biblioguías: Datos de investigación: Los datos de investigación. Datos de investigación: Los datos de investigación. https://uah-es.libguides.com/c.php?g=664167&p=5165387
Machuca Martínez, F. (2020). Importancia de los datos científicos y su publicación como artículo de datos. Ingeniería y Competitividad, 22(1). https://doi.org/10.25100/iyc.v22i1.8843
Marín Arraiza, P., Puerta Díaz, M., & Vidotti, S. G. (2019). Gestión de datos de investigación y bibliotecas: Preservando los nuevos bienes científicos. Hipertext.net, 19, 13-31. https://doi.org/10.31009/hipertext.net.2019.i19.02
Marin, J. (2024). Evaluating Synthetically Generated Data from Small Sample Sizes: An Experimental Study, arXiv. https://doi.org/10.48550/arXiv.2211.10760
Morillo Moreno, J. C. (2024). Guías de la BUH: Datos de investigación: Beneficios de la gestión de datos de investigación. https://guiasbuh.uhu.es/datosinvestigacion/beneficios
Sánchez Vásquez, U., Daniel Guerrero, A. B., Méndez Gutiérrez, E., Morales López, S., Tovar Lozano, I. I., Martínez-Rodríguez, M. A., Uribe-Campos, I. E., Sánchez-Vásquez, U., Daniel-Guerrero, A. B., Méndez-Gutiérrez, E., Morales-López, S., Tovar-Lozano, I. I., Martínez-Rodríguez, M. A., & Uribe-Campos, I. E. (2021). Diseño, elaboración y validación de un simulador realista y de bajo costo para exploración cardiaca. Gaceta médica de México, 157(1), 25-29. https://doi.org/10.24875/gmm.20005688
Sengar, S. S., Hasan, A. B., Kumar, S., & Carroll, F. (2024). Generative Artificial Intelligence: A Systematic Review and Applications. arXiv. https://doi.org/10.48550/arXiv.2405.11029
Vélez Torres, Á. (2019). Modelación y simulación basada en agentes en ciencias sociales: Una aproximación al estado del arte. Polis (Santiago), 18(53), 282-308. https://doi.org/10.32735/s0718-6568/2019-n53-1392
Vilches, C. (2024). Biblioguias: Gestión de datos de investigación: Protección de los datos. Gestión de Datos de Investigación. https://biblioguias.cepal.org/c.php?g=495473&p=4398118
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Miguel Ángel Fernández-Marín, Jordy Rafael Montero-Murillo, Débora González-Tolmo

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Los autores que publican en la Revista Mexicana de Investigación e Intervención Educativa (RMIIE), de la Universidad Pablo Latapí Sarre están de acuerdo con los siguientes términos:
1. Derechos de Autor
Los autores conservan los derechos de autor sobre sus trabajos sin restricciones. Los autores otorgan a la revista el derecho de primera publicación. Para ello, ceden a la revista, de forma no exclusiva, los derechos de explotación (reproducción, distribución, comunicación pública y transformación). Los autores pueden establecer otros acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista, siempre que exista un reconocimiento de su publicación inicial en esta revista.
© Los autores.
2. Licencia
Los trabajos se publican en la revista bajo la licencia de Atribución-NoComercial-CompartirIgual 4.0 Internacional de Creative Commons (CC BY-NC-SA 4.0). Los términos se pueden consultar en: https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es
Esta licencia permite:
- Compartir: copiar y redistribuir el material en cualquier medio o formato.
- Adaptar: remezclar, transformar y crear a partir del material.
Bajo los siguientes términos:
- Atribución: ha de reconocer la autoría de manera apropiada, proporcionar un enlace a la licencia e indicar si se ha hecho algún cambio. Puede hacerlo de cualquier manera razonable, pero no de forma tal que sugiera que el licenciador le da soporte o patrocina el uso que se hace.
- NoComercial: no puede utilizar el material para finalidades comerciales.
- CompartirIgual: si remezcla, transforma o crea a partir del material, debe difundir su creación con la misma licencia que la obra original.
No hay restricciones adicionales. No puede aplicar términos legales ni medidas tecnológicas que restrinjan legalmente a otros hacer cualquier cosa que la licencia permita.