Algunas personas se preguntan cómo realizar investigación musical, de qué tipo, por dónde empezar, etc. Muchas de estas preguntas no difieren demasiado si hablamos en términos musicales o no. Por ello, en este post trataremos cómo el significado de los textos, la investigación cualitativa y el enfoque de la teoría fundamentada son epistemológicamente compatibles, o al menos, así lo defienden Yu, Jannasch-Pennell and DiGangi (2011). Se trata de acercarnos a un significado de los textos desde la apertura mental, apartándonos de las ideas preconcebidas, y contrarias a la creencia popular de que la minería de texto (tecnología para la recuperación y organización de la información) es un procedimiento lineal y automatizado. La minería de textos es similar al análisis de contenido -en términos de fiabilidad y validez-, y también pretende extraer temas y puntos en común contando palabras. A pesar de que ambos utilizan algoritmos informáticos, la minería de textos se caracteriza por la capacidad de procesamiento de lenguajes naturales (consistencia y replicabilidad).
La minería de textos y los textos cualitativos, son en principio, muy diferentes en su naturaleza, ya que el primero utiliza algoritmos para el recuento de palabras (método cuantitativo). El método aparentemente cualitativo de recopilación de datos como: la observación, la participación, el análisis de documentos, las entrevistas, etc. no significa necesariamente un estudio cualitativo. Se podría decir que el atributo “cualitativo” no residiría en el método de recoger los datos, sino en el tipo de datos y en el método con el que éstos son analizados. Por ello, un estudio cualitativo no debería convertirse en valores numéricos, y las estadísticas no deberían ser utilizadas en el análisis, sino que los datos se procesan a través de la sistematización, clasificación e interpretación, aunque esto último puede ser cuestionable. Por ejemplo, en la investigación cuantitativa se emplea el “análisis exploratorio” y la “visualización de los datos” para determinar un patrón; se trata de una interpretación de datos cualitativos y de la misma forma sucede a la inversa.
La teoría fundamentada fue desarrollada para explorar los datos desde una mentalidad abierta. Se intenta identificar categorías (que emergen de los datos), conceptos y constructos que expliquen un proceso o una acción. Resulta complicado no dejarse llevar por una idea preconcebida, por muy abierto que uno esté. Como solución, la minería de textos lleva a cabo una codificación utilizando algoritmos automatizados, restringiendo de esta forma al investigador a tomar cualquier decisión prematura, pero el desarrollo de los algoritmos de la minería de textos, necesita algunas ideas preconcebidas sobre el método de clasificación correcta, algo que el usuario del software no tendría por qué conocer.
La codificación, tanto en la minería de textos como en la teoría fundamentada, se sirve de un proceso interactivo; los datos nuevos han de ser comparados de forma constante (reconocimiento de palabras clave y de patrones sin asumir taxonomías preestablecidas), con las categorías anteriores (añadir nuevas…). Éste es un trabajo que, a última instancia, debe realizar en diferentes partes del proceso el investigador (reunir, analizar y categorizar). Las categorías basadas en datos se denominan categorías inferidas, es decir, que emergen de los datos. ¿Pero, cómo podemos realizar esta tarea? El investigador (1) examina todos los datos, (2) realiza una reducción de los datos tratando de responder a las preguntas u objetivos de la investigación, y (3) organiza (temas, patrones con sus conexiones y omisiones). Las citas literales pueden ser utilizadas para apoyar los temas y las interconexiones entre éstos. Se trata de un proceso interactivo de recodificación constante. Una de las cuestiones que más preocupa a la investigación cualitativa sobre la fiabilidad en el análisis de textos, es la replicabilidad. Lo que significa que un resultado convergente puede ser producido a partir de diferentes: codificadores, puntos de tiempo y circunstancias. No se trata únicamente de realizar inferencias (ampliación de la conclusión de un pequeño subconjunto a un conjunto más amplio), pero sí de realizar significados de fiabilidad y validez, p.ej. consistencia interna, estabilidad temporal, forma de equivalencia entre los calificadores de fiabilidad, validez de contenido, de criterio, de constructo…La utilización de la fiabilidad y la validez en la investigación cualitativa es diversa y controvertida, pero no porque en ocasiones no se pueda generalizar (positivista) no significa que estos trabajos estén despojados de valor.
Se debe de tener presente que los puntos de referencia convencionales basados en la fiabilidad y validez no encajan en el supuesto de múltiples realidades construidas en la investigación cualitativa. La fiabilidad en términos cualitativos quizás pudiera estar asociado con la estabilidad de los datos en el tiempo. Algunos investigadores expresan su preocupación con el análisis de datos cualitativos en tanto y cuando éstos no proporcionan conclusiones replicables y generalizables, por lo que se realiza el análisis de concordancia para estimar la fiabilidad. Esto se podría llevar a cabo con diferentes codificadores interpretando los mismos datos, en este sentido, el margen de fiabilidad entre evaluadores y replicabilidad se podría caracterizar por la coherencia y la fiabilidad test-retest. A pesar de todo, un codificador está sujeto a muchos factores incontrolables como la fatiga o los estados emocionales. En este sentido, los algoritmos podrían producir resultados más consistentes y verificables que un codificador humano, aunque según algunos estudios. También existe un alto grado de validez y fiabilidad si comparamos los datos analizados por un investigador a mano y los analizados por la minería de textos.
En resumen, la minería de textos –como herramienta de investigación basada en datos que permite categorizar– comparte el mismo objetivo que ciertos métodos cualitativos como la teoría fundamenta y el análisis de contenido. Y a pesar de que la minería de textos va más allá mediante la interpretación de los contextos de las palabras, esto no significa que sea superior al análisis de contenido.
Para terminar, ¿qué software gratuito conoces para minería de textos que sea óptimo para la investigación musical?
+ Información en: Yu, C. H., Jannasch-Pennell, A., & DiGangi, S. (2011). Compatibility between text mining and qualitative research in the perspectives of grounded theory, content analysis, and reliability. The Qualitative Report, 16(3), 730-744.
Muy interesante. Mi nombre es Fausto Carlos Vázquez. Estudio la Lic. en Educación Artistica
5o semestre.
Muchas gracias Fausto!
Muy útil para revisión literaria de trabajo investigativo.
Muchas gracias René.