
33REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
VERIFICACIÓN DE CALIDAD EN LAS HISTORIAS DE
USUARIO: UN MAPEO SISTEMÁTICO
1 Facultad de Matemáticas, Universidad Autónoma de Yucatán Mérida, Yucatán, México.
RESUMEN
El desarrollo ágil ha consolidado el uso de
historias de usuario como una práctica central
para la recolección de requisitos, lo cual ha
motivado un creciente interés por asegurar su
calidad. El presente artículo reporta un estudio
de mapeo sistemático cuyo objetivo es identificar
los criterios de calidad utilizados en su
verificación, analizando su frecuencia temporal,
distribución geográfica y marcos conceptuales
aplicados. Para la recopilación de estudios se
siguieron metodológicas para el desarrollo de
estudios de mapeo y revisiones sistemáticas. Se
seleccionaron 58 estudios primarios publicados
entre 2004 y 2024. Los marcos INVEST y
QUS son los más referenciados, destacando la
inambigüedad como el criterio más citado, aunque
no el único que debe ser abordado. Además, se
identificó una concentración de investigaciones
en países tecnológicamente desarrollados y un
incremento notable en 2024. El estudio confirma
el crecimiento sostenido del interés académico
en la verificación de la calidad de las historias
de usuario.
Palabras Clave: Criterios de Calidad, Historias
de Usuario, Ingeniería de Software, Mapeo
Sistemático.
Quality Verification in User Stories: A Systematic Mapping
ABSTRACT
Agile development has established user stories
as a fundamental practice for requirements
elicitation, leading to increasing academic
interest in assessing their quality. This paper
presents a systematic mapping study aimed at
identifying the quality criteria applied in user
story verification, examining their temporal
evolution, geographical distribution, and
underlying conceptual frameworks. Established
methodological guidelines for systematic
mapping studies and systematic literature reviews
were followed during the study selection process.
A total of 58 primary studies published between
2004 and 2024 were analyzed. The INVEST and
QUS frameworks emerged as the most frequently
referenced, with unambiguity identified as the
most commonly cited quality criterion, although
it is not the sole aspect that should be considered.
Furthermore, the results reveal a concentration
of research efforts in technologically advanced
countries and a significant increase in publications
in 2024. These findings confirm a sustained
growth in scholarly interest in the verification of
user story quality.
Keywords: Quality Criteria, User Stories,
Software Engineering, Systematic Mapping
Fecha de Recepción: 26/11/2025. Fecha de Aceptación: 02/01/2026. Fecha de Publicación: 28/01/2026.
REVISTA PERSPECTIVAS
VOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
DOI: https://doi.org/10.47187/perspectivas.8.1.251
Leonardo Espinosa Arévalo
Raúl Antonio Aguilar Vera
A24216469@alumnos.uady.mx
avera@correo.uady.mx
Antonio Armando Aguileta Güemez aaguilet@correo.uady.mx
iD
iD
iD

34REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
El desarrollo de software implica un enfoque
sistemático y disciplinado [1]. Esto quiere
decir que los equipos de desarrollo se rigen por
metodologías orientadas a la construcción de
software de alta calidad. El modelo en cascada
es considerado el enfoque clásico dentro del
desarrollo de software [2]. La principal limitación
de modelos como el modelo en cascada y otras
metodologías tradicionales es su baja capacidad
de respuesta ante cambios en los requisitos y en su
implementación. La solución a esta problemática
surgió con el desarrollo ágil de software, cuyo
proceso se basa en la iteración y en las entregas
continuas de valor.
El nacimiento de metodologías ágiles como
SCRUM, Kanban o Extreme Programming
(XP) prioriza aspectos distintos a los modelos
tradicionales, como la iteración y las entregas
continuas, el fortalecimiento de la comunicación
tanto dentro del equipo como con el cliente, y
el mantenimiento de una documentación menos
exhaustiva [3]. Las metodologías ágiles son
marcos de desarrollo que respaldan la filosofía
propuesta en el Manifiesto Ágil [4]. Estas
metodologías incorporan prácticas individuales
que, con el tiempo, han evolucionado: algunas que
en un principio pertenecían a un único modelo se
han convertido en referentes dentro de la filosofía
ágil [5]. Tal es el caso de las Historias de Usuario
(HU).
En las fases iniciales del desarrollo ágil se lleva a
cabo la elicitación de requisitos. Una historia de
usuario (HU) es una representación concisa de
una funcionalidad desde la perspectiva del rol que
la solicita, estructurada y redactada en lenguaje
natural [6]. Las HU se han incorporado de manera
amplia en los flujos de trabajo de diversos marcos
ágiles, convirtiéndose en una práctica que supera
los límites de la metodología en la que surgieron.
Actualmente, constituyen la técnica de elicitación
de requisitos más utilizada en el desarrollo ágil de
software [7].
Las HU cuentan, desde su popularización,
con criterios establecidos para la evaluación
de su calidad. Estos criterios se sintetizaron
I. Introducción en el acrónimo INVEST [6]. Además de estos
lineamientos, conceptos como la ambigüedad y
la coherencia se han incorporado a la discusión
en torno a la validación de la calidad de las HU.
Asimismo, la necesidad de definir métricas y
estándares formales se consolidó en lo que hoy
se conoce como Software Quality Assurance
(SQA), cuyas responsabilidades incluyen la
revisión exhaustiva de los planes de desarrollo
y de los procesos de calidad [8]. La ausencia de
mecanismos claros para abordar errores críticos
o de criterios específicos orientados a las HU
motivó la creación de un marco de calidad
complementario, Quality User Story (QUS) [9];
sin embargo, persiste la necesidad de determinar
si los criterios propuestos son efectivamente los
más adecuados.
El presente mapeo sistemático es un estudio
secundario (ES) que busca identificar las tendencias
de investigación relacionadas con los criterios
empleados para la verificación de la calidad de
las HU. En particular, pretende identificar si los
criterios definidos por los marcos de calidad son
utilizados en la literatura científica. Este análisis
se realiza desde un enfoque cuantitativo.
La siguiente sección ofrece una visión de los
trabajos previos y explica cómo se diferencia del
presente estudio. Posteriormente, la sección 3
presenta una descripción breve de la metodología
para el desarrollo de estudios secundarios utilizada
como referencia. La sección 4 describe las tareas
principales de la fase de planeación, incluyendo
la formulación de preguntas de investigación,
los criterios de selección considerados, la cadena
de búsqueda elaborada y las bases de datos
seleccionadas para la búsqueda automatizada.
La sección 5 resume las actividades realizadas
durante la fase de ejecución y detalla el número
total de estudios primarios seleccionados. En la
sección 6 se describen los resultados obtenidos,
y finalmente, la sección 7 de presentan las
conclusiones generales y las líneas de trabajo
futuro.
Para comprender cómo se ha verificado la
calidad de las historias de usuario (HU)—es
decir, qué criterios se utilizan en su evaluación—

35REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
resulta necesario examinar también los errores
comúnmente asociados a su formulación en esta
práctica de elicitación propia del desarrollo ágil.
Con el propósito de valorar la viabilidad de este
estudio, se decidió analizar trabajos secundarios
previos a fin de identificar hasta dónde se ha
investigado este tema y cuáles son las conclusiones
a las que se ha llegado.
En la literatura científica, algunos estudios se han
enfocado en la problemática de la verificación de
la calidad de las HU, empleando diversos enfoques
y aproximaciones metodológicas:
Un ejemplo es un ES que analiza, con el objetivo
de identificar, categorizar y examinar, la
investigación empírica relacionada con la calidad
de los requisitos en el ámbito de la ingeniería de
software [10]. Si bien no aborda explícitamente
las HU (una forma de elicitación de requisitos
funcionales), sí examina aspectos afines, como el
estudio de los requisitos funcionales y la búsqueda
de soluciones a problemas recurrentes, entre
ellos la falta de estandarización y la presencia
de errores frecuentes como la ambigüedad o la
incompletitud.
Otro estudio secundario relevante es el presentado
en [11], el cual se centra en investigaciones
específicamente relacionadas con las HU. Si
bien proporciona una visión clara del incremento
reciente de la investigación en este ámbito, su
alcance permanece en un nivel descriptivo y
no profundiza en aspectos específicos de los
procesos de verificación o revisión de las HU. En
consecuencia, su contenido se limita a responder
preguntas generales, tales como: “¿Qué áreas de
investigación relacionadas con las historias de
usuario existen?”, “¿Qué tipos de problemas se
han identificado?” y “¿Qué tipos de resultados se
han reportado?”, entre otras orientadas al tipo de
investigación.
Dentro de los estudios secundarios relacionados
con las HU y su calidad, se encuentra también el
estudio Ambiguity in User Stories: A Systematic
Literature Review [12], que puede considerarse
una continuación del trabajo previo desarrollado
por Amna y Poels. Este estudio se centra en un
problema recurrente en las HU: la ambigüedad.
Sin embargo, este no es el único error que puede
surgir durante la formulación de las HU, aunque sí
constituye un hallazgo recurrente en los estudios
secundarios existentes.
El último elemento que motiva este trabajo es
el ES presentado en [13], el cual recopila, hasta
2023, los enfoques existentes sobre la calidad de
las HU. Este estudio identifica diversos métodos,
técnicas y tecnologías, y destaca la ambigüedad
como uno de los principales factores de riesgo en
la formulación de las HU.
En conjunto, estos estudios secundarios
contribuyen a acotar el campo de investigación
y proporcionan respuestas específicas a diversas
preguntas relevantes. Asimismo, permiten
identificar las bases de datos (BD) empleadas
en cada uno de ellos, entre las que se incluyen
Scopus, ScienceDirect, SpringerLink, IEEE
Xplore, ACM Digital Library y Google Scholar.
El presente trabajo propone un nuevo ES
motivado por la necesidad de identificar los
criterios de calidad empleados en la investigación
para evaluar las HU, así como comprender su
relación con los errores más comunes reportados
a lo largo de su desarrollo y uso. A diferencia de
revisiones previas, este trabajo adopta un enfoque
más amplio, evitando concentrarse únicamente
en la ambigüedad como problema central [12].
La intención es ofrecer un panorama actualizado
sobre los criterios de calidad y las tendencias de
investigación, desde la concepción de las HU
hasta los avances más recientes en sus técnicas
de verificación. Como objetivo adicional, se busca
analizar la evolución temporal de las publicaciones
y los países en los que se concentran dichas
investigaciones.
Finalmente, este mapeo se justifica también por
la necesidad de ampliar los rangos temporales
considerados: aunque varias de las revisiones
existentes son relativamente recientes, la
mayoría no incorpora el periodo posterior a la
década de 2020, caracterizada por una acelerada
transformación digital y avances significativos
en inteligencia artificial. En este contexto, resulta

36REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
pertinente identificar qué criterios de calidad
han cobrado mayor relevancia en la literatura
contemporánea.
El desarrollo del presente mapeo sistemático
se basa en el marco metodológico propuesto en
[14] y actualizado en [15]. Para la conducción
de la investigación y la presentación del estudio,
y considerando que un mapeo sistemático puede
funcionar como un complemento de una revisión
sistemática, se siguieron los pasos establecidos
por Kitchenham [16]. El trabajo se estructuró en
tres fases principales: una fase de planeación,
una fase de ejecución de lo establecido y una fase
final dedicada al reporte de los resultados y a la
descripción de los hallazgos. En este estudio se
amplía particularmente el contenido de la fase de
reporte, la cual se integrará con mayor detalle en
una versión extendida futura del mapeo.
A. Planeación
Esta fase comprende varias actividades, entre
las que se encuentran: (i) la definición de las
preguntas de investigación, basadas en el
enfoque PICOC [15] e informadas por vacíos
identificados en estudios previos; (ii) la selección
de las bases de datos (BD) pertinentes al dominio
de la ingeniería de software (IS); (iii) la definición
de la cadena de búsqueda; y (iv) la formulación
de los criterios empleados para incluir o excluir
trabajos de investigación. A continuación, se
describen los detalles de cada una de estas
actividades.
1. Preguntas de investigación
El tema del presente ES se sitúa en la elicitación
de requisitos dentro de las metodologías ágiles,
con énfasis en las HU como mecanismo para la
captura de requisitos funcionales. El estudio busca
determinar los criterios de calidad empleados en
la literatura y analizar cómo se verifican, así como
examinar la distribución temporal y geográfica de
las aportaciones científicas en este campo. Con
este fin, se formularon las siguientes preguntas de
investigación:
II. Metodología
• PI1. ¿Cuál es la distribución en el tiempo
de las investigaciones publicadas sobre
verificación de calidad de historias de
usuario?
• PI2. ¿Cuáles son los países que tienen
investigación sobre verificación de la calidad
de historias de usuario?
• PI3. ¿Cuáles son los criterios de calidad
reportados en la verificación de historias de
usuario?
Las dos primeras preguntas de investigación se
orientan a analizar la distribución temporal y
geográfica de la investigación sobre las HU, con el
fin de identificar tendencias a lo largo del tiempo y
determinar los países en los que se concentra esta
línea de estudio. En este trabajo, la verificación
se entiende como el proceso de evaluar si las HU
cumplen con criterios de calidad establecidos.
En relación con los criterios de calidad, se
propone clasificarlos según los modelos y
estándares existentes, y analizar de manera
individual los atributos de calidad para examinar
la distribución de criterios fuera de los marcos
formales y determinar cuáles se emplean con
mayor frecuencia en la literatura reciente.
El enfoque PICOC orientó la formulación de las
preguntas de investigación, así como el diseño
de la cadena de búsqueda y de los criterios de
inclusión y exclusión. En particular, para delimitar
el alcance temático del estudio se emplearon las
dimensiones P (Population), en este caso las
historias de usuario; e I (Intervention), procesos y
herramientas de verificación.
2. Bases de datos
Para llevar a cabo un estudio secundario completo
en el ámbito de la Ingeniería de Software (IS), resulta
fundamental seleccionar fuentes de información
que aseguren la disponibilidad de investigaciones
pertinentes. En consecuencia, se eligieron BD
bibliográficas como IEEE Xplore, ACM Digital
Library, SpringerLink y ScienceDirect, debido a
su reconocida producción científica en el campo
de las ciencias de la computación. Asimismo, se
incorporó el uso complementario del repositorio

37REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
Google Scholar, el cual permite recuperar trabajos
que, aun cuando no se encuentren indexados en las
bases de datos anteriores, conservan la relevancia
científica requerida. Estas bases y repositorio
fueron seleccionados por su uso recurrente en
estudios secundarios previos en áreas relacionadas
con la computación y la ingeniería de software,
tal como se ha documentado en trabajos previos
[11,12].
Estas BD contienen artículos revisados por pares,
actas de congresos y revistas especializadas que
abarcan áreas fundamentales de la IS, desde
metodologías de desarrollo hasta tecnologías
emergentes. Tal es el caso de IEEE Xplore,
plataforma que desde hace décadas alberga e
indexa una amplia variedad de investigaciones
en ingeniería de software, incluidos documentos
normativos ampliamente citados, como el IEEE
Standard Glossary of Software Engineering
Terminology (1990) y el estándar IEEE 830-
1998. De manera similar, ACM Digital Library
reúne conferencias y artículos publicados en
revistas de referencia en el área, entre ellas
Foundations of Software Engineering (FSE).
Algo comparable ocurre con SpringerLink,
plataforma de Springer Nature que publica
libros, volúmenes de conferencias y revistas
especializadas en ingeniería de software,
inteligencia artificial aplicada al desarrollo de
software y metodologías de verificación, como
Software Quality Journal. Adicionalmente,
se integró Google Scholar como repositorio
complementario con el fin de ampliar el
alcance de la búsqueda mediante la indexación
de literatura proveniente de diversas fuentes
académicas y el uso de herramientas avanzadas
para el filtrado de información.
3. Cadena de búsqueda
La cadena de búsqueda genérica utilizada para
la identificación de los estudios primarios fue la
siguiente:
("User Story" OR "User Stories") AND ("Agile"
OR "Scrum" OR "Extreme Programming" OR
"XP") AND ("Validation" OR "Verification" OR
"Quality Assurance" OR "Evaluation").
Las HU constituyen el primer bloque de la
cadena, dado que su presencia explícita en los
estudios recuperados es un requisito fundamental.
No obstante, el término HU puede presentar
ambigüedades, ya que, pese a referirse a una
práctica ampliamente reconocida dentro de las
metodologías ágiles, también puede arrojar
resultados ajenos al ámbito de la IS. El segundo
bloque delimita el alcance temático hacia los marcos
de desarrollo ágil, incorporando metodologías
ampliamente implementadas y, adicionalmente,
el término “Agile” con el propósito de identificar
trabajos que no se encuentren asociados a los
marcos más conocidos. El tercer bloque integra
los conceptos vinculados con la verificación y la
calidad de las HU. Es importante señalar que la
cadena de búsqueda se configuró de acuerdo con
la sintaxis requerida en cada una de las fuentes de
información consultadas.
4. Criterios de inclusión y exclusión
Los criterios de inclusión (CI) y exclusión (CE)
establecen las condiciones que determinan
qué trabajos serán considerados en el análisis,
asegurando su alineación con los objetivos de la
investigación. En este estudio, dichos criterios se
diseñaron para identificar trabajos relevantes en la
verificación de la calidad de las HU, atendiendo
a aspectos como el periodo de publicación, la
pertinencia temática y el tipo de estudio. De
este modo, se conforma un corpus de estudios
representativo, a la vez que se excluyen aquellos
trabajos cuya falta de relación temática podría
afectar la validez de los resultados. Se definieron
cuatro criterios de inclusión y dos criterios de
exclusión:
• CI1. Ventana de tiempo de 2004 a 2024: Este
intervalo se seleccionó tomando como punto
de partida el año 2004, correspondiente a la
publicación del primer libro que aborda de
manera sistemática las historias de usuario
[6].
• CI2. Textos en inglés: Se seleccionaron
únicamente estudios escritos en inglés con
el fin de evitar ambigüedades derivadas del
proceso de traducción.
• CI3. Relevancia respecto a las preguntas de
investigación: Se consideraron únicamente

38REVISTA PERSPECTIVASVOL. 8, N˚1 / ENERO - JUNIO 2026 / e-ISSN: 266-6688
Fig. 1: Resumen del proceso de selección (diseño de los autores).
1. Ejecución de la cadena de búsqueda
La cadena de búsqueda se aplicó en las distintas
BD y en el repositorio correspondiente, de acuerdo
con la sintaxis y reglas de búsqueda establecidas
por cada plataforma, los resultados se muestran en
la Tabla I.
Dentro de la ejecución y configuración de la
cadena de búsqueda, tres de las bases de datos
utilizaron exactamente la misma configuración.
2. Ejecución de criterios de inclusión y exclusión
Para cumplir los criterios de inclusión, algunas
bases de datos ofrecieron diversos filtros. Sin
embargo, para el criterio CI3 fue necesario
realizar una lectura breve de los resúmenes y, en
caso de duda, una primera revisión de los trabajos
completos. En cuanto a los criterios de exclusión,
se requirió una lectura detallada de los artículos
para identificar si se trataban de algún duplicado o
de una versión más extensa de otro.
Finalmente, se obtuvieron un total de 109 trabajos
al aplicar únicamente los criterios de inclusión y
58 trabajos en total una vez aplicados todos los
criterios (ver Fig. 1).
Tabla. I. C onfiguraCión de la Cadena de búsqueda en las distintas
bases de datos .
Bases de datos Cadena de búsqueda
IEEE Xplorer, ACM
Digital Library y
SpringerLink
(“User story” OR “User stories”) AND
("Agile" OR "Scrum" OR "Extreme
programming" OR "XP") AND (“Vali-
dation” OR “Verification” OR “Quality
Assurance” OR "Evaluation")
aquellos estudios que contribuyan
directamente a responder las preguntas de
investigación planteadas.
• CI4. Artículos provenientes de revistas de
Investigación y Memorias de Conferencia.
• CE1. Artículos duplicados: Al existir un
repositorio, pueden encontrarse artículos que
también están en la base de datos específica.
• CE2. Resultados parciales o versiones
preliminares: Se excluyen las versiones
preliminares o parciales de un mismo estudio
que presenten resultados no definitivos. En
aquellos casos en los que un conjunto de autores
haya publicado inicialmente un artículo con
resultados parciales y, posteriormente, una
versión más completa con análisis finales y
conclusiones consolidadas, se seleccionará
únicamente la versión final.
Estos criterios permiten seleccionar los estudios
que abordan de manera directa las historias
de usuario (la población) en el contexto de las
metodologías ágiles, garantizando que el corpus
resultante sea pertinente para los objetivos de la
investigación. Asimismo, se excluyen aquellos
trabajos cuya falta de relevancia o adecuación
metodológica podría introducir sesgos o afectar
la validez de los resultados que se obtengan del
corpus.
B. Ejecución
El siguiente paso comprende la ejecución de la
cadena de búsqueda en las distintas BD y en el
repositorio consultado, seguida de la selección de
los estudios primarios conforme a los criterios de
inclusión y exclusión establecidos. Posteriormente,
se realiza la evaluación de su relevancia para la
investigación y, finalmente, el análisis y la síntesis
de los estudios.
ScienceDirect
(“User story” OR “User stories”) AND
("Agile" OR "Scrum" OR "XP") AND
(“Validation” OR “Verification” OR
“Quality Assurance” OR "Evaluation")
Google Scholar
(“User story” OR “User stories”)
("Agile" OR "Scrum" OR "Extreme
programming" OR "XP") (“Validation”
OR “Verification” OR “Quality Assu-
rance” OR "Evaluation")