
ISBN
Formato impreso
979-13-88142-59-8
Fecha de publicación
13-03-2026
Licencia
D. R. © copyright 2026. Karla Karina Ruiz Mendoza.
Todos los contenidos de esta obra se comparten bajo la licencia Creative Commons Atri-bución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0). Esto implica que no está autorizado el uso comercial de la obra original ni de las eventuales obras derivadas, las cuales deberán distribuirse bajo la misma licencia que rige la obra original. No obstante, se permite a terceros compartir el contenido siempre y cuando se reconozca debidamente la autoría y la publicación original en esta editorial.

Karla Karina Ruiz Mendoza
Universidad Autónoma de Baja California
0000-0001-8978-8364
Acerca de
Este libro-guía presenta una ruta de trabajo para aplicar el Enfoque Basado en Argumentos (EBA) en el proceso de validación de un Examen de Alto Impacto. Se parte de la idea de que la validez se sostiene en la interpretación y el uso de los puntajes, y no en el instrumento en sí mismo. Como caso ilustrativo, se revisa el Examen de Ingreso a la Educación Superior (ExIES), con énfasis en la aplicación 2023‑2 de la Universidad Autónoma de Baja California (UABC). En esta ruta se recupera y organiza la documentación técnica (especificaciones, manuales y reportes psicométricos), normas institucionales y evidencias cuantitativas; lo cual permite la redacción del Argumento de Interpretación y Uso (AIU), para después evaluar el Argumento de Validez como sus siete inferencias encadenadas, desde Definición de Dominio hasta Utilización e Implicación de Consecuencias que parte de la teoría del proceso de validación, según el EBA, desde Michael Kane y Carol Chapelle.
Referencias
Abu Dabrh, A. M., Waller, T. A., Bonacci, R. P., Nawaz, A. J., Keith, J. J., Agarwal, A., … Angstman, K. B. (2020). Professionalism and inter-communication skills (ICS): A multi-site validity study assessing proficiency in core competencies and milestones in medical learners. BMC Medical Education, 20(1), Article 2290. https://doi.org/10.1186/s12909-020-02290-3
ACT, Inc. (2023). ACT national profile report: Graduating class of 2023. ACT, Inc.
ACT, Inc. (2024). ACT technical manual 2024. ACT, Inc.
American Educational Research Association [AERA], & National Council on Measurement in Education [NCME]. (1955). Technical recommendations for achievement tests. Autor.
American Educational Research Association [AERA], American Psychological Association [APA], & National Council on Measurement in Education [NCME]. (1999). Standards for educational and psychological testing. American Educational Research Association.
American Educational Research Association [AERA], American Psychological Association [APA], & National Council on Measurement in Education [NCME]. (2014). Standards for educational and psychological testing. American Educational Research Association.
American Psychological Association [APA]. (1954). Technical recommendations for psychological tests and diagnostic techniques. Autor.
Andersen, N. B., O’Neill, L., Gormsen, L. K., Hvidberg, L., & Morcke, A. M. (2014). A validation study of the psychometric properties of the Groningen Reflection Ability Scale. BMC Medical Education, 14(1), Article 214. https://doi.org/10.1186/1472-6920-14-214
Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). Taxonomía del aprendizaje, la enseñanza y la evaluación: La revisión de los objetivos de la educación de Bloom (Edición en español). Pearson Educación.
Asociación Nacional de Universidades e Instituciones de Educación Superior [ANUIES]. (2024). Anuario estadístico de la población escolar en educación superior 2023–2024 (Versión 1.2, última actualización: 26 de septiembre de 2024). https://www.anuies.mx/informacion-y-servicios/informacion-estadistica-de-educacion-superior/anuario-estadistico-de-educacion-superior
Aviad-Levitzky, T., Laufer, B., & Goldstein, Z. (2019). The new Computer Adaptive Test of Size and Strength (CATSS): Development and validation. Language Assessment Quarterly, 16(4), 418–437. https://doi.org/10.1080/15434303.2019.1649409
Bachman, L. F., & Palmer, A. S. (2010). Language assessment in practice: Developing language assessments and justifying their use in the real world. Oxford University Press.
Bennett, R. E. (2015). The changing nature of educational assessment. Review of Research in Education, 39(1), 370–407. https://doi.org/10.3102/0091732X14554179
Bloom, B. S., Engelhart, M. D., Furst, E. J., Hill, W. H., & Krathwohl, D. R. (1956). Taxonomy of educational objectives: The classification of educational goals. Handbook I: Cognitive domain. David McKay Company.
Bond, T., & Fox, C. M (2015). Applying the Rasch model: Fundamental measurement in the human sciences (3rd ed.). Routledge.
Borsboom, D., Cramer, A. O. J., Kievit, R. A., Zand Scholten, A., & Franic, S. (2009). The end of construct validity. In R. W. Lissitz (Ed.), The concept of validity: Revisions, new directions, and applications (pp. 135–170). Information Age Publishing.
Borsboom, D., Mellenbergh, G. J., & van Heerden, J. (2004). The Concept of Validity. Psychological Review, 111(4), 1061–1071. https://doi.org/10.1037/0033-295X.111.4.1061
Breiman, L. (2001). Statistical modeling: The two cultures. Statistical Science, 16(3), 199–231. https://doi.org/10.1214/ss/1009213726
Brennan, R. L. (2006). Generalizability theory. In R. L. Brennan (Ed.), Educational Measurement (4th ed., pp. 203–234). Praeger.
Brijmohan, A., Khan, G. A., Orpwood, G., Sandford Brown, E., & Childs, R. A. (2018). Collaboration between content experts and assessment specialists: Using a validity argument framework to develop a college mathematics assessment. Canadian Journal of Education, 41(2), 584–600. https://journals.sfu.ca/cje/index.php/cje-rce/article/view/3239
Brookhart, S. M. (2013). How to create and use rubrics for formative assessment and grading. ASCD.
Burkov, A. (2019). The hundred-page machine learning book. Andriy Burkov.
Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait–multimethod matrix. Psychological Bulletin, 56(2), 81–105. https://doi.org/10.1037/h0046016
Carrillo-Ávalos, B. A., Leenen, I., Trejo-Mejía, J. A., & Sánchez-Mendiola, M. (2024). Evidencias de validez del proceso de admisión a una escuela de medicina en México. Investigación en Educación Médica, 13(50), 37–55. https://doi.org/10.22201/fm.20075057e.2024.50.23546
Caso, J., & Díaz, C. D. (2016). Guía para la Evaluación de Ítems del Nuevo Examen de Selección de aspirantes a ingresar a la Universidad Autónoma de Baja. Instituto de Investigación y Desarrollo Educativo-Universidad Autónoma de Baja California.
Caso, J., Díaz, C. D., Castro-Morera, M., & Martínez-Arias, M. R. (2017). Manual técnico del Examen de Ingreso a la Educación Superior (ExIES). Universidad Autónoma de Baja California.
Ceneval. (2022). Informe anual de resultados 2021. Centro Nacional de Evaluación para la Educación Superior. https://ceneval.edu.mx/wp-content/uploads/2022/06/Ceneval-Informe-Anual-de-Resultados-2021.pdf
Chapelle, C. A. (2021). Argument-based validation in testing and assessment. SAGE. https://doi.org/10.4135/9781071878811
Choi, Y. (2021). What interpretations can we make from scores on graphic-prompt writing (GPW) tasks? An argument-based approach to test validation. Assessing Writing, 48, Article 100523. https://doi.org/10.1016/j.asw.2021.100523
Choi, Y. (2022). Validity of score interpretations on an online English placement writing test. Language Testing in Asia, 12(42). https://doi.org/10.1186/s40468-022-00187-0
College Board. (2023a). SAT Suite of Assessments Annual Report 2023. https://reports.collegeboard.org
Cook, D. A., Brydges, R., Ginsburg, S., & Hatala, R. (2015). A contemporary approach to validity arguments: A practical guide to Kane’s framework. Medical Education, 49(6), 560–575. https://doi.org/10.1111/medu.12678
Crocker, L., & Algina, J. (2008). Introduction to classical and modern test theory. Cengage Learning.
Cronbach, L. J. (1971). Test validation. En R. L. Thorndike (Ed.), Educational measurement (2nd ed., pp. 443–507). American Council on Education.
Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52(4), 281–302. https://doi.org/10.1037/h0040957
Cronbach, L. J., Gleser, G. C., Nanda, H., & Rajaratnam, N. (1972). The dependability of behavioral measurements: Theory of generalizability for scores and profiles. John Wiley.
Cronbach, L. J., Shavelson, R. J., & Webb, N. M. (2004). Generalizability theory: 1973–2003. Educational and Psychological Measurement, 64(3), 391–418. https://doi.org/10.1177/0013164404264844
Cureton, E. E. (1951). Validity. En E. F. Lindquist (Ed.), Educational measurement (pp. 621–694). American Council on Education.
Durson, A., & Li, Z. (2021). A systematic review of argument-based validation studies in the field of language testing (2000–2018). En C. A. Chapelle & E. Voss (Eds.), Validity argument in language testing (pp. 45–70). Cambridge University Press. https://doi.org/10.1017/9781108669849.005
Dursun, A., & Li, Z. (2021). A systematic review of argument-based validation studies in the field of language testing (2000–2018). En C. A. Chapelle & E. Voss (Eds.), Validity argument in language testing (pp. 45–70). Cambridge University Press. https://doi.org/10.1017/9781108669849.005
Eignor, D. R. (2013). The standards for educational and psychological testing. En K. F. Geisinger, B. A. Bracken, J. F. Carlson, J.-I. C. Hansen, N. R. Kuncel, S. P. Reise, & M. C. Rodriguez (Eds.), APA handbook of testing and assessment in psychology, Vol. 1: Test theory and testing and assessment in industrial and organizational psychology (pp. 245–250). American Psychological Association. https://doi.org/10.1037/14047-013
Fechter, T., Dai, T., Cromley, J. G., Nelson, F. E., Van Boekel, M., & Du, Y. (2021). Developing a validity argument for an inference-making and reasoning measure for use in higher education. Frontiers in Education, 6, Article 727539. https://doi.org/10.3389/feduc.2021.727539
French, M., Juárez, C., & Stone, A. (2024). The role of high-stakes testing in higher education admissions: Global perspectives. Journal of Educational Assessment, 22(1), 45–63. https://doi.org/10.1007/s10734-023-01148-z
García, A. M., Martínez, F., & Cordero, G. (2016). Análisis del funcionamiento diferencial de los ítems del Excale de Matemáticas para tercero de secundaria. Investigación, 21(71), 1191–1210.
García, A., Martínez, F., Cordero, G. y Caso, J. (2017). Evolución del concepto de validez en la medición educativa. En E. Luna y G. Cordero (Coords.), Contribuciones a la evaluación educativa desde la formación doctoral (pp. 15-46). Guadalajara: UdeG/UABC.
García, M. (2016). Evidencias de validez predictiva en exámenes de ingreso a la educación superior: Comparación entre PAA y EXANI II. Revista Latinoamericana de Medición y Evaluación Educativa, 11(2), 15–29.
Géron, A. (2019). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. O’Reilly Media.
Gotch, C. M., & French, B. F. (2020). A validation trajectory for the Washington Assessment of Risks and Needs of Students. Educational Assessment, 25(1), 65–82. https://doi.org/10.1080/10627197.2019.1702462
Gutiérrez, M. J. (2024). Uma breve história dos testes de alto impacto e seus possíveis futuros. Estudos em Avaliação Educacional, 35, e11050. https://doi.org/10.18222/eae.v35.11050
Guyatt, G., Oxman, A. D., Akl, E. A., Kunz, R., Vist, G., Brozek, J., Norris, S., Falck-Ytter, Y., Glasziou, P., DeBeer, H., Jaeschke, R., Rind, D., Meerpohl, J., Dahm, P., & Schünemann, H. J. (2011). GRADE guidelines: 1. Introduction-GRADE evidence profiles and summary of findings tables. Journal of Clinical Epidemiology, 64(4), 383–394. https://doi.org/10.1016/j.jclinepi.2010.04.026
Haladyna, T. M., & Rodriguez, M. C. (2013). Developing and validating test items (3rd ed.). Routledge.
Hambleton, R. K., & Zenisky, A. L. (2011). Translating and adapting tests for cross-cultural assessments. En D. Matsumoto & F. J. R. van de Vijver (Eds.), Cross-cultural research methods in psychology (pp. 46–74). Cambridge University Press.
Hastie, T., Tibshirani, R., & Friedman, J. (2009). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). Springer. https://doi.org/10.1007/978-0-387-84858-7
Hatala, R., Gutman, J., Lineberry, M., et al. (2019). How well is each learner learning? Validity investigation of a learning curve-based assessment approach for ECG interpretation. Advances in Health Sciences Education, 24(1), 45–63. https://doi.org/10.1007/s10459-018-9846-x
Holland, P. W., & Thayer, D. T. (1988). Differential item performance and the Mantel-Haenszel procedure. In H. Wainer & H. I. Braun (Eds.), Test Validity (pp. 129–145). Lawrence Erlbaum Associates.
House, E. R. (1980). Evaluating with validity. SAGE.
Hu, L.-t., & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(1), 1–55. https://doi.org/10.1080/10705519909540118
ICFES. (2024a). Informe nacional de resultados del examen Saber 11º – 2022. Instituto Colombiano para la Evaluación de la Educación. https://icfes.gov.co
ICFES. (2024b, noviembre). ¿Qué se entiende por confiabilidad y validez en el contexto de la medición con instrumentos? Boletín Saber al Detalle, Edición 16, 1–11. https://icfes.gov.co
Ihlenfeldt, S. D., & Rios, J. A. (2023). A meta-analysis on the predictive validity of English language proficiency assessments for college admissions. Language Testing, 40(2), 276–299. https://doi.org/10.1177/02655322221112364
Jones, M. G., & Ennes, M. (2018). High-stakes testing. En Oxford Bibliographies. https://doi.org/10.1093/obo/9780199756810-0200
Jornet, J., González-Such, J., & Suárez, J. M. (2010). Validación de los procesos de determinación de estándares de interpretación para pruebas de rendimiento educativo. Estudios Sobre Educación, 19, 11–29. https://doi.org/10.15581/004.19.4578
Kane, M. (2006). Content-related validity evidence in test development. En S. M. Downing & T. M. Haladyna (Eds.), Handbook of test development (pp. 131–153). Lawrence Erlbaum Associates Publishers.
Kane, M. (2011). Validating score interpretations and uses. Language Testing, 29(1), 3–17. https://doi.org/10.1177/0265532211417210
Kane, M. (2013). Validating the interpretations and uses of test scores. Journal of Educational Measurement, 50(1), 1–73. https://doi.org/10.1111/jedm.12000
Kane, M. (2015). Explicating validity. Assessment in Education: Principles, Policy & Practice, 23(2), 198–211. https://doi.org/10.1080/0969594X.2015.1060192
Kane, M. (2016). Validation strategies: Delineating and validating proposed interpretations and uses of test scores. En S. Lane, M. R. Raymond & T. M. Haladyna (Eds.), Handbook of test development (2ª ed., pp. 64–80). Routledge.
Kane, M. (2020). Validity studies commentary. Educational Assessment, 25(1), 83–89. https://doi.org/10.1080/10627197.2019.1702465
Kane, M. T. (1990). An argument-based approach to validation (ACT Research Report Series, Report No. ACT-RR-90-13). American College Testing Program. https://eric.ed.gov/?id=ED336428
Kane, M. T. (1992). An argument-based approach to validity. Psychological Bulletin, 112(3), 527–535. https://doi.org/10.1037/0033-2909.112.3.527
Kane, M., & Bridgeman, B. (2021). The evolution of the concept of validity. En B. E. Clauser & M. B. Bunch (Eds.), The history of educational measurement: Key advancements in theory, policy, and practice (1.ª ed., pp. 174–195). Routledge. https://doi.org/10.4324/9780367815318
Koizumi, R., In’nami, Y., Asano, K., & Agawa, T. (2016). Validity evidence of Criterion® for assessing L2 writing proficiency in a Japanese university context. Language Testing in Asia, 6, Article 5. https://doi.org/10.1186/s40468-016-0027-7
Kolen, M. J., & Brennan, R. L. (2014). Test equating, scaling, and linking: Methods and practices (3ª ed.). Springer.
Koselleck, R. (2000). Los estratos del tiempo: Estudios sobre la historia. Paidós Ibérica.
Kuh, G. D., Cruce, T. M., Shoup, R., Kinzie, J., & Gonyea, R. M. (2008). Unmasking the effects of student engagement on college grades and persistence. The Journal of Higher Education, 79(5), 540–563. https://doi.org/10.1080/00221546.2008.11772116
Lane, S., Raymond, R., & Haladyna, T. (2016). Validation of score meaning for the next generation of assessments. Routledge.
Lavery, M., Bostic, J., Kruse, L., Krupa, E., & Carney, M. (2020). Argumentation surrounding argument‐based validation: A systematic review of validation methodology in peer‐reviewed articles. Educational Measurement: Issues and Practice, 40(1), 22–33. https://doi.org/10.1111/emip.12378
Lawshe, C. H. (1975). A quantitative approach to content validity. Personnel Psychology, 28(4), 563–575. https://doi.org/10.1111/j.1744-6570.1975.tb01393.x
Lee, E. (2020). Evaluating test consequences based on ESL students’ perceptions: An appraisal analysis. Studies in Applied Linguistics & TESOL, 20(1), 1–22. https://doi.org/10.7916/salt.v20i1.3394
Lewin, S., Booth, A., Glenton, C., Munthe-Kaas, H., Rashidian, A., Wainwright, M., … Noyes, J. (2018). Applying GRADE-CERQual to qualitative evidence synthesis findings: Introduction to the series. Implementation Science, 13(Suppl 1), 2. https://doi.org/10.1186/s13012-017-0688-3
Li, S. (2018). Developing a test of L2 Chinese pragmatic comprehension ability. Language Testing in Asia, 8, (3). https://doi.org/10.1186/s40468-018-0054-7
Lissitz, R. (2009) The Concept of Validity. Revisions, New Directions, and Applications. Charlotte, NC: Information Age Publishing, Inc. 263 pages. ISBN 978-1-60752-227-0
Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental tests scores. Reading, MA: Addison-Wesley.
Lynn, M. R. (1986). Determination and quantification of content validity. Nursing Research, 35(6), 382–385.
Magis, D., Béland, S., Tuerlinckx, F., & De Boeck, P. (2010). A general framework and an R package for the detection of dichotomous differential item functioning. Behavior Research Methods, 42(3), 847–862. https://doi.org/10.3758/BRM.42.3.847
Marcinek, T., Jakobsen, A., & Partová, E. (2023). Using MKT measures for cross-national comparisons of teacher knowledge: Case of Slovakia and Norway. Journal of Mathematics Teacher Education, 26(3), 303–333. https://doi.org/10.1007/s10857-021-09530-3
Marini, J. P., Westrick, P. A., Young, L., Ng, H., & Shaw, E. J. (2023, abril). Digital SAT® pilot predictive validity study – A first look. College Board.
Markus, K. A., & Borsboom, D. (2013). Frontiers of test validity theory: Measurement, causation, and meaning. Routledge.
Mattos, P., Stieg, R., Barcelos, M., & Santos, W. dos. (2024). Evaluaciones nacionales a gran escala y acceso a la educación superior: perspectivas en países de América y Europa. Contextos: Estudios de Humanidades y Ciencias Sociales, 54, 1–25. https://revistas.umce.cl/index.php/contextos/article/view/2660
Mendoza, A., & Knoch, U. (2018). Examining the validity of an analytic rating scale for a Spanish test for academic purposes using the argument-based approach to validation. Assessing Writing, 35, 41–55. https://doi.org/10.1016/j.asw.2017.12.003
Messick, S. (1989). Validity. En R. L. Linn (Ed.), Educational measurement (3ª ed., pp. 13–103). Macmillan.
Miller, M. D., Linn, R. L., & Gronlund, N. E. (2009). Measurement and Assessment in Teaching (10ª ed.). Pearson Education.
Mislevy, R., Steinberg, L., & Almond, R. (2003). On the structure of educational assessments. Measurement: interdisciplinary Research and Perspectives, 1, 3-62.
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to linear regression analysis (5ª ed.). Wiley. https://doi.org/10.1002/9781118532843
Morales, R., Barrera, A., & Garnett, E. (2015). Validez predictiva y concurrente del EXANI-II en la Universidad Autónoma del Estado de México. En Memorias del X Congreso Nacional de Investigación Educativa: Sujetos de la educación. Consejo Mexicano de Investigación Educativa (COMIE). https://www.comie.org.mx/congreso/memoriaelectronica/v10/pdf/area_tematica_16/ponencias/0701-F.pdf
Newton, P., & Shaw, S. (2014). Validity in educational & psychological assessment. SAGE.
Nunnally, J. C. (1978). Psychometric theory (2nd ed.). McGraw-Hill.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3.a ed.). McGraw-Hill.
Pedroza Zúñiga, L. H. & Gómez Monárrez, C. (2025a). Informe particular ExIES vs EXANI vs Promedio [Manuscrito no publicado].
Pedroza Zúñiga, L. H. & Gómez Monárrez, C. (2025b). Informe general ExIES vs EXANI vs Promedio [Manuscrito no publicado].
Pedroza Zúñiga, L. H. & Gómez Monárrez, C. (2025c). Funcionamiento Diferencial del ítem (DIF): Examen de Ingreso a la Educación Superior (ExIES) 2023-2 [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., & Gutiérrez Zavala, A. P. (2023n). Especificaciones de Lectura. [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., & Ruiz Mendoza, K. K. (2023o). Especificaciones de Lengua Escrita. [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023a). Manual para el desarrollo de reactivos: Lectura [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023b). Manual para el desarrollo de reactivos: Lengua Escrita [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023c). Manual para el desarrollo de reactivos: Matemáticas [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023d). Manual para el jueceo de reactivos: Lectura [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023e). Manual para el jueceo de reactivos: Lengua escrita [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023f). Manual para el jueceo de reactivos: Matemáticas [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023h). Presentación de las capacitaciones para el desarrollo de ítems ExIES [Diapositivas no publicadas].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023i). Manual del aplicador del ExIES [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023j). Manual del supervisor del ExIES [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023k). Presentación de capacitación para aplicadores y supervisores del ExIES [Diapositivas no publicadas].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023l). Guía del sustentante del ExIES [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Gómez Monárrez, C., Orozco Vergara, M. A., Ruiz Mendoza, K. K., & Gutiérrez Zavala, A. P. (2023m). Protocolos para incidencias en caso de siniestro o emergencia durante la aplicación del ExIES [Manuscrito no publicado].
Pedroza Zúñiga, L. H., García Aldaco, S. A., Orozco Vergara, M. A. & Gómez Monárrez, C., Verdugo Olachea, J. (2023p). Especificaciones de Matemáticas. [Manuscrito no publicado].
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. & Solís del Moral, S. S. (2024a). Examen de ingreso a la educación superior (ExIES) 2023-1: Reporte técnico. Instituto de Investigación y Desarrollo Educativo.
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. & Solís del Moral, S. S. (2024b). Examen de ingreso a la educación superior (ExIES) 2023-2: Reporte técnico. Instituto de Investigación y Desarrollo Educativo.
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. A., & Solís del Moral, S. S. (2023s). ExIES Base de datos completa de Resultados Rasch y estadísticas ítem–forma [Base de datos no publicada]. Instituto de Investigación y Desarrollo Educativo, Universidad Autónoma de Baja California.
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. A., & Solís del Moral, S. S. (2024c). Base de datos de organización de ítems, histórico del ExIES: control de ítems NDC-especificación-contenido [Manuscrito no publicado].
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. A., & Solís del Moral, S. S. (2023q). Base de datos del jueceo de ítems del ExIES: Lengua escrita, Lectura y Matemáticas [Conjunto de datos no publicado].
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. A., & Solís del Moral, S. S. (2023r). Reporte de aplicación del Examen de Ingreso a la Educación Superior (ExIES) 2023-1. [Manuscrito no publicado].
Pedroza Zúñiga, L. H., Gómez Monárrez, C., García Aldaco, S. A., Orozco Vergara, M. A., & Vargas Ceseña, A. N. (2022). Examen de ingreso a la educación superior (ExIES) 2022-2: Manual Técnico [Manual técnico]. Instituto de Investigación y Desarrollo Educativo, Universidad Autónoma de Baja California.
Peirce, C. S. (1878). Deduction, induction, and hypothesis. Popular Science Monthly, 13, 470–482.
Popham, W. J. (2008). Transformative assessment. ASCD.
Rafatbakhsh, E., & Ahmadi, A. (2022). The Argument-Based Validation of a Large-Scale High-Stakes Vocabulary Test. Practical Assessment, Research, and Evaluation, 27. https://scholarworks.umass.edu/pare/vol27/iss1/28
Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish Institute for Educational Research.
Ricoeur, P. (2004). Memory, history, forgetting. University of Chicago Press. (Trabajo original publicado en 2000).
Rorty & Habermas (2012). Sobre la verdad: ¿validez o justificación? Amorrortu.
Ruiz Mendoza, K., Pedroza Zúñiga, L., & López García, A. (2025). Validation of tests using an argument-based approach: a review based on the PRISMA model. Sapienza, International Journal of Interdisciplinary Studies, 6(4). https://doi.org/10.51798/sijis.v6i4.1177
Sackett, P. R., Borneman, M. J., & Connelly, B. S. (2008). High stakes testing in higher education and employment: Appraising the evidence for validity and fairness. American Psychologist, 63(4), 215–227. https://doi.org/10.1037/0003-066X.63.4.215
Sambell, K., McDowell, L., & Montgomery, C. (2012). Assessment for Learning in Higher Education (1st ed.). Routledge. https://doi.org/10.4324/9780203818268
Schober, P., Boer, C., & Schwarte, L. A. (2018). Correlation Coefficients: Appropriate Use and Interpretation. Anesthesia and analgesia, 126(5), 1763–1768. https://doi.org/10.1213/ANE.0000000000002864
Secretaría de Educación Pública [SEP]. (2008a, 27 de junio). Acuerdo número 442 por el que se establecen los Lineamientos [… título exacto del acuerdo …]. Diario Oficial de la Federación. https://educacionmediasuperior.sep.gob.mx/work/models/sems/Resource/11435/1/images/5_1_acuerdo_numero_442_establece_snb.pdf
Secretaría de Educación Pública [SEP]. (2008b, 27 de junio). Acuerdo número 444 por el que se expiden los Lineamientos [… título exacto del acuerdo …]. Diario Oficial de la Federación. https://educacionmediasuperior.sep.gob.mx/work/models/sems/Resource/11435/1/images/5_2_acuerdo_444_competencias_mcc_snb.pdf
Shepard, L. (2006). Classroom assessment. En R. L. Brennan (Ed.), Educational measurement (4ª ed., pp. 623–646). Praeger.
Shepard, L. (2016). Evaluating test validity: Reprise and progress. Assessment in Education: Principles, Policy & Practice, 23(2), 268–280. https://doi.org/10.1080/0969594X.2016.1141168
Sireci, S. G. (1998). Gathering and analyzing content validity data. Educational Assessment, 5(4), 299–321. https://doi.org/10.1207/s15326977ea0504_2
Sireci, S. G., Han, K. T., & Wells, C. S. (2008). Methods for evaluating the validity of test scores for English language learners. Educational Assessment, 13(2-3), 108–131. https://doi.org/10.1080/10627190802394255
Tavakol, M., & Dennick, R. (2011). Making sense of Cronbach’s alpha. International Journal of Medical Education, 2, 53–55. https://doi.org/10.5116/ijme.4dfb.8dfd
Tavares, W., Brydges, R., Myre, P., Prpic, J., Turner, L., Yelle, R., & Huiskamp, M. (2018). Applying Kane’s validity framework to a simulation-based assessment of clinical competence. Advances in Health Sciences Education, 23(2), 323–338. https://doi.org/10.1007/s10459-017-9800-3
Tinto, V. (1993). Leaving college: Rethinking the causes and cures of student attrition (2nd ed.). University of Chicago Press.
Toulmin, S. E. (2003). The uses of argument (ed. actualizada). Cambridge University Press. (Trabajo original publicado en 1958).
UNESCO. (2021). Learning assessment and high-stakes exams. IIEP Learning Portal. https://learningportal.iiep.unesco.org/en/library/learning-assessment-and-high-stakes-exams
Universidad Autónoma de Baja California (2024). Base de datos del promedio del primer y segundo semestre de universidad. [Conjunto de datos no publicado].
Universidad Autónoma de Baja California. (2010). Ley Orgánica de la Universidad Autónoma de Baja California. Periódico Oficial del Estado de Baja California. https://sriagral.uabc.mx/Externos/AbogadoGeneral/Reglamentos/Leyes/01_LEY_ORGANICA_UABC_reforma_2010.pdf
Universidad Autónoma de Baja California. (2019). Estatuto General de la Universidad Autónoma de Baja California. https://sriagral.uabc.mx/Externos/AbogadoGeneral/Reglamentos/Leyes/02_EstatutoGeneralUABC_19-11-2019.pdf
Universidad Autónoma de Baja California. (2021). Estatuto Escolar de la Universidad Autónoma de Baja California (Edición especial No. 460). Gaceta UABC. https://sriagral.uabc.mx/externos/abogadogeneral/Reglamentos/Estatutos/03_EstatutoEscolarUABC_Reforma_May_202021.pdf#:~:text=XXIII,aspirantes%20para%20el%20nuevo%20ingreso
Watson, G. (2002). The Modern Mind: An Intellectual History of the 20th Century. Harper.
Yan, X., & Staples, S. (2019). Fitting MD analysis in an argument-based validity framework for writing assessment: Explanation and generalization inferences for the ECPE. Language Testing, 36(1), 1–26. https://doi.org/10.1177/0265532219876226
Zhu, W. (2001). Book Review. Measurement in Physical Education and Exercise Science, 5(4), 251–254. https://doi.org/10.1207/S15327841MPEE0504_05
Zieky, M. (1993). Practical questions in the use of DIF statistics in item development. En P. W. Holland & H. Wainer (Eds.), Differential item functioning (pp. 337–347). Lawrence Erlbaum Associates.
Zumbo, B. D., & Chan, E. K. H. (2014). Validity and validation in social, behavioral, and health sciences. Springer. https://doi.org/10.1007/978-3-319-07794-9
