Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance

Hafiz Ramzan; Kamrul Islam; Md Hussain; Raiyan Monim; Sabit Asad; Sadia Ramzan

doi:10.32604/cmc.2026.077782

Open Access icon Open Access

ARTICLE

Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance

Hafiz Arslan Ramzan^1,*, Kamrul Islam², Md Ahbab Hussain³, Raiyan Muntasir Monim⁴, Sabit Md Asad⁴, Sadia Ramzan⁵

1 School of Electrical Engineering and Computer Science, National University of Sciences and Technology, Islamabad, Pakistan
2 Gabelli School of Business, Fordham University, New York, NY, USA
3 Ketner School of Business, Trine University, Angola, IN, USA
4 College of Graduate and Professional Studies, Trine University, Angola, IN, USA
5 Department of Computer Science, Emerson University, Multan, Pakistan

* Corresponding Author: Hafiz Arslan Ramzan. Email: email

Computers, Materials & Continua 2026, 88(1), 57 https://doi.org/10.32604/cmc.2026.077782

Received 16 December 2025; Accepted 25 March 2026; Issue published 08 May 2026

Abstract

Regression testing of large-scale, data-intensive software systems demands efficient test-case prioritization strategies to detect faults early while minimizing computational cost. Conventional prioritization methods, such as coverage-based and risk-based approaches, lack adaptability to evolving project dynamics and fail to leverage the rich test-execution data accumulated over continuous integration cycles. This study presents a Data-Driven Test-Case Prioritization (DD-TCP) Framework that incorporates statistical and machine-learning techniques to model the relationship between test-case features and historical fault detection outcomes. The framework extracts multidimensional attributes including code-change frequency, dependency metrics, execution duration, and past failure density, which are normalized and embedded into a predictive ranking model based on gradient-boosted decision trees. Test cases are then dynamically reordered using a probabilistic gain function that maximizes early fault detection probability. Comprehensive simulations on representative open-source project datasets and synthetically generated large-scale test suites reveal that the proposed Data-Driven Test-Case Prioritization (DD-TCP) framework consistently achieves superior performance, yielding a 32.4% improvement in Average Percentage of Faults Detected (APFD) and a 27.1% reduction in execution overhead relative to baseline methods. The results demonstrate the feasibility of data-centric intelligence for scalable regression testing and provide an analytical foundation for integrating machine learning into next-generation Software Quality Assurance pipelines.

Keywords

Data-driven test-case prioritization; regression testing; software quality assurance; machine learning; continuous integration; fault detection efficiency; intelligent software systems

Cite This Article

APA Style

Ramzan, H.A., Islam, K., Hussain, M.A., Monim, R.M., Asad, S.M. et al. (2026). Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance. Computers, Materials & Continua, 88(1), 57. https://doi.org/10.32604/cmc.2026.077782

Vancouver Style

Ramzan HA, Islam K, Hussain MA, Monim RM, Asad SM, Ramzan S. Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance. Comput Mater Contin. 2026;88(1):57. https://doi.org/10.32604/cmc.2026.077782

IEEE Style

H. A. Ramzan, K. Islam, M. A. Hussain, R. M. Monim, S. M. Asad, and S. Ramzan, “Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance,” Comput. Mater. Contin., vol. 88, no. 1, pp. 57, 2026. https://doi.org/10.32604/cmc.2026.077782

BibTex EndNote RIS

Copyright © 2026 The Author(s). Published by Tech Science Press.
This work is licensed under a Creative Commons Attribution 4.0 International License , which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

Table of Content

Data-Driven Test Case Prioritization (DD-TCP): A Machine Learning Framework for Intelligent Software Quality Assurance

Abstract

Keywords

Cite This Article

333

51

0

Related articles

Further Information

Guidelines

Follow Us

Join Us

Contact Us

WhatsApp:

Share Link