Так как Вы используете Черепаху, можно хотеть проверить эту ссылку на LosTechies. Это должно быть почти точно, что Вы ищете.
Хороший вопрос, прямого ответа нет.
Там доступны исследовательские работы, которые показывают взаимосвязь между, например, цикломатической сложностью и ошибками. Проблема в том, что большинство исследовательских работ не доступны в свободном доступе.
Я нашел следующее: http://www.pitt.edu/~ckemerer/CK%20research%20papers/CyclomaticComplexityDensity_GillKemerer91.pdf . Хотя он показывает связь между цикломатической сложностью и производительностью. Однако в нем есть несколько ссылок на другие статьи, и их стоит попробовать погуглить.
Посмотрите эту статью из исследования Microsoft . В общем, я сомневаюсь в мудрости разработчиков, исходящей от Microsoft, но у них действительно есть ресурсы, чтобы проводить долгосрочные исследования крупных продуктов. В упомянутой статье рассказывается о корреляции, обнаруженной между различными метриками и уровнем дефектности проекта.
Наконец-то я нашел несколько статей о корреляции между программными метриками и частотой ошибок, но ни одна из них не была тем, что я искал. Большинство работ устарели (конец 80-х или начало 90-х).
Я думаю, что было бы неплохо начать анализ текущего программного обеспечения. На мой взгляд, должно быть возможно исследовать некоторые популярные системы с открытым исходным кодом. Исходный код доступен и (что я считаю гораздо более важным) многие проекты используют трекеры проблем и какую-то систему контроля версий. Возможно, удастся найти сильную связь между журналом систем отслеживания версий и трекерами проблем. Это привело бы к очень интересной возможности анализа связи между некоторыми программными метриками и частотой багов.
Может быть, все еще есть проект, который делает именно то, что я описал выше. Кто-нибудь знает о чем-то подобном?