Некоторое время назад мы взяли на себя ответственность за устаревшую базу кода.
Одна из причуд этого очень плохо структурированного / написанного кода заключалась в том, что он содержал ряд действительно огромных структур, каждая из которых содержала сотни участников. Одним из многих шагов, которые мы сделали, была очистка как можно больше кода, который не использовался, отсюда необходимость чтобы найти неиспользуемые структуры / члены структуры.
Что касается структур, я вызвал в воображении комбинацию python, GNU Глобальные и ctags для перечисления неиспользуемых членов структуры.
По сути, я использую ctags
для создания файла тегов,
сценарий python ниже анализирует этот файл, чтобы найти всю структуру
членов, а затем с помощью GNU Global
выполнить поиск в ранее
сгенерировал глобальную базу данных, чтобы проверить, используется ли этот член в коде.
Этот подход имеет ряд довольно серьезных недостатков, но он вроде как решили проблему, с которой мы столкнулись, и дали нам хороший старт для дальнейшего очистка.
Должен быть способ сделать это лучше!
Вопрос в следующем: как найти неиспользуемые структуры и элементы структуры в кодовой базе?
#!/usr/bin/env python
import os
import string
import sys
import operator
def printheader(word):
"""generate a nice header string"""
print "\n%s\n%s" % (word, "-" * len(word))
class StructFreqAnalysis:
""" add description"""
def __init__(self):
self.path2hfile=''
self.name=''
self.id=''
self.members=[]
def show(self):
print 'path2hfile:',self.path2hfile
print 'name:',self.name
print 'members:',self.members
print
def sort(self):
return sorted(self.members, key=operator.itemgetter(1))
def prettyprint(self):
'''display a sorted list'''
print 'struct:',self.name
print 'path:',self.path2hfile
for i in self.sort():
print ' ',i[0],':',i[1]
print
f=open('tags','r')
x={} # struct_name -> class
y={} # internal tags id -> class
for i in f:
i=i.strip()
if 'typeref:struct:' in i:
line=i.split()
x[line[0]]=StructFreqAnalysis()
x[line[0]].name=line[0]
x[line[0]].path2hfile=line[1]
for j in line:
if 'typeref' in j:
s=j.split(':')
x[line[0]].id=s[-1]
y[s[-1]]=x[line[0]]
f.seek(0)
for i in f:
i=i.strip()
if 'struct:' in i:
items=i.split()
name=items[0]
id=items[-1].split(':')[-1]
if id:
if id in y:
key=y[id]
key.members.append([name,0])
f.close()
# do frequency count
for k,v in x.iteritems():
for i in v.members:
cmd='global -a -s %s'%i[0] # -a absolute path. use global to give src-file for member
g=os.popen(cmd)
for gout in g:
if '.c' in gout:
gout=gout.strip()
f=open(gout,'r')
for line in f:
if '->'+i[0] in line or '.'+i[0] in line:
i[1]=i[1]+1
f.close()
printheader('All structures')
for k,v in x.iteritems():
v.prettyprint()
#show which structs that can be removed
printheader('These structs could perhaps be removed')
for k,v in x.iteritems():
if len(v.members)==0:
v.show()
printheader('Total number of probably unused members')
cnt=0
for k,v in x.iteritems():
for i in v.members:
if i[1]==0:
cnt=cnt+1
print cnt
Edit
Как было предложено @ Jens-Gustedt, использование компилятора - хороший способ сделать это. Мне нужен подход, который может выполнять своего рода фильтрацию "высокого уровня" перед использованием подхода компилятора.