Для ваших целей вы можете добавить термин-вектор в текстовое поле для термина «частоты». Пожалуйста, прочитайте документацию здесь . Затем вы можете использовать массовый запрос для termvector, который здесь представлен как mtermvector- doc и python api doc . Работает со списком идентификаторов. Например, если у вас есть список всех идентификаторов ваших документов, которые соответствуют «небу», вы можете действовать следующим образом:
from elasticsearch import Elasticsearch
es = Elasticsearch()
index = "abc"
my_doc_type ="your_doc_type"
ids = []
result = es.search(index="abc", doc_type= my_doc_type body={"query": {"term": {"my_field": "sky"}}})
for res in in result['hits']['hits']:
ids.append(res['ids'])
for doc in es.mtermvectors(index=index,doc_type=doc_type,body=dict(ids=ids,parameters=dict(term_statistics=True,field_statistics=True,fields=fields)))['docs']:
fields = doc['term_vectors']
terms = field['terms']
tf = vec["term_freq"]
df = vec["doc_freq"]
Для этой цели System.IO.Path имеет два поля только для чтения:
Затем есть два дополнительных поля для разделителя тома и разделителя пути:
System.IO.Path содержит такую информацию.
http://msdn.microsoft.com/en-us/library/system.io.path.directoryseparatorchar.aspx