Используя C# и XDocument/XElement для парсинга Ответа Мыла

TL; DR

Попробуйте это: https://github.com/huggingface/pytorch-pretrained-BERT

Сначала вы должны настроить его , правильно с

pip install -U pytorch-pretrained-bert

Тогда вы можете использовать «модель языка маски» из алгоритма BERT, например,

import torch
from pytorch_pretrained_bert import BertTokenizer, BertModel, BertForMaskedLM

# OPTIONAL: if you want to have more information on what's happening, activate the logger as follows
import logging
logging.basicConfig(level=logging.INFO)

# Load pre-trained model tokenizer (vocabulary)
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

text = '[CLS] I want to [MASK] the car because it is cheap . [SEP]'
tokenized_text = tokenizer.tokenize(text)
indexed_tokens = tokenizer.convert_tokens_to_ids(tokenized_text)

# Create the segments tensors.
segments_ids = [0] * len(tokenized_text)

# Convert inputs to PyTorch tensors
tokens_tensor = torch.tensor([indexed_tokens])
segments_tensors = torch.tensor([segments_ids])

# Load pre-trained model (weights)
model = BertForMaskedLM.from_pretrained('bert-base-uncased')
model.eval()

# Predict all tokens
with torch.no_grad():
    predictions = model(tokens_tensor, segments_tensors)

predicted_index = torch.argmax(predictions[0, masked_index]).item()
predicted_token = tokenizer.convert_ids_to_tokens([predicted_index])[0]

print(predicted_token)

[out]:

buy

В Long

Чтобы действительно понять, зачем вам нужны [CLS], [MASK] и тензоры сегментов, пожалуйста, сделайте внимательно прочитайте статью, https://arxiv.org/abs/1810.04805

И если вам лень, вы можете прочитать этот хороший пост от Лилиан Вэн, https: //lilianweng.github.io/lil-log/2019/01/31/generalized-language-models.html

Помимо BERT, существует множество других моделей, которые могут выполнить задачу заполнения бланка. Посмотрите на другие модели в репозитории pytorch-pretrained-BERT, но, что более важно, погрузитесь глубже в задачу «Моделирование языка», то есть в задачу прогнозирования следующего слова с учетом истории.

5
задан John Saunders 12 December 2014 в 15:39
поделиться

2 ответа

Возможно, вы захотите попробовать что-то вроде этого:

string myNamespace= "http://mycrazyservice.com/SuperDuperService";

var results = from result in yourXml.Descendants(XName.Get("MyResponse", myNamespace))
              select result.Element("Result").value

У вас на ноутбуке нет VS, поэтому я не могу дважды проверить свой код, но он должен указать вам правильное направление, используя LINQ to SQL.

11
ответ дан 18 December 2019 в 09:53
поделиться

Может быть так:

IEnumerable<XElement> list = doc.Document.Descendants("Result");
if (list.Count() > 0)
{
    // do stuff
}
1
ответ дан 18 December 2019 в 09:53
поделиться
Другие вопросы по тегам:

Похожие вопросы: