Как получить заголовок веб-сайта от c#

На Python 2 вы должны использовать литерал u'' для создания строки Unicode. Кроме того, вы должны передать флаг re.UNICODE и преобразовать свои входные данные в Unicode (например, text = data.decode('utf-8')):

#!/usr/bin/env python
import re

text = u'This dog \U0001f602'
print(text) # with emoji

emoji_pattern = re.compile("["
        u"\U0001F600-\U0001F64F"  # emoticons
        u"\U0001F300-\U0001F5FF"  # symbols & pictographs
        u"\U0001F680-\U0001F6FF"  # transport & map symbols
        u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                           "]+", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji

Выход

This dog          
15
задан Morten Christiansen 30 November 2008 в 20:23
поделиться

2 ответа

Более простой способ получить содержание:

WebClient x = new WebClient();
string source = x.DownloadString("http://www.singingeels.com/");

А более простой, более надежный способ получить заголовок:

string title = Regex.Match(source, @"\<title\b[^>]*\>\s*(?<Title>[\s\S]*?)\</title\>",
    RegexOptions.IgnoreCase).Groups["Title"].Value;
41
ответ дан 30 November 2019 в 16:01
поделиться

Inorder для выполнения этого Вы испытываете необходимость, чтобы сделать несколько вещей.

  • Делают Ваше приложение поточным, так, чтобы можно было обработать несколько запросов в то время и максимизировать количество Запросов HTTP, которые делаются.
  • Durring асинхронный запрос, загрузите только объем данных, который Вы хотите задержать, Вы могли, вероятно, сделать парсинг на данных, когда это возвращается, ища
  • , Вероятно, хотят использовать regex для вытаскивания названия заголовка

, я сделал это прежде с ботами SEO, и я смог обработать почти 10 000 запросов в единственное время. Просто необходимо удостовериться, что каждый веб-запрос может быть сам содержавшийся в потоке.

-1
ответ дан 30 November 2019 в 16:01
поделиться
Другие вопросы по тегам:

Похожие вопросы: