Вы можете использовать "<pre>(.*?)</pre>"
, (заменяя pre на любой текст, который вы хотите) и извлекаете первую группу (для более конкретных инструкций указывается язык), но это предполагает упрощенное представление о том, что у вас очень простой и допустимый HTML.
Как и другие комментаторы, если вы делаете что-то сложное, используйте парсер HTML.
Если Вам только нужна американская информация, американская Почтовая служба обеспечивает ряд веб-сервисов, которые она называет WebTools для этой точной вещи. https://www.usps.com/business/web-tools-apis/welcome.htm . Необходимо будет зарегистрироваться, чтобы смочь использовать их, но после того как Вы регистрируетесь, они действительно просты в использовании. Вы просто отправляете запрос XML по HTTP, и сервер передает ответ XML обратно, и просто необходимо распаковать его.
Демонстрационный запрос:
http://SERVERNAME/ShippingAPITest.dll?API=Verify&XML=<AddressValidateRequest%20USERID="xxxxxxx"><Address ID="0"><Address1></Address1><Address2>6406 Ivy Lane</Address2><City>Greenbelt</City><State>MD</State><Zip5></Zip5><Zip4></Zip4></Address></AddressValidateRequest>
Демонстрационный ответ:
<?xml version="1.0"?>
<AddressValidateResponse>
<Address ID="0">
<Address2>6406 IVY LN</Address2>
<City>GREENBELT</City>
<State>MD</State>
<Zip5>20770</Zip5>
<Zip4>1441</Zip4>
</Address>
</AddressValidateResponse>
Вот ссылка на техническую документацию: https://www.usps.com/business/web-tools-apis/documentation-updates.htm
Это - лучшее, которое я нашел. Они позволяют Вам загрузить и разместить веб-сервис самим, который также хорош.
Хорошим источником географических данных, включая поиски и отображающиеся данные для США является американское Бюро переписи Набор данных ТИГРА . Они больше активно отслеживают данные почтового индекса, но они действительно имеют старинный файл 1999 года все еще доступный.
Для стран, список кода страны ISO общедоступен.
я не знаю о ресурсах для получения информации за пределами США.