Я хотел бы спросить, существует ли какой-либо пакет Java или библиотека, которые имеют стандартную нормализацию URL?
5 компонентов представления URL
http://www [точка] пример [точка] com:8040/folder/exist? name=sky#head
- схема: http
- полномочия: www.example.com:8040
- путь:/folder/exist
- запрос:? name=sky
- фрагмент: #head
3 типа стандартной нормализации URL
Основанная на синтаксисе нормализация
- Нормализация случая – преобразовывает всю букву в схеме и компонентах полномочий к нижнему регистру
- Закодированная процентом нормализация – декодирует любой закодированный процентом октет, который соответствует незарезервированному символу, такому как %2D для дефиса и %5 для подчеркивания
- Нормализация сегмента контура – удаляет точечные сегменты из компонента контура, такой как'.' и ‘..’
Основанная на схеме нормализация
- Добавьте запаздывание ‘/’ после компонента полномочий URL
- Удалите номер порта по умолчанию, такой как 80 для http схемы
- Усеките фрагмент URL
Основанная на протоколе нормализация
- Только соответствующий, когда результаты доступа к ресурсам эквивалентны
- Например, example.com/data направлен к example.com/data/ сервером источника
задан lockone 29 July 2010 в 17:18
поделиться