Стандартная нормализация URL - Java

Я хотел бы спросить, существует ли какой-либо пакет Java или библиотека, которые имеют стандартную нормализацию URL?

5 компонентов представления URL

http://www [точка] пример [точка] com:8040/folder/exist? name=sky#head

  1. схема: http
  2. полномочия: www.example.com:8040
  3. путь:/folder/exist
  4. запрос:? name=sky
  5. фрагмент: #head

3 типа стандартной нормализации URL

Основанная на синтаксисе нормализация

  • Нормализация случая – преобразовывает всю букву в схеме и компонентах полномочий к нижнему регистру
  • Закодированная процентом нормализация – декодирует любой закодированный процентом октет, который соответствует незарезервированному символу, такому как %2D для дефиса и %5 для подчеркивания
  • Нормализация сегмента контура – удаляет точечные сегменты из компонента контура, такой как'.' и ‘..’

Основанная на схеме нормализация

  • Добавьте запаздывание ‘/’ после компонента полномочий URL
  • Удалите номер порта по умолчанию, такой как 80 для http схемы
  • Усеките фрагмент URL

Основанная на протоколе нормализация

  • Только соответствующий, когда результаты доступа к ресурсам эквивалентны
  • Например, example.com/data направлен к example.com/data/ сервером источника

9
задан lockone 29 July 2010 в 17:18
поделиться

2 ответа

URI uri = URI.create("http://www.example.com:8040/folder/exist?name=sky#head");
String scheme = uri.getScheme();
String authority = uri.getAuthority();
// ...

http://java.sun.com/j2se/1.4.2/docs/api/java/net/URI.html

3
ответ дан 4 December 2019 в 22:26
поделиться
Другие вопросы по тегам:

Похожие вопросы: