Python, XPath: Найти все ссылки на изображения

Я использую lxml в Python для синтаксического анализа HTML и хочу извлечь все ссылки на изображения. Я делаю это прямо сейчас:

//a[contains(@href,'.jpg') or contains(@href,'.jpeg') or ... (etc)]

При таком подходе есть несколько проблем:

  • вы должны перечислить все возможные расширения изображений во всех случаях (как «jpg», так и «JPG»), чего нет. elegance
  • в странных ситуациях href может содержать .jpg где-то посередине, а не в конце строки

Я хотел использовать регулярное выражение, но у меня ничего не вышло:

//a[regx:match(@href,'.*\.(?:png|jpg|jpeg)')]

Это вернуло мне все ссылки на все время ...

Кто-нибудь знает право, Проблема в том, что я пытался рассчитать расстояние на основе данных акселерометра, но результаты действительно плохие. Интересно, может ли кто-нибудь помочь мне с правильным уравнением, но прежде всего, возможно ли это сделать?

До сих пор я использую следующие уравнения:

скорость = ускорение * время;

расстояние = скорость * время + (ускорение * время ^ 2) / 2;

затем я переводю расстояние из метров в секунду в пиксели в зависимости от разрешения экрана монитора.

вычисляется с помощью javascript в браузере каждый раз, когда я получаю данные датчика , что происходит каждые ~ 80 мс.

11
задан Tom 15 October 2012 в 19:04
поделиться