Уберите все, кроме цифр и букв.
var sourceString='a|"bc!@£de^&$f g';
// var outString = sourceString.replace(/[`~!@#$%^&*()|+\-=?;:'",<>\{\}\[\]\\\/]/gi, '');
var outString = sourceString.replace(/[^a-zA-Z0-9]/g, '');
console.log('sourcestring',outString);
Можно выбрать URL и видеть Тип контента от ответа.
Можно использовать Клиент HTTP от апача, он помогает Вам выбрать содержание URL, и можно использовать его для навигации по перенаправлениям. Например, попытайтесь выбрать следующее:
http://www.youtube.com/watch?v=d4LkTstvUL4
Возвратит HTML, содержащий видео. Через некоторое время Вы узнаете, что видео здесь:
http://www.youtube.com/v/d4LkTstvUL4
Но если Вы выберете ту страницу, то Вы получите перенаправление:
HTTP/1.0 302 Redirect
Date: Fri, 23 Jan 2009 02:25:37 GMT
Content-Type: text/plain
Expires: Fri, 23 Jan 2009 02:25:37 GMT
Cache-Control: no-cache
Server: Apache
X-Content-Type-Options: nosniff
Set-Cookie: VISITOR_INFO1_LIVE=sQc75zc-QSU; path=/; domain=.youtube.com; expires=
Set-Cookie: VISITOR_INFO1_LIVE=sQc75zc-QSU; path=/; domain=.youtube.com; expires=
Location: http://www.youtube.com/swf/l.swf?swf=http%3A//s.ytimg.com/yt/swf/cps-vf
L4&rel=1&eurl=&iurl=http%3A//i1.ytimg.com/vi/d4LkTstvUL4/hqdefault.jpg&sk=Z_TM3JF
e_get_video_info=1&load_modules=1
Так, что необходимо сделать, должен выбрать URL и исследовать его, пока Вы не получаете заключительное содержание
Этот раздел объясняет, как обработать перенаправления.
Выпустите запрос ГОЛОВЫ HTTP, таким образом, можно исследовать HTTP-заголовки, которые возвращаются, не имея необходимость сначала загружать весь документ. Показ непрограммного случая в соответствии с Linux с помощью "завихрения":
$ curl --head http://stackoverflow.com/Content/Img/stackoverflow-logo-250.png HTTP/1.1 200 OK Cache-Control: max-age=28800 Content-Length: 3428 Content-Type: image/png Last-Modified: Fri, 16 Jan 2009 09:35:30 GMT Accept-Ranges: bytes ETag: "98f590c5bd77c91:0" Server: Microsoft-IIS/7.0 Date: Fri, 23 Jan 2009 03:55:39 GMT
Вы видите здесь от Типа контента, что это - изображение. Можно использовать HTTPClient от Apache от Java, чтобы сделать запрос Головы HTTP.
Если Вы хотите загрузить содержание наверняка, то просто выходят, HTTP ПОЛУЧАЮТ (использование Httpclient) и используют тот же HTTP-заголовок для определения типа контента.
Поразить ссылку и осмотреть заголовок типа контента? Если результатом является страница HTML, Вы могли бы искать самое большое изображение или встроили флеш-файл на странице, и примите решение отобразить это?
Я предлагаю использовать curl с заголовком диапазона, чтобы вы могли проверить сам тип файла.
curl -s -v -r0-499 -o test http://stackoverflow.com/content/img/so/logo.png
* About to connect() to stackoverflow.com port 80 (#0)
* Trying 69.59.196.211... connected
* Connected to stackoverflow.com (69.59.196.211) port 80 (#0)
> GET /content/img/so/logo.png HTTP/1.1
> Range: bytes=0-499
> User-Agent: curl/7.19.4 (i386-apple-darwin9.6.0) libcurl/7.19.4 zlib/1.2.3
> Host: stackoverflow.com
> Accept: */*
>
< HTTP/1.1 206 Partial Content
< Cache-Control: max-age=604800
< Content-Type: image/png
< Content-Range: bytes 0-499/3438
< Last-Modified: Fri, 05 Jun 2009 06:52:35 GMT
< Accept-Ranges: bytes
< ETag: "25dd4b35aae5c91:0"
< Server: Microsoft-IIS/7.0
< Date: Fri, 19 Jun 2009 19:39:43 GMT
< Content-Length: 500
<
{ [data not shown]
* Connection #0 to host stackoverflow.com left intact
* Closing connection #0
Затем выполните:
$ file test
test: PNG image data, 250 x 61, 8-bit colormap, non-interlaced
Теперь вы знаете mime введите: image / png , размер файла 3438 байт , и файл представляет собой цветное изображение 250 x 61 PNG .
Быстрый индексатор видео - это программа для захвата видео, которая может автоматически захватывать видеокадры из списка видео и создавать индексные веб-страницы, индексировать изображения или список изображений.