В Python 3.
>>> D1 = {2:3, 1:89, 4:5, 3:0}
>>> for key in sorted(D1):
print (key, D1[key])
дает
1 89
2 3
3 0
4 5
Попробуй. Шаблон URL-совпадения с регексом из Daring Fireball.
/**
* Replace links in text with html links
*
* @param string $text
* @return string
*/
function auto_link_text($text)
{
// a more readably-formatted version of the pattern is on http://daringfireball.net/2010/07/improved_regex_for_matching_urls
$pattern = '(?i)\b((?:[a-z][\w-]+:(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:\'".,<>?«»“”‘’]))';
$callback = create_function('$matches', '
$url = array_shift($matches);
$url_parts = parse_url($url);
$text = parse_url($url, PHP_URL_HOST) . parse_url($url, PHP_URL_PATH);
$text = preg_replace("/^www./", "", $text);
$last = -(strlen(strrchr($text, "/"))) + 1;
if ($last < 0) {
$text = substr($text, 0, $last) . "…";
}
return sprintf(\'<a rel="nofollow" href="%s">%s</a>\', $url, $text);
');
return preg_replace_callback($pattern, $callback, $text);
}
Input Text:
This is my text. I wonder if you know about asking questions on StackOverflow:
Check This out http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior
Also, base_convert php function?
http://pt.php.net/manual/en/function.base-convert.php#52450
http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450
Output Text:
This is my text. I wonder if you know about asking questions on StackOverflow:
Check This out <a rel="nofollow" href="http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior">stackoverflow.com/questions/1925455/…</a>
Also, base_convert php function?
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php#52450">pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450">pt.php.net/manual/en/…</a>
Если у вас есть предсказуемый URL, такой как SO, тогда будет легко захватить ссылки с помощью регулярного выражения и отфильтровать те, которые соответствуют шаблону. Итак, если ваш URL-адрес http://example.com/stuff/1234
, то найти http://example.com/stuff/1234/how-to-mimic
было бы неплохо тривиально с регулярным выражением.
<?php
preg_match('/http:\/\/example.com\/(\w*)\/(\d)[\/*]/', $text, $matches);
if (is_array($matches))
{
foreach ($matches as $match)
{
// do something...
}
}
?>
См. Регулярное выражение (регулярное выражение) для соответствия URL-адресу :
https?: // ([- \ w \. ] +) + (: \ d +)? (/ ([\ w / _ \.] * (\? \ S +)?)?)?)?
Пример PHP: автоматическая ссылка на внутренний текст URL.
$ text = preg_replace ('@ (https?: // ([- \ w \.] +) + (: \ D +)? (/ ([\ w / _ \.] * (\? \ S +)?)?)?) @ ',' $ 1 ', $ text);
Это преобразует образец строки в то, что вам нужно. Я пропустил title
, так как он исходит из другого источника, а не только из отдельного URL, и вы сказали, что это неважно.
<?php
$urlInput="http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior";
preg_match('@http://(?:www\.)?(\S+/)\S*(?:\s|$)@i', $urlInput, $matches);
print('<a rel="nofollow" href="' . trim($matches[0]) . '">' . $matches[1] . '...</a>');
?>
Расширяйте по мере необходимости для сканирования по вашему тексту.
Если вы хотите сопоставить только определенное количество элементов пути URL, используйте этот RE:
'@http://(?:www\.)?((?:\S+?/){1,3})\S*(?:\s|$)@i'
Это извлечет до 3 элементов пути (хост и до двух каталогов). Вы можете изменить верхнюю границу в {1,3}
, чтобы определить максимальное количество нужных элементов пути.
Изменилось окончание \S
, чтобы разрешить нулевое совпадение.
В некоторой степени основано на ответе Кевина Брока, но позволяет настраивать параметры (глубина папки и длина URL), и принимает URL без трейлинговых слэшей:
$url = 'http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior';
$output = '';
$params = array (
'length' => 10,
'depth' => 2,
);
preg_match ('@http://(?:www\.)?([^/?# ]+)(/\S+)?(?=\s|$)@i', $url, $matches);
if (isset ($matches[2]))
{
$parts = explode('/', substr($matches[2], 1));
if (count($parts) > $params['depth'] && strlen($matches[1].$matches[2]) > $params['length'])
$output = $matches[1].'/'.implode('/', array_slice($parts, 0, 2)).'/...';
else
$output = $matches[1].$matches[2];
}
else
$output = $matches[1];
echo '<a href="'.$matches[0].'">'.$output.'</a>';
Надеюсь, это поможет
. Это основано на том же шаровом отваге. net регулярное выражение, но добавляет немного больше логики, чем в примере Эрика Коулмана, а также конфигурацию для максимальной глубины URL (SO кажется 50), максимальную глубину пути при усечении URL (SO кажется 2), и символ эллипсиса (…
).
Насколько я знаю, это воспроизводит все функции переписывания SO URL, по крайней мере, то, что обсуждалось до сих пор в комментариях и ответах здесь.
function auto_link_text($text) {
$pattern = '#\b(([\w-]+://?|www[.])[^\s()<>]+(?:\([\w\d]+\)|([^[:punct:]\s]|/)))#';
return preg_replace_callback($pattern, 'auto_link_text_callback', $text);
}
function auto_link_text_callback($matches) {
$max_url_length = 50;
$max_depth_if_over_length = 2;
$ellipsis = '…';
$url_full = $matches[0];
$url_short = '';
if (strlen($url_full) > $max_url_length) {
$parts = parse_url($url_full);
$url_short = $parts['scheme'] . '://' . preg_replace('/^www\./', '', $parts['host']) . '/';
$path_components = explode('/', trim($parts['path'], '/'));
foreach ($path_components as $dir) {
$url_string_components[] = $dir . '/';
}
if (!empty($parts['query'])) {
$url_string_components[] = '?' . $parts['query'];
}
if (!empty($parts['fragment'])) {
$url_string_components[] = '#' . $parts['fragment'];
}
for ($k = 0; $k < count($url_string_components); $k++) {
$curr_component = $url_string_components[$k];
if ($k >= $max_depth_if_over_length || strlen($url_short) + strlen($curr_component) > $max_url_length) {
if ($k == 0 && strlen($url_short) < $max_url_length) {
// Always show a portion of first directory
$url_short .= substr($curr_component, 0, $max_url_length - strlen($url_short));
}
$url_short .= $ellipsis;
break;
}
$url_short .= $curr_component;
}
} else {
$url_short = $url_full;
}
return "<a rel=\"nofollow\" href=\"$url_full\">$url_short</a>";
}
Sample Input:
This is my text. I wonder if you know about asking questions on StackOverflow:
Check This out http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior
Also, base_convert php function?
http://pt.php.net/manual/en/function.base-convert.php#52450
http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450
http://a.b/c/d/e/f/test
and http://a.b/c/d/e/f/g/h/i/j/k/l/m/n/o/p/q/r/s/t/u/v/z/y/w/z/test
Sample Output:
This is my text. I wonder if you know about asking questions on StackOverflow:
Check This out <a rel="nofollow" href="http://www.stackoverflow.com/questions/1925455/how-to-mimic-stackoverflow-auto-link-behavior">http://stackoverflow.com/questions/1925455/…</a>
Also, base_convert php function?
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php#52450">http://pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450">http://pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://a.b/c/d/e/f/test">http://a.b/c/d/e/f/test</a>
and <a rel="nofollow" href="http://a.b/c/d/e/f/g/h/i/j/k/l/m/n/o/p/q/r/s/t/u/v/z/y/w/z/test">http://a.b/c/d/…</a>