Просто используйте это, чтобы удалить текст:
echo strlen($string) >= 500 ?
substr($string, 0, 490) . ' <a href="link/to/the/entire/text.htm">[Read more]</a>' :
$string;
Изменить и, наконец:
function split_words($string, $nb_caracs, $separator){
$string = strip_tags(html_entity_decode($string));
if( strlen($string) <= $nb_caracs ){
$final_string = $string;
} else {
$final_string = "";
$words = explode(" ", $string);
foreach( $words as $value ){
if( strlen($final_string . " " . $value) < $nb_caracs ){
if( !empty($final_string) ) $final_string .= " ";
$final_string .= $value;
} else {
break;
}
}
$final_string .= $separator;
}
return $final_string;
}
Здесь разделитель является ссылкой href для чтения больше;)
Я думаю, что запятые в конце этих двух строк создают список переменных, которые вы пытаетесь обработать.
tokens = re.split('\W+', text), # <---- These commas at the end
tex = " ".join([word for word in tokens if word not in cachedStopWords]), # <----
Результат будет примерно таким же, как если бы вы сделали что-то подобное (отредактировано для лучшего примера):
x = 12 * 24,
y = x * 10,
z = 40
print(f"X = {x}\n"
f"Y = {y}\n"
f"Z = {z}\n")
Вывод:
X = (288,)
Y = ((288, 288, 288, 288, 288, 288, 288, 288, 288, 288),)
Z = 40
Результат запятых в упаковке и распаковке ваших переменных.