Я должен разделить китайское предложение на отдельные слова. Проблема с китайским языком состоит в том, что нет никаких пробелов. Например, предложение может быть похожим: 主楼怎么走 (с пробелами это было бы: 主楼 怎么 走). В...
Как правильно разбить строку на слова?
(строка не содержит пробелов и знаков препинания) Например: "stringintowords" -> "String Into Words" Не могли бы вы посоветовать, что ...
Я хочу извлечь первое слово переменной из строки. Например, возьмем эти данные: Php $ myvalue = 'Test me more'; ?> Результирующий вывод должен быть Test, который является первым словом ...
Я хочу, чтобы моя функция Python разделяла предложение (вход) и сохраняла каждое слово в списке. Мой текущий код разбивает предложение, но не хранит слова в виде списка. Как я могу это сделать? def split_line (текст) ...
У меня есть строка с несколькими предложениями. Как я Использую для своей выгоды первую букву первого слова в каждом предложении. Что-то как форматирование абзаца в слове. например, "это - некоторый код. код находится в C#...
Я хотел бы выделиться, длинные предложения (скажите, 50 слов или больше), содержавшийся в массиве объектов абзаца на странице, т.е. $ (" #content p"). Я не уверен, как заняться этим. Я первоначально пытался...
Следующий неструктурированный текст имеет три отличных темы - Stallone, Филадельфию и американский Оборот. Но который алгоритм или техника были бы Вы использовать для разделения этого содержания в отличный...
Кто-либо знает о библиотеке Java, которая обрабатывает границы предложения открытия? Я думаю, что это была бы умная реализация StringTokenizer, которая знает обо всех разделителях предложения это...
Я работаю над решением для разделения длинных строк на кхмерском (камбоджийском языке) ) на отдельные слова (в UTF-8). Кхмерский не использует пробелы между словами. Есть несколько решений, но ...
Какой лучший способ вырезать последнее слово из блока текста? Я могу подумать о разделении его на список (по пробелам) и удалении последнего элемента, а затем повторном объединении списка. Используйте регулярное выражение ...
Я пытаюсь написать функцию для очистки пользовательского ввода. Я не пытаюсь сделать его идеальным. Я бы предпочел несколько имен и сокращений в нижнем регистре, чем полный абзац в верхнем регистре. Я думаю ...
У меня есть массив строк различной длины и содержания. Теперь я ищу простой способ извлечь последнее слово из каждой строки, не зная, как долго это слово или какова длина строки ...
Я пытаюсь преобразовать строку в список слов с помощью Python. Я хочу взять что-то вроде следующего: string = 'Это строка со словами!' Затем преобразуйте что-то вроде этого: list = ['...
Я использовал разбить (".",$mystring ), чтобы разбить абзац на предложения. Однако это не распространяется на предложения, которые были заключены с другой пунктуацией, такой как ! ? :; Есть ли способ...
Я хочу решить проблему разбиения слов (разбирать слова из длинной строки без пробелов).
Например, мы хотим извлечь слова из somelongword в [some, long, word]. Мы можем добиться этого с помощью некоторой динамической...
Мне нужно разобрать предложения из абзаца в Python. Есть ли существующий пакет для этого, или я должен попытаться использовать здесь регулярное выражение?
Как вы разбираете HTML-страницу со свободным текстом, списками, таблицами, заголовками и т. д. на предложения? Возьмем, к примеру, эту страницу в Википедии. Есть/есть :свободный текст:http://en.wikipedia.org/wiki/...
Я хочу разбить текст на предложения. Кто-нибудь может помочь мне? Мне также нужно обрабатывать сокращения. Однако я планирую заменить их на более раннем этапе. Mr. -> Mister import re import unittest ...
Общие сведения Требуется автоматизировать создание доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемом виде ...
Мне нужно найти алгоритм динамического программирования для решения этой проблемы. Я пытался, но не мог понять. Вот проблема: вам дана строка из n символов s [1 ... n], которая, по вашему мнению, является ...
Я хотел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое дает точность ~ 95% и хотелось бы улучшить его, используя лучший подход. Я видел инструменты НЛП, которые делают это в ...
Кажется, трудно определить границу предложения в тексте. Кавычки вроде.!? может использоваться для разграничения предложений, но не настолько точен, так как могут быть двусмысленные слова и цитаты, такие как USA или ...
Как указано в вопросе, я ищу бесплатный алгоритм сегментации текста с открытым исходным кодом для китайского языка. Я понимаю, что это очень сложная задача, поскольку существует много двусмысленностей. ..