Я ищу что-то в Java для чтения в документах Word для обработки их текста.. все, в чем я нуждаюсь, является там текстом, ничто не полагает. Я знаю о ПОИ Apache, однако оно не включает поддержку DOCX прямо сейчас, ничто там?
Установка цвета, эстетического для каждой геометрии, на постоянную может помочь. Вот небольшой пример:
require(ggplot2)
set.seed(666)
N<-20
foo<-data.frame(x=1:N,y=runif(N),z=runif(N))
p<-ggplot(foo)
p<-p+geom_line(aes(x,y,colour="Theory"))
p<-p+geom_point(aes(x,z,colour="Practice"))
#Optional, if you want your own colours
p<-p+scale_colour_manual("Source",c('blue','red'))
print(p)
-121--4716276- Существует быстрое и грязное решение, которое просто перемещает окно по целевому изображению и вычисляет некоторую меру подобия в каждом местоположении, затем выбирает местоположение с наивысшим сходством. Затем вы сравниваете сходство с порогом, если оценка выше порога, вы делаете вывод, что изображение там и это место; если оценка ниже порогового значения, то изображения нет.
В качестве меры подобия можно использовать нормализованную корреляцию или сумму квадратичных разностей (она же L2 норма). Как говорили люди, это не будет касаться изменений масштаба. Таким образом, вы также многократно масштабируете исходное изображение и повторяете вышеописанный процесс с каждой масштабированной версией. В зависимости от размера входного изображения и диапазона возможных масштабов, это может быть достаточно хорошо, и это легко реализовать.
Правильным решением является использование аффинных инвариантов. Попробуйте посмотреть на «соответствие стереофонической линии», люди посмотрели на эту проблему в этом контексте. Используемые методы обычно примерно такие:
В конце этого этапа у вас будет набор дескрипторов.
При некотором гуглинге я обнаружил OpenXML4J . Это может решить вашу проблему. Я не использовал это, прежде чем я уверен, что кто-то в сообществе получит лучшее понимание.
Примечание: Это дублирующий вопрос. Это имеет решение плюс немного обсуждения. Ссылка на вопрос.
Если вам не нужна информация о форматировании, изображения и другие интересные вещи, тогда работа будет намного проще . Достаточно от 5 до 10 строк кода.
Это применимо, только если вам нужен только текст .