Нахождение связанных слов (специфически физические объекты) к определенному слову

Проблема возникает, когда у вашего сервера есть подписанный сертификат. Чтобы обойти это, вы можете добавить этот сертификат в список доверенных сертификатов вашей JVM.

В этой статье автор описывает, как получить сертификат из вашего браузера и добавить его в файл cacerts вашей JVM. Вы можете отредактировать файл JAVA_HOME/jre/lib/security/cacerts или запустить приложение с параметром -Djavax.net.ssl.trustStore. Проверьте, какой JDK / JRE вы используете, так как это часто является источником путаницы.

См. Также: Как разрешены имена серверов сертификатов SSL / Можно ли добавлять альтернативные имена с помощью keytool? Если вы столкнулись с java.security.cert.CertificateException: No name matching localhost found исключением.

18
задан 2 April 2009 в 11:39
поделиться

2 ответа

Я думаю, что Вы просите, источник семантических отношений между понятиями. Для этого я могу думать о многих способах пойти:

  1. алгоритмы Семантической близости . Эти алгоритмы обычно выполняют обход дерева по отношениям в WordNet для предложения счета с реальным знаком того, как связанные два условия. Они будут ограничены тем, как хорошо модели WordNet понятия, которыми Вы интересуетесь. WordNet:: Подобие (записанный в Perl) довольно хорошо.
  2. Попытка с помощью OpenCyc в качестве базы знаний . OpenCyc является версией с открытым исходным кодом Cyc, очень большой базой знаний 'реальных' фактов. Это должно иметь намного более богатый набор сематических отношений, чем WordNet. Однако я никогда не использовал OpenCyc, таким образом, я не могу говорить с тем, насколько завершенный это, или как легкий это должно использовать.
  3. анализ частоты n-грамм . Как упомянуто Jeff Moser. Управляемый данными подход, который может 'обнаружить' отношения от больших объемов данных, но может часто приводить к шумным результатам.
  4. латентно-семантический анализ . Управляемый данными подход, подобный анализу частоты n-грамм, который находит наборы семантически связанных слов.

[...]

Оценка по тому, что Вы говорите, Вы хотите сделать, я думаю, что последние две опции, более вероятно, будут успешны. Если отношения не будут в WordNet тогда, то семантическая близость не будет работать, и OpenCyc, кажется, не знает много приблизительно снукер кроме того, что это существует.

я думаю, комбинация обеих n-грамм и LSA (или что-то как он) была бы хорошей идеей. Частоты n-грамм найдут понятия плотно связанными с Вашим целевым понятием (например, теннисный шар), и LSA нашел бы связанные понятия упомянутыми в том же предложении/документе (например, сеть, подача). Кроме того, если Вы только интересуетесь существительными, фильтруя Ваш вывод для содержания только существительных, или именные группы (при помощи теггер частей речи ) могли бы улучшить результаты.

15
ответ дан 30 November 2019 в 08:53
поделиться

В первом случае Вы, вероятно, ищете n-граммы где n = 2. Можно получить их от мест как Google или создать собственное от вся Википедия .

Для получения дополнительной информации, проверьте этот связанный вопрос о Переполнении стека .

6
ответ дан 30 November 2019 в 08:53
поделиться
Другие вопросы по тегам:

Похожие вопросы: