Обработка естественного языка в [закрытом] Ruby

Это происходит, вероятно, из-за разрешения, запрещенного MySQL. Хотя вы устанавливаете datadir=/drbd0/mysql/data, но по умолчанию MySql set socket = /var/lib/mysql/mysql.sock, поэтому у вас должны быть права доступа к этому каталогу.

less /etc/group

, а затем

less /etc/passwd

находят пользователя и имя пользователя mysql, по умолчанию это пользователь mysql в группе mysql.

измените на mysql dir, возможно, /var/lib/mysql, а затем введите cd .., чтобы перейти на один каталог вверх.

chown -R mysql:mysql ./mysql/

Замените mysql:mysql на что-то другое, если групповые и пользовательские привилегии называются по-другому

64
задан Community 23 May 2017 в 12:02
поделиться

4 ответа

В Ruby Linguistics есть кое-что и несколько ссылок оттуда, хотя это не кажется нигде близким к тому, что NLTK для Python, тем не менее .

23
ответ дан 24 November 2019 в 15:50
поделиться

Вы всегда можете использовать jruby и использовать библиотеки java.

РЕДАКТИРОВАТЬ: Возможность делать ruby ​​изначально на jvm и легко использовать библиотеки java - большой плюс для рубистов. Это хороший вариант, который следует рассмотреть в такой ситуации.

Какой набор инструментов НЛП использовать в JAVA?

11
ответ дан 24 November 2019 в 15:50
поделиться

Здесь я нашел отличную статью с подробным описанием некоторых алгоритмов НЛП в Ruby . Сюда входят стеммеры, парсеры даты и времени и грамматические парсеры.

9
ответ дан 24 November 2019 в 15:50
поделиться

Python:

Я по-прежнему умеренный пользователь Python, поэтому мои жалобы могут быть связаны с отсутствием знаний или неправильным использованием. Комментарии приветствуются. Я действительно люблю этот язык.

  1. Плохая поддержка потоков и GIL. Если вы хотите использовать многоядерную платформу, большинство программистов на Python, вероятно, порекомендуют многопроцессорность или что-то еще, не используйте потоки. Это не даст вам ожидаемой производительности.
  2. свойство только для переменной экземпляра. _class_var = property (classmethod (some_method)) просто не сработает. Как я могу получить переменную класса, обернутую свойством?
  3. нет контроля доступа. Все элементы управления доступом представляют собой искажение синтаксиса. Например, private - это __private, protect - это _protected и т. Д. И надеюсь, что все, кто программирует python, следует соглашению об именах. Да ладно, мы можем добиться большего.
  4. Я согласен с философией python, заключающейся в простом и ясном синтаксисе, но, на мой взгляд, некоторый простой и понятный синтаксис, который не поддерживается, кажется признаком здравого смысла. Например, a ++, ++ a, a-- и --a, самоудаление / инкремент, что с ними не так? foo = (a> b? a: b) унарная операция, что с ней не так? (Я знаю, что в py2.6 есть что-то подобное, но, учитывая массовую поддержку почти всех других языков для этого простого синтаксиса, зачем изобретать велосипед? почему бы просто не следовать лучшим практикам? Разве хорошая вещь не должна просто оставаться в хорошей «форме»?)
  5. Программа для интерфейса. У Python нет интерфейса или концепции абстрактного класса (в py3k есть что-то под названием abc), все конкретно. Я думаю, что предоставление ключевого слова interface или abstract для построения скелета класса и наследования и расширения охранного класса было бы неплохой идеей. Это помогает при проектировании сверху вниз. В настоящее время мне просто нужно заполнить каждый из методов NotImplementedError, что довольно утомительно.
  6. Я должен добавить это. версия ниже 3.x имеет типы str и unicode. Это настоящий кошмар. Это делает смешивание ascii и не-ascii / unicode с большей вероятностью (плохо, плохо)

. Я видел, как люди жалуются на скорость. Я этого не понимаю. Это язык интерпретации, код не компилируется в машинный код до времени выполнения, такова его природа. Невозможно сравнить скорость интерпретируемого языка с компилируемым. Насколько я понимаю, среди языков интерпретации / написания сценариев python не медленный.

Ограничение себя конкретным языком нормально для некоторых задач, где общие инструменты реализованы повсюду, но НЛП не входит в их число.

Другой проблемой при работе с Twitter является большое количество предложений, которые будут наполовину испечены или сжатым странным и чудесным образом - для чего большинство инструментов НЛП не обучены. Чтобы помочь в этом, NUS SMS Corpus состоит из «около 10 000 SMS-сообщений, собранных студентами». Из-за аналогичных ограничений и использования, анализ этого может быть полезен в ваших исследованиях с Твиттером.

Если вы более конкретны, я постараюсь перечислить некоторые инструменты, которые помогут.

Другой проблемой при работе с Twitter является то, что многие предложения будут наполовину запечены или сжаты странным и чудесным образом - для чего большинство инструментов НЛП не обучено. Чтобы помочь в этом, NUS SMS Corpus состоит из «около 10 000 SMS-сообщений, собранных студентами». Из-за аналогичных ограничений и использования, анализ этого может быть полезен в ваших исследованиях с Твиттером.

Если вы более конкретны, я постараюсь перечислить некоторые инструменты, которые помогут.

Другой проблемой при работе с Twitter является то, что многие предложения будут наполовину запечены или сжаты странным и чудесным образом - для чего большинство инструментов НЛП не обучено. Чтобы помочь в этом, NUS SMS Corpus состоит из «около 10 000 SMS-сообщений, собранных студентами». Из-за аналогичных ограничений и использования, анализ этого может быть полезен в ваших исследованиях с Твиттером.

Если вы более конкретны, я постараюсь перечислить некоторые инструменты, которые помогут.

2
ответ дан 24 November 2019 в 15:50
поделиться
Другие вопросы по тегам:

Похожие вопросы: