Бинаризация в обработке естественного языка

К сожалению, нет формата, в который вы можете экспортировать, который сохранит пользовательский граф узлов из Blender и поместит его в движок реального времени, на момент написания этой статьи. Все, что вы сможете сделать, - это одна текстура для сокета Principled BSDF. В экспортере glTF есть возможность включить преобразования текстур (вращение, масштабирование, повтор), если это поможет.

Для чего-то подобного, я бы предложил добавить имена и пользовательские свойства (текстовые или числовые) в ваши материалы. Если в настройках экспорта включена опция «Экспорт пользовательских свойств / дополнений», они будут переданы в тройки как material.userData, и из этого вы сможете восстановить граф узлов.

11
задан Davide 18 November 2009 в 06:58
поделиться

3 ответа

Это - на самом деле действительно сложный вопрос. Первое решение, которое необходимо принять, состоит в том ли к lemmatize входные маркеры (слова). Если Вы делаете это, Вы существенно уменьшаете свое количество типа, и Ваш парсинг синтаксиса становится намного менее сложным. Однако требуется большая работа к lemmatize маркер. Теперь, на языке программирования, эта задача значительно уменьшается, как большинство языков отдельные ключевые слова или имена переменной с четко определенным набором символов, как пробел или период или этажерка.

Второе важнейшее решение - то, что Вы собираетесь сделать с данными post-facto. Метод "сумки слов", в двоичной форме, которую Вы представили, игнорирует порядок слов, который прекрасен абсолютно, если Вы делаете реферирование текста или возможно поиск стиля Google, где Вы не заботитесь, где слова появляются, пока они появляются. С другой стороны, при создании чего-то как компилятор или синтаксический анализатор порядок очень важен. Можно использовать маркерно-векторный подход (в качестве во втором абзаце), или можно расшириться, сумка слов приближаются таким образом, что каждая ненулевая запись в векторе сумки слов содержит линейное индексное положение маркера во фразе.

Наконец, если бы Вы собираетесь быть деревьями синтаксического анализа здания, существуют очевидные причины, почему Вы хотели бы пойти с маркерно-векторным подходом, поскольку это - большая стычка для поддержания идентификаторов подфразы для каждого слова в векторе сумки слов, но очень легкий сделать "подвекторы" в маркерном векторе. На самом деле Eric Brill использовал последовательность маркерного идентификатора для своего теггера частей речи, который действительно аккуратен.

Вы возражаете, если я спрашиваю, какая определенная задача Вы продолжаете работать?

4
ответ дан 3 December 2019 в 11:04
поделиться

[Не прямой ответ] Все это зависит от того, что Вы - попытка проанализировать и затем обработать, но для общей короткой человеческой обработки фразы (например, IVT), другой метод должен использовать нейронные сети для изучения шаблонов. Это может быть очень точно для небольшого vocubularies

0
ответ дан 3 December 2019 в 11:04
поделиться

Бинаризация является действием преобразования красочных функций объекта в векторы чисел, чаще всего двоичные векторы, для создания хороших примеров для алгоритмов классификатора.

Я главным образом столкнулся с числовыми функциями, которые принимают значения между 0 и 1 (не двоичный, как Вы описываете), представляя уместность конкретной функции в векторе (между 0% и 100%, где 1 представляет 100%). Типичным примером для этого являются tf-idf векторы: в векторе, представляющем документ (или предложение), у Вас есть значение для каждого термина во всем словаре, который указывает на уместность того термина для представленного документа.

Как Mike уже сказал в своем ответе, это - сложная проблема в широком поле. В дополнение к его указателям Вы могли бы найти полезным изучить некоторые методы информационного поиска как векторно-пространственная модель, классификация векторных пространств и латентно-семантическое индексирование как начальные точки. Кроме того, поле разрешения лексической многозначности много занимается проблемами представления функции в обработке естественного языка.

3
ответ дан 3 December 2019 в 11:04
поделиться
Другие вопросы по тегам:

Похожие вопросы: