Вопросы Теги

Как начать на Извлечении информации?

Этот код не является неправильным, это была проблема с подключением, он всегда был открыт и требовал принудительного закрытия «con.close», используя try и catch внутри функции

        public int getLatestBill()
    {
        DataTable dt = new DataTable();
        try
        {
            command.CommandType = CommandType.Text;
            command.CommandText = "getLatestBill";

            SqlDataAdapter adapt = new SqlDataAdapter(command);
            connect.Open();
            adapt.Fill(dt);
        }
        catch (Exception)
        {
            throw;
        }
        finally
        {
            connect.Close();
        }

        return Convert.ToInt32(dt.Rows[0][0]);
    }

7

information-extraction nlp machine-learning math

задан Ryan Gates 1 May 2013 в 13:38

поделиться

6 ответов

Только ответить на один из комментария. Я больше интересуюсь текстовым Извлечением информации.

В зависимости от природы Вашего проекта могут и пригодиться Обработка естественного языка и Компьютерная лингвистика - они обеспечивают инструменты, чтобы измерить, и извлечь функции из текстовой информации и применить обучение, выигрыш или классификацию.

Хорошие вводные книги включают OReilly's, Программирующий Коллективный разум (главы по "поиску и рейтингу", фильтрация Документа и возможно деревья решений).

Предложенные проекты, использующие это знание: НА МЕСТЕ ПРОДАЖИ (часть речи) метки и выделение именованных сущностей (способность распознать имена, места и даты из простого текста). Можно использовать Википедию в качестве тренировочного корпуса, так как большая часть целевой информации уже извлечена в infoboxes - это могло бы предоставить Вам некоторую ограниченную сумму измерительной обратной связи.

Другой большой молоток в IE является поиском, поле, которое не будет недооценено. Снова, книга OREILLY обеспечивает некоторое введение в основном рейтинге; после того как у Вас есть большой корпус индексируемого текста, можно сделать некоторых действительно задачи IE с ним. Выезд Peter Norvig: Теоретизирование от данных как начальная точка и очень хороший фактор мотивации - возможно, Вы могли повторно реализовать некоторые их результаты как осуществление изучения.

Как предупреждение, я думаю, что обязан сказать Вам, что извлечение информации трудно. Первые 80% любой данной задачи обычно тривиальны; однако, трудность каждого дополнительного процента для задач IE обычно растут экспоненциально - в разработке, и время исследования. Это также вполне underdocumented - большая часть высококачественной информации в настоящее время находится в неясных отчетах (Ученый Google является Вашим другом) - действительно проверяют их, после того как Вам записали Вашу руку пару раз. Но самое главное, не позволяйте этим препятствиям отбросить Вас - существуют, конечно, большие возможности сделать успехи в этой области.

9

ответ дан 6 December 2019 в 07:08

поделиться

Я рекомендовал бы превосходную книгу Введение в Информационный поиск Christopher D. Manning, Prabhakar Raghavan и Hinrich Schütze. Это покрывает широкую область проблем, которые формируют великое и актуальный (2008) основание для Извлечения информации, и доступно онлайн в полном тексте (в соответствии с данной ссылкой).

5

ответ дан 6 December 2019 в 07:08

поделиться

Я предложил бы, чтобы Вы смотрели на Инструментарий естественного языка (nltk) и Книгу NLTK. Оба доступны бесплатно и являются большими средствами обучения.

4

ответ дан 6 December 2019 в 07:08

поделиться

Это немного вне темы, но Вы могли бы хотеть считать Коллективный разум Программирования от O'Reilly. Это имеет дело косвенно с текстовым извлечением информации, и это не принимает большую часть математического фона.

0

ответ дан 6 December 2019 в 07:08

поделиться

Статья Wikipedia Information Extraction является кратким введением.

В большем количестве ученой степени Вы могли бы хотеть просмотреть статью как Интеграция Вероятностных Моделей Извлечения и Анализа данных для Обнаружения Отношений и Шаблонов в тексте.

1

ответ дан 6 December 2019 в 07:08

поделиться

Взгляните здесь , если вам нужна услуга NER корпоративного класса. Разработка системы NER (и учебных комплектов) - это очень трудоемкая и высококвалифицированная задача.

1

ответ дан 6 December 2019 в 07:08

поделиться

Другие вопросы по тегам:

information-extraction nlp machine-learning math

Похожие вопросы: