5
ответов

Как проанализировать уродливый HTML в Python, пользуясь стандартными библиотеками

Существуют так многие HTML и xml библиотеки, встроенные в Python, что трудно полагать, что нет никакой поддержки реального парсинга HTML. Я нашел много больших сторонних библиотек для этой задачи...
вопрос задан: 21 April 2010 04:47
5
ответов

BeautifulSoup - получить значение из внутреннего тега [duplicate]

У меня есть следующий код Python: для документа в курсоре: deal_url = document ['deal_link'] soup = helpers.get_page_soup (deal_url), если суп: image_link = soup.find ("meta" ...
вопрос задан: 10 April 2010 07:53
5
ответов

Мне нужно человекочитаемое, все же способный синтаксическим анализом формат документа

Я работаю над одним из тех проектов, где существует миллион лучших способов выполнить то, в чем я нуждаюсь, но у меня нет выбора, и я должен сделать это этот путь.Вот: Существует веб-форма, когда пользователь...
вопрос задан: 7 April 2010 21:13
5
ответов

Лучший способ обработать большой XML в PHP [дубликат]

Я должен проанализировать большие XML-файлы в php, один из них - 6,5 МБ, и они могли быть еще больше. Расширение SimpleXML, поскольку я читал, загружает весь файл в объект, который не может быть очень эффективным....
вопрос задан: 14 March 2010 19:57
5
ответов

Как я должен пойти о создании простого LR-анализатора?

Я пытаюсь создать простой LR-анализатор для типа шаблона (конфигурация) файл, который будет использоваться для генерации некоторых других файлов. Я читал и читал о LR-анализаторах, но я просто не могу казаться...
вопрос задан: 23 February 2010 19:23
5
ответов

Есть ли встроенное или больше Pythonic способ попытаться проанализировать строку к целому числу

Я должен был записать следующую функцию для сбоя корректно при попытке проанализировать строку к целому числу. Я предположил бы, что Python встроили что-то, чтобы сделать это, но я не могу найти его. В противном случае есть ли...
вопрос задан: 14 February 2010 10:01
5
ответов

Лучший способ маркировать и проанализировать языки программирования в моем [закрытом] приложении

Я работаю над инструментом, который выполнит некоторые простые преобразования на программах (как метод извлечения). Чтобы сделать это, я должен буду выполнить первые несколько шагов компиляции (маркирование, анализируя и...
вопрос задан: 12 February 2010 15:32
5
ответов

Создайте модель естественного языка, которая фиксирует орфографические ошибки

Что является книгами о том, как создать программу синтаксического анализа естественных языков как это: вход: Я добрался до ВЫСОКОГО, который Вы производите: Я добрался, чтобы СКАЗАТЬ, что Вы вводите: Большое поле RAT произвело: Большое поле RED в: ого-го
вопрос задан: 10 February 2010 13:14
5
ответов

Java: исходный код Java синтаксического анализа, извлеките методы

Я хочу проанализировать файлы исходного кода Java и извлечь исходный код методов. Мне был бы нужен метод как это: / ** Возвраты карта с ключом = имя метода; оцените = исходный код метода */Карта <Строка...
вопрос задан: 5 February 2010 09:08
5
ответов

Как я анализирую частичный HTML?

Я пытаюсь проанализировать некоторый HTML с DOM в PHP, но у меня есть некоторые проблемы. Во-первых, в случае, если это изменение, решением, HTML, который я имею, не является полная страница, скорее это - только часть его. <!-...
вопрос задан: 19 December 2009 17:46
5
ответов

Что имеют в виду люди, когда они говорят, что “Perl очень хорош в парсинге”? [закрытый]

Что имеют в виду люди, когда они говорят, что "Perl очень хорош в парсинге"? Как Perl немного лучше или более мощен, чем другие языки сценариев, такие как Python или Ruby?
вопрос задан: 14 December 2009 06:59
5
ответов

Почему не может DateTime. Синтаксический анализ синтаксического анализа дата UTC

Почему не может он анализировать это: DateTime. Синтаксический анализ ("вторник, 1 января 2008 0:00:00 UTC")
вопрос задан: 18 November 2009 15:08
5
ответов

как создать синтаксический анализатор для поисковых запросов

например, я должен был бы создать что-то как синтаксический анализатор поискового запроса Google для парсинга таких выражений как: полет пешим туризмом или плавание - "** идущий в начальных загрузках **" ** автор: ** hamish ** автор: ** reid или
вопрос задан: 7 November 2009 17:49
5
ответов

Там методы Платформы.NET должны проанализировать электронное письмо (MIME)?

Существует ли класс или набор функций, встроенных в Платформу.NET (3.5 +) для парсинга необработанных электронных писем (документы MIME)? Я ничего не ищу воображение или отдельная библиотека, это должно быть встроено. Я'...
вопрос задан: 3 November 2009 19:59
5
ответов

Существует ли синтаксический анализатор Java для языка Java?

Я ищу библиотеку Java, которая позволяет мне анализировать исходный файл Java, и это дает мне представление AST кода. На самом деле я только интересуюсь классом и определениями метода с...
вопрос задан: 31 October 2009 21:48
5
ответов

Как я могу проанализировать строку HTML в Java?

Учитывая строку" <таблица> <TR> <td> Привет Мир! </td> </TR> </таблица>", что (самый легкий) путь состоит в том, чтобы получить Элемент DOM, представляющий его?
вопрос задан: 19 October 2009 17:19
5
ответов

Python и парсинг сообщения IRC

Что лучший способ состоит в том, чтобы проанализировать сообщения, полученные от сервера IRC с Python согласно RFC? Я просто хочу некоторый список/независимо от того, что, например: :test!~test@test.com PRIVMSG #channel:Привет!...
вопрос задан: 18 October 2009 16:00
5
ответов

Синтаксический анализатор, как к в.NET

Я хотел бы понять, как создать синтаксический анализатор в.NET для обработки исходных файлов. Например, возможно, я мог начать путем изучения, как проанализировать SQL или HTML или CSS и затем действовать на результаты, чтобы быть в состоянии к...
вопрос задан: 15 October 2009 20:05
5
ответов

То, как я анализирую поля в запятой, разделило строку с помощью sscanf при поддержке пустых полей?

У меня есть разделенная строка запятой, которая могла бы содержать пустые поля. Например: 1,2, 4 Используя основной sscanf (строка", % [^], % [^], % [^], % [^], % [^]", &val1, &val2, &val3, &val4); я...
вопрос задан: 2 October 2009 13:20
5
ответов

C библиотека для парсинга [закрытого] времени даты

Тот, знающий о функции парсинга даты для c. Я ищу что-то как: время = parse_time ("9/10/2009"); printf (" %d\n", время-> дата); time2 = parse_time ("понедельник 10-го сентября 2009")...
вопрос задан: 12 September 2009 03:30
5
ответов

Почему не может DateTime. ParseExact () анализируют “9/1/2009” с помощью “M/d/yyyy”

У меня есть строка, которая похожа на это: "9/1/2009". Я хочу преобразовать его в объект DateTime (использующий C#). Это работает: DateTime. Синтаксический анализ ("9/1/2009", новый CultureInfo ("en-США")); Но я не понимаю по
вопрос задан: 2 September 2009 16:51
5
ответов

Хороший парсер-генератор (думают lex/yacc или antlr) для.NET? Время изготовления только? [закрытый]

Существует ли хороший парсер-генератор (думайте lex/yacc или antlr) для.NET? Кто-либо, которые имеют лицензию, которая не испугала бы адвокатов? Партия LGPL, но я работаю над встроенными компонентами и некоторыми организациями...
вопрос задан: 20 August 2009 12:16
5
ответов

Perl может быть “статически” проанализирован?

Статья, названная "Perl, не может быть проанализирована, формальное доказательство" делает раунды. Так, Perl решает значение своего проанализированного кода в или "время компиляции" "во время выполнения"? В некоторых обсужден
вопрос задан: 14 August 2009 23:24
5
ответов

Строка даты синтаксического анализа PHP

Если у меня есть строка даты: $date = "08/20/2009"; И я хочу разделить каждую часть даты: $m = "08"; $d = "20"; $y = "2009"; Как я сделал бы так? Есть ли специальная функция даты, которой я должен быть...
вопрос задан: 14 August 2009 17:20
5
ответов

Как я могу создать Генератор Таблицы истинности?

Я надеюсь писать Генератор Таблицы истинности как персональный проект. Существует несколько веб-онлайн здесь и здесь. (Снимок экрана в качестве примера существующего Генератора Таблицы истинности) я имею...
вопрос задан: 6 July 2009 06:44
5
ответов

Как я могу удостовериться весь свой код Python “компиляции”?

Мое образование является C и C++. Мне нравится Python много, но существует один аспект его (и другие интерпретируемые языки, которые я предполагаю), который действительно тверд работать с тем, когда Вы привыкли к скомпилированным языкам. Когда я'...
вопрос задан: 22 June 2009 19:26
5
ответов

Есть ли более быстрые синтаксические анализаторы XML в Java, чем [закрытый] Xalan/Xerces

Я не нашел много способов увеличить производительность JAVA-приложения, которое делает интенсивную обработку XML кроме усилить аппаратные средства, такие как Tarari или Datapower. Делает любой знает о любом, открываются...
вопрос задан: 6 June 2009 19:56
5
ответов

Компонуемые грамматики

Существует столько языков программирования, которые поддерживают включение мини-языков. PHP встраивается в HTML. XML может быть встроен в JavaScript. Linq может быть встроен в C#. Регулярный...
вопрос задан: 4 June 2009 21:29
5
ответов

Как предотвратить нападения инжекции JavaScript в сгенерированном пользователями HTML

Я сохраняю отправленный пользователями HTML (в базе данных). Я должен предотвратить нападения инжекции JavaScript. Самым пагубным, который я видел, является сценарий в стиле = "выражение (...)". В дополнение к этому, ярмарке...
вопрос задан: 2 June 2009 11:00
5
ответов

Как сохранить пробел перед элементом документа при парсинге с Java?

В моем приложении я изменяю некоторую часть XML-файлов, которые начинаются как это: <? версия xml = "1.0" кодирование = "UTF-8"?> <! - $Id: управление версиями yadda-yadda $-> <myElement>... Примечание...
вопрос задан: 15 May 2009 14:08