Я пытаюсь извлечь текст из файлов PDF с помощью iFilter. Adobe PDF iFilter, который распределяется с Adobe Reader, ужасен, возвращая сообщения HRESULT E_FAIL для многих документов в формате PDF...
Я пытаюсь написать утилиту C #, которая имитирует поведение filtdump.exe из Windows Search SDK (поскольку filtdump сам по себе не распространяется). Я столкнулся с комбинацией ...
Мне нужно использовать интерфейс IFilter из 32-битного приложения в системах Windows x64. Это просто для файлов .doc, поскольку offfilt.dll поддерживает оба типа сборки. Однако мне также нужно получить простой текст из .docx ...
Для веб-приложения C # я хочу проиндексировать текст из файлов PDF, DOC и т. Д., Хранящихся в базе данных . Я экспериментировал с примером IFilter в Code Project, который отлично подходит для файлов из ...
В настоящее время я использую Castle Windsor версии 2.1 в качестве своего контейнера и хотел бы выполнить интеграционные тесты, используя зарегистрированные в нем службы. В настоящее время я использую Common ...