Как можно было бы пойти о реализации вперед индекс в PHP?

Вы сохраняете данные строки (обычно один из столбцов содержит объект мультимедиа (например, изображение) в виде большого двоичного объекта) в базе данных, которая слишком велика для обработки курсором. Это попытка получить 2108731 байтов, что превышает 2M (2097152 байта), выделенных окну курсора.

Вы не можете использовать методы курсора Android SDK (без изменений) для извлечения такого большого количества данных, даже если вы можете хранить такое количество.

Исправление заключается в том, чтобы сохранить эти данные за большим двоичным объектом (обычно изображения) в виде файла и затем сохранить ссылку на файл (например, его путь или его часть) в базе данных.

Эта ссылка содержит примеры (на основе изображений) и более полный обзор проблемы.

С другой стороны, этот показывает, как можно сохранить такое изображение или изображения, разделив данные по частям.

11
задан Charles 23 December 2012 в 21:33
поделиться

2 ответа

Взгляните на

http://simplehtmldom.sourceforge.net/

Вы делаете что-то вроде

$p = new Simple_dom_parser();
$p->load("www.page.com");
$p->find("body")->plaintext;

И это даст вам весь текст. Хотите перебрать только ссылки

foreach ($p->find("a") as $link)
{
    echo $link->innerText;
}

Это очень полезно и полезно. Проверьте это.

7
ответ дан 3 December 2019 в 09:21
поделиться

Я не думаю, что я полностью понимаю, что вы пытаетесь сделать, но вы можете довольно просто получить простой результат:

  1. Пройдите страницу через Tidy ( хорошее введение ), чтобы убедиться, что у него будет действительный HTML.
  2. Удалите все до (и включая) .
  3. Пошагово просматривайте документ по одному символу за раз.
    1. Если символ представляет собой «<», не делайте ничего со следующими символами, пока не увидите «>» (пропускает HTML)
    2. Если символ является «символом слова» (буквенно-цифровой, дефис, возможно, далее) добавьте его к «текущему слову».
    3. Если символ является «несловным символом» (пунктуация, пробел, возможно, еще), добавьте «текущее слово» в список слов в прямом индексе и очистите «текущее слово».
  4. Делайте выше, пока не нажмете .

Это действительно так, вам, возможно, придется добавить некоторые исключения для обработки таких вещей, как теги