6
ответов

Противоположность фильтра Цветка?

Я пытаюсь оптимизировать часть программного обеспечения, которое является в основном рабочими миллионами тестов. Эти тесты сгенерированы таким способом, которым могут быть некоторые повторения. Конечно, я не хочу тратить...
вопрос задан: 11 March 2009 18:18
4
ответа

Эффективный способ памяти потребности сохранить тонны строк (был: реализация ШЛЯПЫ-Trie в Java)

Я работаю с большим набором (5-20 миллионов) Строковых ключей (символы средней длины 10), который я должен сохранить в в структуре данных оперативной памяти, которая поддерживает следующую операцию в постоянное время или...
вопрос задан: 29 October 2010 18:43
2
ответа

Сколько хеш-функций мой цветок фильтрует потребность?

Википедия говорит: пустой фильтр Цветка является небольшим массивом m битов, всего набора к 0. Должны также быть k различные определенные хеш-функции, каждый из которых отображает или хеширует некоторый элемент набора к одному из m...
вопрос задан: 14 November 2018 07:00
2
ответа

компактной структуре данных нравится набор

я ищу определенную структуру данных, но я забыл ее имя. если бы я знал имя, то это было бы тривиально, я просто искал бы его в Википедии :) в основном, это похоже на набор - кроме Вас, не может...
вопрос задан: 10 August 2009 13:56
2
ответа

Современный, высокопроизводительный цветок просачивается Python?

Я ищу производственную качественную реализацию фильтра цветка в Python для обработки довольно больших количеств объектов (скажите 100M 1B объекты с ложным положительным уровнем на 0,01%). Pybloom является одной опцией, но этим...
вопрос задан: 22 November 2008 05:31
0
ответов

Guava Bloom Filter не поддерживает большие вставки?

Я использовал BloomFilter в guava v.11.0.1, и, похоже, я получаю исключение, когда у меня прошивка большая. Я попробовал 10 миллионов с 0,001 кадра на пиксель, и это не удалось. java.lang ....
вопрос задан: 14 November 2018 06:57
0
ответов

Какие хэш-функции использовать в фильтре Блума

У меня следующий вопрос по выбору хеш-функций для фильтров Блума :Какие функции использовать? Почти в каждом документе/бумаге вы можете прочитать, что хэш-функции, используемые в фильтре Блума...
вопрос задан: 14 November 2018 06:57
0
ответов

Когда полезен фильтр Блума?

Я понимаю, что делает фильтры Блума привлекательной структурой данных; однако мне трудно понять, когда их можно использовать, поскольку вам все равно придется выполнять дорогостоящую операцию ...
вопрос задан: 25 September 2016 05:43
0
ответов

Реализация фильтра Блума

Используя фильтр Блума, мы получим оптимизацию пространства. Фреймворк cassandra также имеет реализацию Bloom Filter. Но подробно, как достигается эта оптимизация пространства?
вопрос задан: 13 March 2016 15:50
0
ответов

What is the advantage to using bloom filters?

I am reading up on bloom filters and they just seem silly. Anything you can accomplish with a bloom filter, you could accomplish in less space, more efficiently, using a single hash function rather ...
вопрос задан: 26 January 2016 04:54
0
ответов

Фильтр Блума в Java

В основном мне нужно реализовать bloom filter и проверьте его с помощью символов от «a» до «z» и от «A» до «Z» (легко и готово). Затем мне нужно проверить ложные срабатывания, но в требованиях указано использовать от «aa» до «ZZ» (...
вопрос задан: 20 May 2015 19:21
0
ответов

Как сопоставить вывод хеш-функции с индексами фильтра цветения?

Может ли кто-нибудь помочь мне, предоставив схему того, как вывод хеш-функции сопоставляется с индексами фильтра Блума? Вот обзор фильтров цветения.
вопрос задан: 10 February 2013 09:14
0
ответов

Почти обнаружение дубликатов в потоках данных

В настоящее время я работаю над потоковым API, который генерирует много текстового контента. Как и ожидалось, API выдает много дубликатов, и у нас также есть бизнес-требование фильтровать почти дубликаты...
вопрос задан: 21 November 2012 10:59
0
ответов

Эффективная реализация фильтра Блума на C?

Этот вопрос уже задавался ранее, но в то время на него не было ответа, поэтому я решил задать его снова. Мне нужна эффективная реализация фильтра Блума на C (не на C++). Если нет...
вопрос задан: 13 June 2012 11:02
0
ответов

Какие методы хеширования использовать при построении фильтра Блума в Clojure?

Я хочу создать фильтр Блума в Clojure, но у меня мало знаний обо всех библиотеках хеширования, которые могут быть доступны для языков на основе JVM. Что мне следует использовать для самого быстрого (в отличие от ...
вопрос задан: 4 March 2012 10:59
0
ответов

Фильтр Блума для хранения только последних 50 данных.

В моей системе будет один главный узел и n подчиненных узлов, где главный узел будет распространять входящий запрос на один из своих подчиненных узлов. Чтобы использовать кэш-память ...
вопрос задан: 12 February 2012 17:39
0
ответов

Вычисление приблизительной популяции фильтра bloom

Даны фильтр bloom размером N бит и K хэш-функций, из которых M бит (где M <= N) заданы. Можно ли приближенно определить количество элементов, вставляемых в фильтр Блюма? ...
вопрос задан: 2 February 2012 04:31
0
ответов

Доступны ли какие-либо реализации фильтров Блумье?

Я натолкнулся на довольно много теории относительно фильтров Блумье, но мне не удалось найти их реальную реализацию (не повезло с github, sourcefoge, google и т. Д. .). Кто-нибудь знает о ...
вопрос задан: 17 August 2011 07:11
0
ответов

Bloomfilter and Cassandra = Why used and why hashed several times?

I Read this: http://spyced.blogspot.com/2009/01/all-you-ever-wanted-to-know-about.html My Questions: 1.) Is it correct, that Cassandra only uses the bloom filter, to find out the SST (Sorted String ...
вопрос задан: 2 May 2011 00:40