Я пытаюсь оптимизировать часть программного обеспечения, которое является в основном рабочими миллионами тестов. Эти тесты сгенерированы таким способом, которым могут быть некоторые повторения. Конечно, я не хочу тратить...
Я работаю с большим набором (5-20 миллионов) Строковых ключей (символы средней длины 10), который я должен сохранить в в структуре данных оперативной памяти, которая поддерживает следующую операцию в постоянное время или...
Википедия говорит: пустой фильтр Цветка является небольшим массивом m битов, всего набора к 0. Должны также быть k различные определенные хеш-функции, каждый из которых отображает или хеширует некоторый элемент набора к одному из m...
я ищу определенную структуру данных, но я забыл ее имя. если бы я знал имя, то это было бы тривиально, я просто искал бы его в Википедии :) в основном, это похоже на набор - кроме Вас, не может...
Я ищу производственную качественную реализацию фильтра цветка в Python для обработки довольно больших количеств объектов (скажите 100M 1B объекты с ложным положительным уровнем на 0,01%). Pybloom является одной опцией, но этим...
Я использовал BloomFilter в guava v.11.0.1, и, похоже, я получаю исключение, когда у меня прошивка большая. Я попробовал 10 миллионов с 0,001 кадра на пиксель, и это не удалось. java.lang ....
У меня следующий вопрос по выбору хеш-функций для фильтров Блума :Какие функции использовать? Почти в каждом документе/бумаге вы можете прочитать, что хэш-функции, используемые в фильтре Блума...
Я понимаю, что делает фильтры Блума привлекательной структурой данных; однако мне трудно понять, когда их можно использовать, поскольку вам все равно придется выполнять дорогостоящую операцию ...
Используя фильтр Блума, мы получим оптимизацию пространства. Фреймворк cassandra также имеет реализацию Bloom Filter. Но подробно, как достигается эта оптимизация пространства?
I am reading up on bloom filters and they just seem silly. Anything you can accomplish with a bloom filter, you could accomplish in less space, more efficiently, using a single hash function rather ...
В основном мне нужно реализовать bloom filter и проверьте его с помощью символов от «a» до «z» и от «A» до «Z» (легко и готово). Затем мне нужно проверить ложные срабатывания, но в требованиях указано использовать от «aa» до «ZZ» (...
В настоящее время я работаю над потоковым API, который генерирует много текстового контента. Как и ожидалось, API выдает много дубликатов, и у нас также есть бизнес-требование фильтровать почти дубликаты...
Этот вопрос уже задавался ранее, но в то время на него не было ответа, поэтому я решил задать его снова. Мне нужна эффективная реализация фильтра Блума на C (не на C++). Если нет...
Я хочу создать фильтр Блума в Clojure, но у меня мало знаний обо всех библиотеках хеширования, которые могут быть доступны для языков на основе JVM. Что мне следует использовать для самого быстрого (в отличие от ...
В моей системе будет один главный узел и n подчиненных узлов, где главный узел будет распространять входящий запрос на один из своих подчиненных узлов. Чтобы использовать кэш-память ...
Даны фильтр bloom размером N бит и K хэш-функций, из которых M бит (где M <= N) заданы. Можно ли приближенно определить количество элементов, вставляемых в фильтр Блюма?
...
Я натолкнулся на довольно много теории относительно фильтров Блумье, но мне не удалось найти их реальную реализацию (не повезло с github, sourcefoge, google и т. Д. .). Кто-нибудь знает о ...
I Read this:
http://spyced.blogspot.com/2009/01/all-you-ever-wanted-to-know-about.html My Questions: 1.) Is it correct, that Cassandra only uses the bloom filter, to find out the SST (Sorted String ...