Обратимый словарь для Python

Question

Обратимый словарь для Python

Я хотел бы добавить больше информации к другим хорошим ответам.

Безопасность потоков подразумевает, что несколько потоков могут записывать / считывать данные в одном и том же объекте без ошибок несовместимости памяти. В многопоточных программах многопоточная программа не вызывает побочных эффектов для общих данных .

Посмотрите на этот вопрос SE для более подробной информации:

Что означает потокобезопасность?

Поточно-ориентированная программа гарантирует согласованность памяти [тысяча сто сорок-два]. [+1135]

Из страницы документации оракула по расширенному параллельному API:

Свойства согласованности памяти:

Глава 17 Спецификации языка Java ™ определяет отношение «происходит до» в операциях с памятью, таких как чтение и запись общих переменных. Результаты записи одним потоком гарантированно будут видимы для чтения другим потоком, только если операция записи происходит - до операции чтения .

Конструкции synchronized и volatile, а также методы Thread.start() и Thread.join() могут образовывать отношения , предшествующие .

Методы всех классов в java.util.concurrent и его подпакетах расширяют эти гарантии до синхронизации более высокого уровня. В частности:

Действия в потоке перед помещением объекта в любую параллельную коллекцию выполняются до выполнения действий после доступа или удаления этого элемента из коллекции в другом потоке.

Действия в потоке перед отправкой Runnable в Executor происходят до того, как начнется его выполнение. Аналогично для Callables, представленных в ExecutorService.

Действия, предпринятые асинхронными вычислениями, представленными Future действиями до события после получения результата через Future.get() в другом потоке.

Действия до «освобождения» методов синхронизатора , таких как Lock.unlock, Semaphore.release, and CountDownLatch.countDown, выполняются перед действиями после успешного метода «получения», такого как Lock.lock, Semaphore.acquire, Condition.await, and CountDownLatch.await, на том же объекте синхронизатора в другом потоке.
]
Для каждой пары потоков, которые успешно обмениваются объектами через Exchanger, действия, предшествующие exchange() в каждом потоке, выполняются до действий, следующих за соответствующим exchange () в другом потоке.

Действия перед вызовом CyclicBarrier.await и Phaser.awaitAdvance (а также их варианты) происходят перед действиями, выполняемыми барьерным действием, и действиями, выполняемыми барьерным действием, выполняются до действий, следующих за успешным возвратом из соответствующего жду в других темах.

9

python dictionary hashtable

задан Alex J 30 June 2009 в 12:40

6 ответов

Если ваши ключи и значения не пересекаются, один из очевидных подходов - просто сохранить их в одном dict. то есть:

class BidirectionalDict(dict):
    def __setitem__(self, key, val):
        dict.__setitem__(self, key, val)
        dict.__setitem__(self, val, key)

    def __delitem__(self, key):
        dict.__delitem__(self, self[key])
        dict.__delitem__(self, key)

d = BidirectionalDict()
d['foo'] = 4
print d[4]   # Prints 'foo'

(Вы также, вероятно, захотите реализовать такие вещи, как __ init __ , update и iter * , чтобы они действовали как настоящий dict, в зависимости от

Это должно включать только один поиск, хотя может и не сэкономить много памяти (в конце концов, у вас все равно вдвое больше записей dict). Однако обратите внимание, что ни этот, ни ваш оригинал не будут использовать вдвое больше места: dict занимает место только для ссылок (фактически указателей), плюс накладные расходы на превышение доступности.

11

ответ дан 4 December 2019 в 08:34

В «Искусство компьютерного программирования» в Vokume 3 Knuth есть раздел поиска вторичных ключей. Для целей вашего вопроса значение можно рассматривать как вторичный ключ.

Первое предложение - сделать то, что вы сделали: сделать эффективный индекс ключей по значению.

Второе предложение - установить большой btree, который является составным индексом кластеризованных данных, где узлы ветвления содержат значения, а листья содержат ключевые данные и указатели на более крупную запись (если она есть).

Если данные являются геометрическими (как у вас) be) есть вещи, называемые почтовыми деревьями. Он может ответить на такие вопросы, как ближайший объект к точке x. Вот несколько примеров: http: //simsearch.yury. name / russir / 01nncourse-hand.pdf Другой простой вариант для этого типа запросов - дерево квадратов и дерево kd. http://en.wikipedia.org/wiki/Quadtree

Другой последний вариант - комбинаторное хеширование, при котором вы объединяете ключ и значение в особый вид хеша, который позволяет вам выполнять эффективный поиск по хешу, даже когда у вас нет обеих ценностей. Я не смог найти хорошее объяснение комбинаторного хеша в Интернете, но оно есть в TAoCP, Volume 3 Second Edition на странице 573.

Конечно, для некоторых из них вам, возможно, придется написать свой собственный код. Но если память или производительность действительно важны, вы можете не торопиться.

где вы объединяете ключ и значение в особый вид хэша, который позволяет выполнять эффективный поиск по хешу, даже если у вас нет обоих значений. Я не смог найти хорошее объяснение комбинаторного хеша в Интернете, но оно есть в TAoCP, Volume 3 Second Edition на странице 573.

Конечно, для некоторых из них вам, возможно, придется написать свой собственный код. Но если память или производительность действительно важны, вы можете не торопиться.

где вы объединяете ключ и значение в особый вид хэша, который позволяет выполнять эффективный поиск по хешу, даже если у вас нет обоих значений. Я не смог найти хорошее объяснение комбинаторного хеша в Интернете, но оно есть в TAoCP, Volume 3 Second Edition на странице 573.

Конечно, для некоторых из них вам, возможно, придется написать свой собственный код. Но если память или производительность действительно важны, вы можете не торопиться.

3

ответ дан 4 December 2019 в 08:34

Вставить перевернутую пару (ключ, значение) в один и тот же dict:

a = {1:'a', 2:'b'}
a.update(dict((v, k) for k, v in a.iteritems()))

Тогда вы сможете сделать и то, и другое, как вам нужно:

print a[1]
print a['a']

0

ответ дан 4 December 2019 в 08:34

Вот другое решение с использованием определенного пользователем класса.

И код ...

# search a dictionary for key or value
# using named functions or a class
# tested with Python25 by Ene Uran 01/19/2008

def find_key(dic, val):
    """return the key of dictionary dic given the value"""
    return [k for k, v in symbol_dic.iteritems() if v == val][0]

def find_value(dic, key):
    """return the value of dictionary dic given the key"""
    return dic[key]

class Lookup(dict):
    """
    a dictionary which can lookup value by key, or keys by value
    """
    def __init__(self, items=[]):
        """items can be a list of pair_lists or a dictionary"""
        dict.__init__(self, items)

    def get_key(self, value):
        """find the key(s) as a list given a value"""
        return [item[0] for item in self.items() if item[1] == value]

    def get_value(self, key):
        """find the value given a key"""
        return self[key]

0

ответ дан 4 December 2019 в 08:34

Он не должен использовать «вдвое больше места». Словари просто хранят ссылки на данные, а не сами данные. Итак, если у вас есть миллион строк, занимающих миллиард байтов, то каждый словарь занимает, возможно, дополнительные 10-20 миллионов байтов - крошечную долю от общего хранилища. Использование двух словарей - это правильно.

1

ответ дан 4 December 2019 в 08:34

Другие вопросы по тегам:

python dictionary hashtable

Обратимый словарь для Python

6 ответов

Похожие вопросы: