pull-only repo's 'git status' говорит, что ветвь опережает происхождение/мастер. Почему?

Итак, вот ситуация:

$ git status
# На основной записи филиала
# Ваша ветвь опережает «origin/master» на [x] commits.
#

Об этом уже есть несколько вопросов по SO, но ни один из них, похоже, специально не касается типа сценария, который у меня есть. Этот ответ на один из вопросов подходит ближе всего, но не вдается в подробности.

Я просто процитирую его дословно:

Если вы получите это сообщение после выполнения «git pull remote branch», попробуйте выполнить его с помощью «git fetch».

Выборка, похоже, обновляет локальное представление удаленной ветви, что не обязательно происходит при выполнении «git pull remote branch».

Этот наконечник действительно работает. Но «не обязательно бывает?» Почему бы и нет? Мне нужно это понять. Что тянуть не делать?

Я не хочу брать этот вопрос на себя, так что вот мой сценарий в деталях:

Три компьютера вовлечены. Mac, на котором я разрабатываю, мой домашний сервер, где живет гит репо (т.е. происхождение/мастер) и учетная запись Webfaction, которая извлекается с этого сервера.

Я выполняю commits и git push origin master только на компьютере Mac. Единственная команда, которая когда-либо выполняется на Webfaction как часть обычного рабочего процесса, это git pull origin master (как часть сценария развертывания Fabric). Я не изменяю код там. Я одинокий разработчик, как и никто другой.

Время от времени я регистрируюсь в Webfaction и проверяю все, включая состояние git . Неизбежно я всегда получаю сообщение «Твоя ветвь впереди»... При выполнении команды git fetch сообщение исчезает.

Я собираюсь добавить git fetch к сценарию Fabric, который должен быть выполнен с этой проблемой, но я хочу знать, почему это необходимо сделать, особенно в клоне происхождения/мастера, предназначенном только для извлечения. Я не очень хорошо разбираюсь в Git, хотя ежедневно использую базовую функциональность, поэтому было бы ценно удобное для новичков объяснение.

Обновите по запросу соответствующие биты из config :

[remote "origin"]
    fetch = +refs/heads/*:refs/remotes/origin/*
    url = git@[server_address]:[path/to/repo.git]
[branch "master"]
    remote = origin
    merge = refs/heads/master

-121--1174705-

Нормализация длины в наивном классификаторе Байеса для документов Я пытаюсь реализовать наивный классификатор Байеса для классификации документов, которые по существу наборов (в отличие от пакетов) функций, то есть каждая особенность содержит набор

Я пытаюсь реализовать наивный байесовский классификатор для классификации документов, которые по существу являются наборами (в отличие от пакетов) признаков, то есть каждый признак содержит набор уникальных признаков, каждый из которых может появиться в документе максимум один раз. Например, элементы можно рассматривать как уникальные ключевые слова для документов.

Я внимательно следил за Ренни и др. al.документ на http://www.aaai.org/Papers/ICML/2003/ICML03-081.pdf , но я сталкиваюсь с проблемой, которая, похоже, не решена. А именно, классификация коротких документов приводит к гораздо более высоким задним вероятностям из-за документов, имеющих меньшее количество признаков; наоборот для длинных документов.

Это потому, что задние вероятности определяются как (игнорирование знаменателя):

P(class|document) = P(class) * P(document|class)

, который расширяется до

P(class|document) = P(class) * P(feature1|class) * ... * P(featureK|class)

Из этого ясно, что короткие документы с меньшим количеством признаков будут иметь более высокие задние вероятности просто потому, что есть меньше членов, чтобы умножить вместе.

Например, предположим, что все признаки «foo», «bar» и «baz» обнаруживаются в положительных учебных наблюдениях. Тогда документ с одной особенностью «foo» будет иметь более высокую заднюю вероятность классификации в положительном классе, чем документ с признаками {«foo», «bar», «baz»}. Это кажется контринтуитивным, но я не совсем уверен, как это решить.

Есть ли какая-то нормализация длины, которую можно сделать? Одна идея состоит в том, чтобы добавить размер документа в качестве функции, но это не кажется вполне правильным, поскольку результаты будут искажены размером документов в данных обучения.

5
задан pmc255 9 September 2011 в 17:43
поделиться