Вы можете использовать левое соединение, чтобы получить только id
в первом кадре данных, но не во втором, а также сохранить все столбцы вторых кадров данных.
import pandas as pd
df1 = pd.DataFrame(
data={"id": [1, 2, 3, 4], "col1": [9, 8, 7, 6], "col2": [5, 4, 3, 2]},
columns=["id", "col1", "col2"],
)
df2 = pd.DataFrame(
data={"id": [3, 4, 7], "col3": [11, 12, 13], "col4": [15, 16, 17]},
columns=["id", "col3", "col4"],
)
df_1_2 = df1.merge(df2, on="id", how="left", indicator=True)
df_1_not_2 = df_1_2[df_1_2["_merge"] == "left_only"].drop(columns=["_merge"])
, который возвращает
id col1 col2 col3 col4
0 1 9 5 NaN NaN
1 2 8 4 NaN NaN
Существует, некоторые строки между Управлением контентом, управлением конфигурацией, Управлением исходным кодом и обычными средствами управления предприятия (т.е. SAS-70, средства управления SOX).
Эти два отличны, нет никаких отношений надмножества/подмножества.
У Вас есть некоторая информация о предприятии, и у Вас есть инфраструктура для обработки той информации.
Информацией о предприятии являются данные (не обрабатывающий); это часто разделяется между Контент-менеджерами и Реляционными базами данных.
Управление контентом является приложением, которое Вы покупаете (или расширитесь). Это обрабатывает "полуструктурированную" и "неструктурированную" информацию. Например, изображения, ссылки и "содержание". Некоторые люди называют это "Управление активами".
RDBMS является приложением, которое Вы покупаете. Это содержит структурированную информацию.
Средства управления Ordinary Enterprise должны покрыть все эти "производственные" данные - содержание и RDBMS. Если они не сделают, то никакой объем управления контентом или программного обеспечения RDBMS не поможет.
Infrastucture в основном обрабатывает (не данные). Необходимо применить управление конфигурацией как дисциплину. Управление конфигурацией включает все параметры конфигурации во время выполнения, настройки, файлы и этажерку, а также исходный код.
Ваше управление исходным кодом и Ваша конфигурация являются частью обработки актива информации о предприятии.
Я предлагаю, чтобы Вы сфокусировались на управлении конфигурацией - исходный код, настройки, параметры, патчи, и т.д.
Содержание, как данные в управлении базой данных, является ответственностью пользователей, не разработчиков. Технические люди обеспечивают инструменты управления контентом или RDBMS. Но технические люди не берут на себя ответственность за использование информации - конечные пользователи владеют информацией - они могут сделать с ним, как им нравится.
Управление контентом (или "управление активами") будет ручным. Можно купить их инструменты, но пользователи должны разработать свои собственные процессы для использования тех инструментов. И это будет всегда казаться ручным.
В компании я работаю в, мы как разработчики соглашаемся, что всем изменяющимся во время жизненного цикла нашего продукта (продуктов) и управляют различные люди, должен быть размещен в системе управления версиями. Я несколько раз проходил то обсуждение с различными отделами, и оно всегда заканчивалось в 'Хороших звуках, но люди вне разработки не могут обработать системы управления версиями. Таким образом, у нас нет спецификации и т.д. при управлении исходным кодом. Еще хуже, у нас есть части кода, например, файлы ресурсов Java, которые редактируются неразработчиками, которые предположительно не могут работать при управлении исходным кодом и поэтому мы вынуждены проверить файлы, послать им по электронной почте к переводчикам, они, редактируя файлы, передав их обратно, и мы проверяем результаты в кв/см снова (но вероятно работали над ними тем временем и слиянием)..., который является на самом деле короткой версией того, что действительно происходит (даже MS-Excel вовлечен).
Так, мой ответ 'да, Все должно являться объектом управления исходным кодом'. но только кодируйте, когда-либо будет.
Где я работаю, у нас есть все активы, связанные с проектом в управлении исходным кодом, внутренними документами, третье лицо документы API, код, DB SQL, содержание и т.д., целая хижина.
Мы также делаем доступными бизнес-документы, такие как спецификации, планы проекта (никакой сервер проекта все же) через инструменты сотрудничества, такие как Sharepoint для штата неразработки.