Начиная с v0.20.0
, аргумент ключевого слова dtype
в функции read_excel()
может использоваться для указания типов данных, которые должны применяться к столбцам, как это существует для read_csv()
.
Использование аргументов converters
и dtype
вместе при одном и том же имени столбца приведет к тому, что последний будет затенен, а прежний получит предпочтение.
1) Inorder, чтобы он не интерпретировал dtypes
, а скорее передавал все содержимое своих столбцов, поскольку они были первоначально в файле раньше, мы могли бы установить этот аргумент в str
или object
, чтобы мы не испортили наши данные. (один из таких случаев - это ведущие нули в числах, которые будут потеряны в противном случае)
pd.read_excel('file_name.xlsx', dtype=str) # (or) dtype=object
2) Он даже поддерживает отображение битов, в котором keys
составляют имена столбцов, а values
- соответствующие данные тип, который должен быть установлен, особенно если вы хотите изменить dtype
для подмножества всех столбцов.
# Assuming data types for `a` and `b` columns to be altered
pd.read_excel('file_name.xlsx', dtype={'a': np.float64, 'b': np.int32})
Для получения количества виджетов от каждой категории виджета, которая имеет больше чем 5 виджетов Вы могли сделать это:
SELECT WidgetCategory, count(*)
FROM Widgets
GROUP BY WidgetCategory
HAVING count(*) > 5
пункт "наличия" - что-то, что люди часто забывают о, вместо этого решив получить все их данные клиенту и выполняя итерации через него там.
GROUP BY подобен ОТЛИЧНОМУ в этом, он группирует несколько записей в одну.
Этот пример, одолженный от http://www.devguru.com/technologies/t-sql/7080.asp , перечисляет отличные продукты в таблице продуктов.
SELECT Product FROM Products GROUP BY Product
Product
-------------
Desktop
Laptop
Mouse
Network Card
Hard Drive
Software
Book
Accessory
преимущество GROUP BY по ОТЛИЧНОМУ, то, что это может дать Вам детализированный контроль, когда используется с пунктом НАЛИЧИЯ.
SELECT Product, count(Product) as ProdCnt
FROM Products
GROUP BY Product
HAVING count(Product) > 2
Product ProdCnt
--------------------
Desktop 10
Laptop 5
Mouse 3
Network Card 9
Software 6
13 & "2"
? это было бы 132
?
– Adjit
24 November 2014 в 15:28
Группа силами, весь набор, который будет заполнен перед записями, возвращается (так как это - неявный вид).
По этой причине (и многие другие), никогда не используйте Группу в подзапросе.
GROUP BY также помогает, когда Вы хотите генерировать отчет, который составит в среднем или суммирует набор данных. Вы можете ГРУППА идентификатором Отдела и СУММОЙ вся выручка от реализации или AVG количество продаж в течение каждого месяца.
Подсчет тегов количества раз используется, мог бы быть пример Google:
SELECT TagName, Count(*)
AS TimesUsed
FROM Tags
GROUP BY TagName ORDER TimesUsed
, Если бы Вы просто хотите отличное значение тегов, я предпочел бы использовать DISTINCT
оператор.
SELECT DISTINCT TagName
FROM Tags
ORDER BY TagName ASC
<svg>
элемент как <object>
; этот ответ не делает этого.
– Phrogz
28 March 2012 в 03:08