, если у вас есть фрейм данных и вы хотите удалить все дубликаты - со ссылкой на дубликаты в определенном столбце (называемое «colName»):
подсчитать перед дедушкой:
df.count()
выполните де-dupe (конвертируйте колонку, которую вы обнуляете в тип строки):
from pyspark.sql.functions import col
df = df.withColumn('colName',col('colName').cast('string'))
df.drop_duplicates(subset=['colName']).count()
может использовать отсортированную группу, чтобы проверить, удалены ли дубликаты:
df.groupBy('colName').count().toPandas().set_index("count").sort_index(ascending=False)
Если вы перезаписываете шаблон, вам нужно установить собственный модуль
Vendor_Module::images_dimensions_chart.phtml
, базовый путь для шаблонов внешнего интерфейса в вашем модуле всегда равен Vendor/Module/view/frontend/templates