Как получить среднее сходство Jaccard среди строк текстового столбца, используя PySpark

FullName как «последний» со статусом == «Ожидание» между двумя датами:

db.orders.find({
      createdAt:{$gt:ISODate("2017-04-25T10:08:16.111Z"),
      $lt:ISODate("2017-05-05T10:08:16.111Z")},
      status:"Pending",
      fullName:/last/}).pretty();

status == 'Ожидание' и orderId LIKE 'PHA876174':

db.orders.find({
     status:"Pending",
     orderId:/PHA876174/
     }).pretty();
0
задан Watt 27 March 2019 в 06:17
поделиться