Поблочное тестирование Scala

Входной файл данных, который загружает Панда, должен быть в ASCII. Если бы это было в UTF-8, кодировщик UTF-8 правильно загрузил бы байты UTF-8. Если файл не в формате UTF-8, pandas все равно будет загружаться, а экранированный \ xa0 будет загружен буквально и не будет переведен в нужный неразрывный пробел Юникода.

Причина, по которой это работает при копировании / вставке, заключается в том, что python видит экранирование в строковом литерале.

import pandas as pd
data = {u"label": 0, u"date": u"20120528192215Z", u"comment": u"\"i really don't understand your point.\xa0 It seems that you are mixing apples and oranges.\""}
df = pd.DataFrame(index=[1], data=data)
df.to_csv("/tmp/corpusutf8.csv", index=False, encoding="utf-8")
pd.read_csv("/tmp/corpusutf8.csv")
                                             comment             date  label
0  "i really don't understand your point.  It see...  20120528192215Z      0
df['comment']
1    "i really don't understand your point.  It see...
Name: comment, dtype: object

file /tmp/corpus.csv
/tmp/corpusutf8.csv: UTF-8 Unicode text

Если csv создается с \ xa0 и является ascii, Pandas загружается как ascii, хотя задана кодировка utf-8.

cat /tmp/corpusascii.csv
label,date,comment
0,20120528192215Z,"""i really don't understand your point.\xa0 It seems that you are mixing apples and oranges."""
file !$
file /tmp/corpusascii.csv
/tmp/corpusascii.csv: ASCII text
df1 = pd.read_csv("/tmp/corpusascii.csv", encoding="utf-8")
df1
   label             date                                            comment
0      0  20120528192215Z  "i really don't understand your point.\xa0 It ...
54
задан Kaitsu 11 April 2009 в 20:18
поделиться

3 ответа

Have you looked at ScalaTest ?

I've not used it, but it comes from Bill Venners and co at Artima, and consequently I suspect it'll do the job. It doesn't appear to have IDE integration, however.

This blog entry is a little old, but suggests that TestNG is the best option for testing Scala. TestNG will certainly have IDE integrations.

EDIT: I've just realised that I wrote this answer in 2009, and the world has moved on (!). I am currently using ScalaTest, the IDE integration works fine, and I can strongly recommend it. In particular the matcher DSL works very nicely

29
ответ дан Brian Agnew 7 November 2019 в 08:10
поделиться
[116037 Вы также можете проверить Specs , он довольно полон, и IIRC активно используется как часть Lift.

3
ответ дан Saem 7 November 2019 в 08:10
поделиться

Я автор спецификаций. Если вы являетесь пользователем Intellij, я советую вам добавить в org.specs.

20
ответ дан Elnur Abdurrakhimov 7 November 2019 в 08:10
поделиться
Другие вопросы по тегам:

Похожие вопросы: