Я знаком с держателями данных R, такими как векторы, кадры данных и т. д., но мне нужно выполнить некоторый текстовый анализ, и кажется, что у python есть некоторые хорошие настройки для этого. Мой вопрос: где я могу найти объяснение того, как python хранит данные.
В частности, у меня есть набор данных в файле, разделенном табуляцией, где текст находится в 3-м столбце, а оценка нужных мне данных — в 4-м столбце.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
В R я просто загружал его во фрейм данных с именем df1
, и когда я хотел вызвать столбец, я использовал df1$text или df1[,3]
и если бы мне нужна была конкретная ячейка, я мог бы использовать df1[1,3]
.
Я начинаю понимать, как читать данные в python, но не понимаю, как работать с табличными структурами.
Как бы вы посоветовали работать с этим новичку в Python?