Вопросы с тегом "dataframe"

1

Как преобразовать запятую инт (текущего объекта тип) всплывать/инт в Python?

Я пытаюсь скрытая колонка "количество" в инт. В столбце количество строк(,) разделитель или разделитель для числовых значений используя код data['Quantity'] = data['Quantity'].astype('int') data['Quantity'] = data['Quantity'].astype('float') Я...
1

Добавить возможных значений из списка в метод groupBy результат

У меня есть список возможных результатов: list(TEST_RESULT_PRIORITY.keys()) ['Failed', 'Inconclusive', 'Passed', 'Error', 'NotImplemented', 'NonTestable', 'None'] и я делаю метода groupBy из таблицы данных и получить: df.groupby(['Result']...
2

Создание таблицы данных из словаря массивы

Я довольно новыми для Python и у меня есть трудности конвертировании словаря в таблицу данных в Pyhton. Мой словарь содержит вероятностей для передвижения различные акции на разные дни. Когда я пытаюсь преобразовать его в таблицу данных, фондовый им...
0

Извлечение строк в таблицы данных с одним значением из другой таблицы данных

У меня есть две таблицы данных разных измерений. Эти таблицы данных имеют общий столбец. Мне нужно выбрать строки в первом фрейме данных по значениям столбца во второй таблице данных. Я использовал эту функцию Ламба ниже, но оно производит Keyerror:...
5

Как преобразовать данные, чтобы длинные данные по Multi-колонки

Как я могу преобразовать данные X Y как в X = data.frame( ID = c('A','A','A','B','B','C','C','C'), V1 = c(2.3,2.6,2.9,3.0,3.2,1.8,1.7,1.6), V2=c(5.5,4.7,5.0,4.4,4.2,8.0,9.0,8.5), V3=c(1,1,3,2,2,3,3,3), SEX = c("MALE","MALE","MALE","FEMALE"...
5

Как манипулировать ответ предсказание от Google AutoML в панды фрейма данных?

Я успешно обучил модели Google AutoML естественного языка, чтобы сделать мульти-лейбл категоризации текста, используя пользовательские метки. Я также в состоянии использовать Python-функции, порожденные подготовку данных для формирования прогнозов н...
1

в Python KeyError: даже если имя столбца не существует

Я пытаюсь индексировать панды фрейма данных столбца в таблице данных и получаю KeyError. Например, таблицы данных содержит строки индексируются на главную книгу название счета ('наличные','ценные бумаги' и т. д.), а столбцы индексируются период време...
1

Как код файлы данных из Excel в в RStudio

Я пытаюсь импортировать данные из Excel в R (типа статистика), но мы не можем использовать функцию импорта. Мы должны закодировать его. Я обратился за помощью на прошлой неделе с аспирантом, но я думаю, потому что у меня за выходные новый ноутбук, РМ...
2

Как я могу сделать панд, чтобы создавать sumsum в новые столбцы, начиная следующую строку?

Я пытаюсь создать "слайд" из совокупности количестве для различных сценариев, и начать cumsum из следующей строки вниз каждый раз. Я пытаюсь сделать что-то похожее на: Start Price Amt. 1 2 3 4 5 4105 1.6 1234 ...
1

Панды: не гарантия порядка функции отличается виртуозным мастерством исполнения на список?

У меня есть список файлов: files=['D_12-09, batch_1, d_250, T_300, XV_40, I_100-100, C_1.dat', 'D_12-09, batch_1, d_250, T_300, XV_40, I_100-500, C_1, N_after-rest.dat', 'D_12-09, batch_1, d_350, T_180, XV_150, I_100-500, C_1.dat'] Из которого ...
1

как создать раздвижные окна и применять функции в панд таблиц данных

У меня есть следующие таблицы данных : Time A 1 1 2 1 3 1 4 1 5 2 6 2 7 3 8 3 9 2 10 1 11 1 12 1 13 3 14 3 15 3 необходимость с...
1

Удаление выбросов из целевого столбца, когда независимой переменной столбец имеет определенное значение

У меня есть таблицы данных, которая выглядит следующим образом (кликните на лизнуть ниже): df.head(10) https://ibb.co/vqmrkXb То, что я хочу сделать, это удалить выбросы из целевого столбца (occupied_parking_spaces) при стоимости день столбце рав...
0

Используя панд агрегатную функцию на несколько столбцов таблицы данных с различных математических операций

import pandas as pd value=[listbox.get(i) for i in listbox.curselection()] for item in value: file=item+".xdb" conn=sqlite3.connect(file) df=pd.read_sql_query("SELECT * from Data_file",conn) df['File_count'].coun...
0

Разделить таблицу данных на несколько ДФ с разделением значение в качестве имени ДФ, используя Р

У меня есть таблицы данных, как в следующем : dom_output <- data.frame( Site = c("alpha", "beta", "charlie", "delta","alpha", "beta", "charlie", "delta"), Value = c(11,22,33,44,55,66,77,88), label = c("Watermelon","Vanilla","Default","Defa...
0

Переиндексация и именования MultiIndex рамка

У меня ДФ я вытаскивая из библиотеки импорта, и я немного потерял (как новичку) как переименовать и заново уровень данных в Столбцах. Когда я запускаю ДФ.столбцы.имена я вам Frozenlist[нет, нет] Примечание: 1) я пытался добавить колонку от начально...
1

Заполнение строк со значениями последовательных и выше строк с помощью панды

У меня есть фрейм данных, как это: df col1 col2 1 A 3 B 6 A 10 C Я хочу создать фрейм данных из вышеуказанной ДТ таким образом, что если col1 и значения не подряд, он будет создать еще одну строку к следующему с...
0

Как объединить столбцы 2 панды таблиц данных на определенную дату состояние?

У меня 2 панды таблиц данных. Один из них имеет и имеет следующую структуру:- Название таблицы данных-это df_sat- Date. Col1. Col2....... Col6 2017-08-26 numeric values in these columns 2017-08-31 .... 2018-10-30 2018-11-09 Другой таб...
1

Какую функцию р я мог бы использовать, чтобы добавить ежемесячно возвращает таблицу данных?

я хотел бы, чтобы совокупный ежемесячный доход в DataFrame для годовой доходности. К сожалению, я не понимаю, как агрегатная функция работает на основе информации, предоставленной компанией R; или, если это даже правильно функционировать с самого нач...
0

Видеть прогресс при "переборе" за Таблицы данных

Я интересно, если есть лучший способ, чтобы увидеть, если Pyspark делает успехи. В настоящее время единственный выход я вижу, в то время как мой код работает: Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties Setti...
1

Проверка столбцов таблицы данных для отрицательных значений

Я новичок в Python и использовать следующий код, чтобы получить список всех столбцов в моей таблице данных и определить, какие столбцы могут содержать значения null: df.isnull().any() Есть подобный код, чтобы проверить для столбцов, которые могут с...
0

Попытка панды в Pyspark

У меня проблема, когда я пытаюсь использовать toPandas() с данными таблицы в PySpark. Я попробую добавить ('spark.executor.memory', '16g'),('spark.driver.memory','16g') в SparkContext, но не работает. Это код : data = spark.read.load("base_...
0

Создали путаницу о том, как панды фрейма данных являются

Я путать о том, как панды фрейма данных может быть создан в Python: из словаря из списка списков Почему это не допускается: import pandas as pd dict1 = {'hugo': 1, 'francis': 2} pd.DataFrame(dict1) Тем не менее, это позволило: import panda...
0

Нормализуя столбцов таблицы данных

Я хочу нормализовать столбец в следующей таблице данных: import pandas as pd from pprint import pprint d = {'A': [1,0,3,0], 'B':[2,0,1,0], 'C':[0,0,8,0], 'D':[1,0,0,1]} df = pd.DataFrame(data=d) df = (df - df.mean())/df.std() Я не уверен, если нор...
1

заказатьпо таблицы данных на двух или трех столбцов в зависимости от состояния искры скала

Я борюсь с этой проблемой с помощью свечей Скала: У меня есть inmutable значение 'ИТЭР', который может быть установлен на 1 или 2. В зависимости от значения 'ИТЭР', если это 1 мне нужно создать новую таблицу данных, которая является предыдущей отсо...
0

копирование значений из столбца на другой, когда он не находится на

Я пытаюсь скопировать все элементы из V1 в тот столбец, когда он не находится на. pre.passenger[,"Tot"] = ifelse(is.na(pre.passenger[,"V1"]),pre.passenger[,"Tot"],pre.passenger[,"V1"]) structure(list(mode.passenger = structure(list(V1 =...