-
0 votesanswersviews
Python Pandas Dataframe-使用自定义月份将索引设置为datetime
我有一个简单的数据框,看起来像这样 . 0 0.00 1 0.00 2 0.07 3 0.09 4 0.09 ... 180 13.46 181 13.46 182 15.05 183 15.05 184 15.05 185 15.05 我想将数字索引更改为月份日期,但不是按时间顺序 . 我希望它是1... -
1 votesanswersviews
在使用xlwt将公式写入excel表后,使用xlrd公式读取单元格将返回空白
我首先使用pandas创建了一个数据透视表 . 然后我将其保存到工作表中 . 然后我使用xlwt在此工作表中编写了一些数据和公式,以便进一步处理 . 现在我试图从我之前写过公式的单元格中读取值 . book = xlrd.open_workbook(fname) sheet = book.sheet_by_name('Pivot Table') print 'Spare',sheet.cell(1... -
17 votesanswersviews
熊猫:用合并的单元格读取Excel
我有多个工作表的Excel文件,每个工作表看起来都像这样(但更长): Sample CD4 CD8 Day 1 8311 17.3 6.44 8312 13.6 3.50 8321 19.8 5.88 8322 13.5 4.09 Day 2 8311 16.0 4.92 ... -
5 votesanswersviews
如何使用NaN将合并的Excel单元格读入Pandas DataFrame
我想将Excel表格读入Pandas DataFrame . 但是,有合并的Excel单元格和Null行(完整/部分 NaN 已填充),如下所示 . 为了澄清,John H.已下令从"The Bodyguard"购买所有专辑到"Red Pill Blues" . 当我将此Excel工作表读入Pandas DataFrame时,Excel数据无法正确传输 .... -
1 votesanswersviews
将Excel电子表格导入Pandas DataFrame后,单元格中缺少换行符
我正在使用Python Pandas将Excel电子表格( xlsx )导入数据框 . Excel电子表格包含某些列中的文本 . 下面给出了具有多行文本的示例单元格: document belongs to family 13: claims are important. description discloses a bycicle with 3 wheels. assigne is we... -
0 votesanswersviews
使用pandas.read_csv的DataFrame格式错误
我正在尝试打开此数据集:https://www.kaggle.com/dalpozz/creditcardfraud 使用Ipython笔记本 . 我试过了: data = pd.read_csv("...Desktop/creditcard.csv") 得到了: CParserError:标记数据时出错 . C错误:内存不足 . 然后我尝试了Noobie指出的解决方案... -
1 votesanswersviews
在Pandas中加入一个数据集和OneHotEncoder的结果
让我们从this example开始考虑房价的数据集 . 我将整个数据集存储在 housing 变量中: housing.shape (20640,10) 我也做了一个维度的OneHotEncoder编码并得到 housing_cat_1hot ,所以 housing_cat_1hot.toarray().shape (20640,5) My target is to join the... -
2 votesanswersviews
在Pandas中创建数据帧后,excel文件中的图像会发生什么
我有.xls文件在单元格中的图像,如下所示: 当我在pandas中加载这个文件>>> import pandas as pd>>> df = pd.read_excel('myfile.xls') # same behaviour with *.xlsx>>> df.dtypes所有列中的dtype显示为 object 经过一些操作后,我将df... -
0 votesanswersviews
将pandas df写入Excel并将其保存为副本
我有一个pandas数据框,我想打开一个包含公式的现有excel工作簿,将数据框复制到一组特定的列中(比如从A列到H列)并将其保存为具有不同名称的新文件 . 我们的想法是更新现有模板,使用指定的一组列中的数据框填充它,然后使用不同的名称保存Excel文件的副本 . 任何的想法? 我有的是: import pandas from openpyxl import load_workbook b... -
-1 votesanswersviews
Python:如果语句返回ValueError
我用pandas创建一个if语句并返回错误,如下所示: ValueError:系列的真值是不明确的 . 使用a.empty,a.bool(),a.item(),a.any()或a.all() . 我的代码如下: >>> df_1 timestamp open high low close adjusted_close volume \ 0 2017-... -
2 votesanswersviews
有没有相当于dplyr :: summarize的熊猫?
在R / dplyr中,我能做到 summarise(iris, max_width=max(Sepal.Width), min_width=min(Sepal.Width)) 得到: max_width min_width 1 4.4 2 在熊猫中有类似于 summarise 的东西吗?我知道 describe() ,但我希望结果只包含给定列的给定摘要统计信息,而... -
2 votesanswersviews
LSTM具有更多功能/类
如何使用Python中的Keras模型中的Sequential在LSTM上使用多个要素/类作为输入/输出? 更具体地说,我想用作网络的输入和输出:[FeatureA] [FeatureB] [FeatureC] . FeatureA是一个分类类,有100个不同的可能值,表示收集数据的传感器; FeatureB是一个开/关指示器,为0或1; FeatureC是一个分类类,也有5个唯一值 . 数据示... -
0 votesanswersviews
pandas安装错误和python 3.5窗口中的pip更新
首先我是python的新手,并且在尝试使用 pip install pandas 安装pandas时使用3.5版本它通过使用其他命令安装一些软件包显示错误为 pip is not recognized as an internal or external command , py -3.5 -m pip install SomePackage 它显示错误 could not find a vers... -
1 votesanswersviews
保存pandas数据帧以分离没有NaN的jsons
我有一个带有一些NaN值的数据帧 . 这是一个示例数据帧: sample_df = pd.DataFrame([[1,np.nan,1],[2,2,np.nan], [np.nan, 3, 3], [4,4,4],[np.nan,np.nan,5], [6,np.nan,np.nan]]) 看起来像: 得到一个json后我做了什么: sample_df.to_json(orient = 're... -
0 votesanswersviews
使用Python和regex从字符串中提取子字符串
我有一个pandas数据框,在'page'列中包含非常长的字符串,我试图从中提取子字符串: 示例字符串:/ ex / search /!tu / p / z1 / zVJdb4IwFP0r88HH0Sp -hK / dz / d5 / L2dBISEvZ0FBIS9nQSEh /?s& search_query=example one &y = 0&x = 0 使用正则表达式,我很难确定如何在两个... -
1 votesanswersviews
循环遍历一个数据帧中的单个列与另一个数据帧中的列进行比较,使用pandas在第一个数据帧中创建新列
现在我有两个他们看起来像的数据帧: c = pd.DataFrame({'my_goal':[3, 4, 5, 6, 7], 'low_number': [0,100,1000,2000,3000], 'high_number': [100,1000,2000,3000,4000]}) 和 a= pd.DataFrame({'a... -
6 votesanswersviews
ValueError:传递值的形状是(1,6),索引暗示(6,6)
我从flask函数传递一个列表到另一个函数,并获得此值错误 . 发送端的代码: @app.route('/process', methods=['POST']) def process(): name = request.form['name'] comment = request.form['comment'] wickets = request.form['wicket... -
1 votesanswersviews
添加新行以计算退出pandas数据帧的总和和平均值
我的目标是编写一个程序来接收用户输入,计算订单的价格(苹果酒和苹果汁)并打印一个表格如下: 名称苹果酒汁小计(苹果酒)小计(果汁)总计 Richard 13 9 $ 71.50 $ 40.50 $ 112.00 George 7 21 $ 38.50 $ 94.50 $ 133.00 Paul 0 23 $ 0.00 $ 103.50 $ 103.50 John 22 5 $ 121.00 $ 2... -
4 votesanswersviews
Pandas DataFrame Matplotlib BoxPlot Boxes
如何制作一个箱形图,其中我的数据框对象中的每一行都是图中的一个方框? 我有一些股票数据,我想用箱形图绘制 . 我的数据来自雅虎财经,包括每个交易日的开盘价,最高价,最低价,收盘价,调整收盘价和成交量数据 . 我想绘制一个盒子图,其中每个盒子是OHLC价格行动的1天 . import numpy as np import pandas as pd import matplotlib.pyplot a... -
1 votesanswersviews
与熊猫的卷叠加
我经常在matplotlib和open-high-low-close的上下文中看到这个,但我想知道你是否可以在pandas框架中添加一个卷叠加 . 我们想要的最终图表将接近第一个:(Matplotlib - Finance volume overlay) 假设我们有这样的DataFrame: num rolling_30 rolling_10 rolling_60 Volume Date ... -
1 votesanswersviews
如何使用Python 2.7中的Pandas在过去的20个工作日内从雅虎财务中提取EOD股票数据
现在我正在做的是提取最近30天的数据,将其存储在数据框中,然后选择最近20天使用的数据 . 但是,如果过去20天中的某一天是假日,那么雅虎将当天的交易量显示为0,并使用前一天的Adj Close填充OHLC(开盘价,最高价,最低价,收盘价,收盘价) . 在下面显示的示例中,2016-01-26的数据无效,我不想检索此数据 . 那么在过去的20个工作日内如何从雅虎那里获取数据呢?我现在的代码如下: ... -
2 votesanswersviews
使用Candlestick_OHLC绘制图表
import pandas as pd import numpy as np from matplotlib.finance import candlestick_ohlc import matplotlib.pyplot as plt import matplotlib.dates as mdates import matplotlib.ticker as mticker import io ... -
1 votesanswersviews
用Seaborn,Pandas绘制高低
我有一个pandas数据框,按类别三个数据点:mean,max,min . 我想绘制这些,使得均值是一个点,最大/最小值是一条线 . 类似于股票中的高/低/收盘图,甚至只是误差线 . 为了对话,假设我的代码看起来像 df = pd.DataFrame({'day': ['M', 'T', 'W', 'F'], 'foo' : [1,2,3,4], ... -
2 votesanswersviews
如何在matplotlib中制作可点击的python烛台图表
我试图在用户点击有效点时使用matplotlib交互式绘制OHLC图 . 数据存储为表单的pandas数据帧 index PX_BID PX_ASK PX_LAST PX_OPEN PX_HIGH PX_LOW 2016-07-01 1.1136 1.1137 1.1136 1.1106 1.1169 1.1072 2016-07-04 1.1154 1... -
0 votesanswersviews
绘制OHLC matplotlib图时出现AxesSubplot ' object has no attribute ' get_xdata'错误
我试图在用户点击有效点时使用matplotlib交互式绘制OHLC图 . 数据存储为表单的pandas数据帧 index PX_BID PX_ASK PX_LAST PX_OPEN PX_HIGH PX_LOW 2016-07-01 1.1136 1.1137 1.1136 1.1106 1.1169 1.1072 2016-07-04 1.1154 1... -
1 votesanswersviews
如何将pandas时间数据转换为matplotlib可以处理的格式
在3节讲座中,我遇到了一个问题,我无法从雅虎上传任何财务数据,所以我使用pandas datareader上传微软的股票信息,这里是代码: MS= data.DataReader(name = "MSFT", data_source = "yahoo", start = "2007-07- 10", end = "2008-12... -
2 votesanswersviews
如何使用字典键和值重命名pandas DataFrame中的列?
我正在构建函数来帮助我从Web加载数据 . 就加载数据而言,我试图解决的问题是列名称因源而异 . 例如,Yahoo Finance数据列 Headers 看起来像Open,High,Low,Close,Volume,Adj Close . Quandl.com将拥有具有DATE,VALUE,日期,值等的数据集 . 全部大写和小写将所有内容抛出,并且值和调整 . 大部分关闭意味着同样的事情 . 我... -
1 votesanswersviews
如何通过Python获取特定类别的平均值
我想知道如何通过Python计算特定类别的平均值?我有一个名为demo.csv的csv文件 import pandas as pd import numpy as np #loading the data into data frame X = pd.read_csv('demo.csv') 感兴趣的两列是 Category 和 Totals 列: Category Totals estim... -
1 votesanswersviews
Pandas read_csv()有条件地跳过标题行
我正在尝试读取csv文件,但我的 csv 文件有所不同。有些有不同的格式,有些有其他。我正在尝试添加控件,以便我不需要编辑我的代码或输入文件。 我的问题是,其中一些 csv 文件在列标题上方有一行 String。一个例子: Created on 12-11-2018,CryptoDataDownload.com Date,Symbol,Open,High,Low,Close,Volume From... -
0 votesanswersviews
将 dataframe to_csv 文件缓冲区上载到 Google Cloud Storage 时出现 UnicodeError
UnicodeEncodeError: 'latin-1' codec can't encode character '\u2019' in position 26612: Body (''') is not valid Latin-1. Use body.encode('utf-8') if you want to send it encoded in UTF-8. 我使用带编码集的df.to...