用于金融数据可视化和视觉分析的matplotlib工具
pip install --upgrade mplfinance
这个仓库 matplotlib/mplfinance
包含了一个新的 matplotlib finance API,使创建金融图表变得更加容易。它可以很好地与 Pandas DataFrame 对象接口。
更重要的是,新API自动完成了用户之前必须通过旧API"手动"完成的额外matplotlib工作。 (旧API仍然可以在此包中使用;见下文)。
导入新API的常规方式如下:
import mplfinance as mpf
最常见的用法是调用
mpf.plot(data)
其中 data
是一个包含开盘、最高、最低和收盘数据的 Pandas DataFrame
对象,带有 Pandas DatetimeIndex
。
关于如何调用新API的详细信息可以在下面的**基本用法**部分找到,也可以在 examples 文件夹中的jupyter笔记本中找到。
我很想听听你对新 mplfinance
的看法,以及你可能有的任何改进建议。你可以通过 dgoldfarb.github@gmail.com 联系我,或者,如果你愿意,可以在我们的 issues页面 上提供反馈或提出问题。
从包含OHLC数据的Pandas DataFrame开始。例如,
import pandas as pd daily = pd.read_csv('examples/data/SP500_NOV2019_Hist.csv',index_col=0,parse_dates=True) daily.index.name = 'Date' daily.shape daily.head(3) daily.tail(3)
(20, 5)
<table border="1" class="dataframe">
<thead>
<tr style="text-align: right;">
<th></th>
<th>Open</th>
<th>High</th>
<th>Low</th>
<th>Close</th>
<th>Volume</th>
</tr>
<tr>
<th>Date</th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
</tr>
</thead>
<tbody>
<tr>
<th>2019-11-01</th>
<td>3050.72</td>
<td>3066.95</td>
<td>3050.72</td>
<td>3066.91</td>
<td>510301237</td>
</tr>
<tr>
<th>2019-11-04</th>
<td>3078.96</td>
<td>3085.20</td>
<td>3074.87</td>
<td>3078.27</td>
<td>524848878</td>
</tr>
<tr>
<th>2019-11-05</th>
<td>3080.80</td>
<td>3083.95</td>
<td>3072.15</td>
<td>3074.62</td>
<td>585634570</td>
</tr>
</tbody>
</table>
...
<table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>Open</th> <th>High</th> <th>Low</th> <th>Close</th> <th>Volume</th> </tr> <tr> <th>Date</th> <th></th> <th></th> <th></th> <th></th> <th></th> </tr> </thead> <tbody> <tr> <th>2019-11-26</th> <td>3134.85</td> <td>3142.69</td> <td>3131.00</td> <td>3140.52</td> <td>986041660</td> </tr> <tr> <th>2019-11-27</th> <td>3145.49</td> <td>3154.26</td> <td>3143.41</td> <td>3153.63</td> <td>421853938</td> </tr> <tr> <th>2019-11-29</th> <td>3147.18</td> <td>3150.30</td> <td>3139.34</td> <td>3140.98</td> <td>286602291</td> </tr> </tbody> </table> <br>导入mplfinance后,绘制OHLC数据就像在dataframe上调用 mpf.plot()
一样简单
import mplfinance as mpf mpf.plot(daily)
如上所示,默认图表类型是 'ohlc'
。其他图表类型可以通过关键字参数 type
指定,例如, type='candle'
, type='line'
, type='renko'
, 或 type='pnf'
mpf.plot(daily,type='candle')
mpf.plot(daily,type='line')
year = pd.read_csv('examples/data/SPY_20110701_20120630_Bollinger.csv',index_col=0,parse_dates=True) year.index.name = 'Date' mpf.plot(year,type='renko')
mpf.plot(year,type='pnf')
我们还可以使用mav
关键字绘制移动平均线
mpf.plot(daily,type='ohlc',mav=4)
mpf.plot(daily,type='candle',mav=(3,6,9))
我们还可以显示成交量
mpf.plot(daily,type='candle',mav=(3,6,9),volume=True)
请注意,在上面的图表中,即使有些日子没有交易,x坐标轴上也没有空白。非交易日根本不显示(因为那些日子没有价格数据)。
然而,有时人们希望看到这些间隔,这样可以一目了然地知道周末和节假日的位置。
可以使用**show_nontrading
**关键字显示非交易日。
show_nontrading=True
**将显示数据中第一个时间戳和最后一个时间戳之间的所有日期(所有时间间隔)(无论这些日期或时间是否在数据中存在实际的行)。show_nontrading=False
(默认值)将只显示数据中实际存在行的日期(或时间)。(这意味着,如果DataFrame中存在行但只包含**NaN
值,即使设置show_nontrading=False
**,这些行仍会出现在图表中)例如,在下面的图表中,你可以很容易地看到周末,以及11月28日星期四美国感恩节假期的空白。
mpf.plot(daily,type='candle',mav=(3,6,9),volume=True,show_nontrading=True)
我们还可以绘制日内数据:
intraday = pd.read_csv('examples/data/SP500_NOV2019_IDay.csv',index_col=0,parse_dates=True) intraday = intraday.drop('Volume',axis=1) # 无论如何这个日内数据集的成交量都是零 intraday.index.name = 'Date' intraday.shape intraday.head(3) intraday.tail(3)
(1563, 4)
<table border="1" class="dataframe">
<thead>
<tr style="text-align: right;">
<th></th>
<th>开盘价</th>
<th>收盘价</th>
<th>最高价</th>
<th>最低价</th>
</tr>
<tr>
<th>日期</th>
<th></th>
<th></th>
<th></th>
<th></th>
</tr>
</thead>
<tbody>
<tr>
<th>2019-11-05 09:30:00</th>
<td>3080.80</td>
<td>3080.49</td>
<td>3081.47</td>
<td>3080.30</td>
</tr>
<tr>
<th>2019-11-05 09:31:00</th>
<td>3080.33</td>
<td>3079.36</td>
<td>3080.33</td>
<td>3079.15</td>
</tr>
<tr>
<th>2019-11-05 09:32:00</th>
<td>3079.43</td>
<td>3079.68</td>
<td>3080.46</td>
<td>3079.43</td>
</tr>
</tbody>
</table>
...
<table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>开盘价</th> <th>收盘价</th> <th>最高价</th> <th>最低价</th> </tr> <tr> <th>日期</th> <th></th> <th></th> <th></th> <th></th> </tr> </thead> <tbody> <tr> <th>2019-11-08 15:57:00</th> <td>3090.73</td> <td>3090.70</td> <td>3091.02</td> <td>3090.52</td> </tr> <tr> <th>2019-11-08 15:58:00</th> <td>3090.73</td> <td>3091.04</td> <td>3091.13</td> <td>3090.58</td> </tr> <tr> <th>2019-11-08 15:59:00</th> <td>3091.16</td> <td>3092.91</td> <td>3092.91</td> <td>3090.96</td> </tr> </tbody> </table>上面的数据框包含2019年11月5日、6日、7日和8日标准普尔500股指的1分钟间隔开盘价、最高价、最低价、收盘价数据。让我们看看11月6日交易的最后一小时,使用7分钟和12分钟移动平均线。
iday = intraday.loc['2019-11-06 15:00':'2019-11-06 16:00',:] mpf.plot(iday,type='candle',mav=(7,12))
mav
整数的"时间解释"取决于数据的频率,因为mav整数是用于移动平均线的数据点数(而不是天数或分钟数等)。注意上面对于日内数据,x轴自动显示时间而不是日期。下面我们看到,如果日内数据跨越两个(或更多)交易日,x轴会自动同时显示时间和日期
iday = intraday.loc['2019-11-05':'2019-11-06',:] mpf.plot(iday,type='candle')
在下面的图中,我们可以看到当对跨越两天或更多天的日内数据显示非交易时间段时,设置**show_nontrading=True
**的日内图表是什么样子。
mpf.plot(iday,type='candle',show_nontrading=True)
下图:4天的日内数据,设置show_nontrading=True
mpf.plot(intraday,type='ohlc',show_nontrading=True)
下图:相同的4天日内数据,show_nontrading
默认为False
。
mpf.plot(intraday,type='line')
下图:跨越年份边界的日线数据会自动在日期格式中添加年份
df = pd.read_csv('examples/data/yahoofinance-SPY-20080101-20180101.csv',index_col=0,parse_dates=True) df.shape df.head(3) df.tail(3)
(2519, 6)
<table border="1" class="dataframe">
<thead>
<tr style="text-align: right;">
<th></th>
<th>开盘价</th>
<th>最高价</th>
<th>最低价</th>
<th>收盘价</th>
<th>调整后收盘价</th>
<th>成交量</th>
</tr>
<tr>
<th>日期</th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
<th></th>
</tr>
</thead>
<tbody>
<tr>
<th>2007-12-31</th>
<td>147.100006</td>
<td>147.610001</td>
<td>146.059998</td>
<td>146.210007</td>
<td>118.624741</td>
<td>108126800</td>
</tr>
<tr>
<th>2008-01-02</th>
<td>146.529999</td>
<td>146.990005</td>
<td>143.880005</td>
<td>144.929993</td>
<td>117.586205</td>
<td>204935600</td>
</tr>
<tr>
<th>2008-01-03</th>
<td>144.910004</td>
<td>145.490005</td>
<td>144.070007</td>
<td>144.860001</td>
<td>117.529449</td>
<td>125133300</td>
</tr>
</tbody>
</table>
...
<table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>开盘价</th> <th>最高价</th> <th>最低价</th> <th>收盘价</th> <th>调整后收盘价</th> <th>成交量</th> </tr> <tr> <th>日期</th> <th></th> <th></th> <th></th> <th></th> <th></th> <th></th> </tr> </thead> <tbody> <tr> <th>2017-12-27</th> <td>267.380005</td> <td>267.730011</td> <td>267.010010</td> <td>267.320007</td> <td>267.320007</td> <td>57751000</td> </tr> <tr> <th>2017-12-28</th> <td>267.890015</td> <td>267.920013</td> <td>267.450012</td> <td>267.869995</td> <td>267.869995</td> <td>45116100</td> </tr> <tr> <th>2017-12-29</th> <td>268.529999</td> <td>268.549988</td> <td>266.640015</td> <td>266.859985</td> <td>266.859985</td> <td>96007400</td> </tr> </tbody> </table>mpf.plot(df[700:850],type='bars',volume=True,mav=(20,40))
有关使用mplfinance的更多示例,请参阅**examples
**目录中的Jupyter笔记本。
我叫Daniel Goldfarb。2019年11月,我成为了matplotlib/mpl-finance
的维护者。该模块正在被弃用,取而代之的是当前的matplotlib/mplfinance
。旧的mpl-finance
包含从已弃用的matplotlib.finance
模块中提取的代码以及一些使用示例。在过去的三年里,它基本上没有得到维护。
我打算很快将matplotlib/mpl-finance
存档,并将所有人引导至matplotlib/mplfinance
。更名的主要原因是为了避免连字符和下划线的混淆:之前,mpl-finance
安装时使用连字符,但导入时使用下划线mpl_finance
。今后,安装和导入都将简单地使用mplfinance
。
安装了这个新的mplfinance
包后,除了新API之外,用户仍然可以访问旧API。旧API可能有一天会被移除,但在可预见的未来,我们会保留它...至少直到我们非常确信旧API的用户可以用新API完成相同的任务。
要在安装了新的mplfinance
包后访问旧API,请将旧的导入语句