在股票市場交易的動態(tài)環(huán)境中,技術(shù)和金融的融合催生了分析市場趨勢和預(yù)測未來價格走勢的先進方法。本文將使用Python進行股票模式識別。
from collections import defaultdict import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.signal import argrelextrema from statsmodels.nonparametric.kernel_regression import KernelReg from yahoofinancials import YahooFinancials
上面的庫中,有幾個要點需要介紹:
collections.defaultdict:當缺少鍵時,返回默認值。使用它可以有效地存儲和組織數(shù)據(jù),比如鍵反映日期或資產(chǎn)符號等可識別的度量,值表示相應(yīng)的變量。
argrelextrema函數(shù)是SciPy庫中的一個函數(shù),用于進行科學計算和技術(shù)計算。它有助于識別價格數(shù)據(jù)中的局部最大值和最小值,指示價格數(shù)據(jù)中的潛在轉(zhuǎn)折點或支撐位和阻力位。
statsmodels.nonparametric.kernel_regression.KernelReg:這個來自statmodels的子模塊提供了非參數(shù)核回歸功能。交易可以使用這種方法來擬合價格數(shù)據(jù)的平滑曲線,以確定趨勢,無需假設(shè)曲線具有特定的參數(shù)形式。
YahooFinancials:該模塊從雅虎財經(jīng)獲取財務(wù)數(shù)據(jù)。我們可以訪問大量的財務(wù)數(shù)據(jù),包括股票價格,財務(wù)報表和其他市場數(shù)據(jù),用于分析和決定如何處理投資組合。
start_date = '2017-01-01' end_date = '2017-12-31' stock_code = 'FB' # e.g. AMZN, GOOG, FB, NVDA
我們獲取的股票數(shù)據(jù)是在2017-01-01至2017-12-31期間。作為stock_code變量,F(xiàn)acebook, Inc.被設(shè)置為FB,即股票的代碼。
在指定的日期范圍內(nèi),交易算法將執(zhí)行該股票代碼的數(shù)據(jù)分析、交易信號或?qū)嶋H交易等操作。此代碼的目的是為交易算法建立基本參數(shù):目標時間框架和交易的特定股票。
變量最終將在代碼中用于獲取歷史數(shù)據(jù)、執(zhí)行財務(wù)分析和回溯測試交易策略。對于任何專注于股票市場的交易系統(tǒng),這些參數(shù)是評估歷史表現(xiàn)和執(zhí)行實時交易的關(guān)鍵輸入。
def preprocess_data(start_date, end_date, stock_code): stock_data = YahooFinancials(stock_code).get_historical_price_data(start_date, end_date, 'daily') price_data = stock_data[stock_code]['prices'] columns = ['formatted_date', 'open', 'high', 'low', 'close', 'adjclose', 'volume'] new_columns = ['Date', 'Open', 'High', 'Low', 'Close', 'Adj Close', 'Volume'] df = pd.DataFrame(data=price_data)[columns] # order dataframe columns df = df.rename(index=str, columns=dict(zip(columns, new_columns))) # rename dataframe columns return df, df['Close'], df['Date']
preprocess_data有三個參數(shù):start_date、end_date和stock_code,它們指定時間范圍和股票類型。此函數(shù)的主要目標是從Financials檢索給定股票的指定日期范圍內(nèi)的歷史股票價格。
獲取包括全面的金融信息,包括每日股票價格、開盤價、最高價和最低價,以及調(diào)整后的收盤價。獲得數(shù)據(jù)后,將其組織到pandas DataFrame中,通過重命名列,可以實現(xiàn)更好的可讀性和與通用財務(wù)數(shù)據(jù)標準的一致性。該函數(shù)返回處理后的DataFrame以及兩個Series一維數(shù)組,其中包括收盤價和收盤價發(fā)生的日期。
df, prices, dates = preprocess_data(start_date, end_date, stock_code) prices.index = np.linspace(1, len(prices), len(prices)) dates.index = np.linspace(1, len(dates), len(dates))
我們?yōu)閮山M數(shù)據(jù)(價格和日期)設(shè)置索引。然后就是對價格的分析和局部最大值和最小值的識別,這對交易者來說是非常寶貴的。代碼采用了一個核心回歸模型,消除價格的周期性波動,從而更容易發(fā)現(xiàn)重要的趨勢。
# https://onlinelibrary.wiley.com/doi/full/10.1111/0022-1082.00265 # reference: https://www.quantopian.com/posts/an-empirical-algorithmic-evaluation-of-technical-analysis def find_max_min(prices): model = KernelReg(prices.values, prices.index.values, var_type='c', bw='cv_ls') smooth_prices = pd.Series(data=model.fit([prices.index.values])[0], index=prices.index) # index also from 1 # use the minima and maxima from the smoothed timeseries # to identify true local minima and maxima in the original timeseres # by taking the maximum/minimum price within a t-1, t+1 window in the smoothed timeseries smooth_prices_max_indices = argrelextrema(smooth_prices.values, np.greater)[0] smooth_prices_min_indices = argrelextrema(smooth_prices.values, np.less)[0] price_max_indices = [] for i in smooth_prices_max_indices: if 1 < i < len(prices)-1: price_max_indices.append(prices.iloc[i-2:i+2].idxmax()) price_min_indices = [] for i in smooth_prices_min_indices: if 1 < i < len(prices)-1: price_min_indices.append(prices.iloc[i-2:i+2].idxmin()) price_max = prices.loc[price_max_indices] price_min = prices.loc[price_min_indices] max_min = pd.concat([price_max, price_min]).sort_index() max_min = max_min[~max_min.duplicated()] # deduplicate points that are both maximum and minimum max_min return smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, / price_max_indices, price_min_indices, max_min
用一種算法來識別基于平滑價格數(shù)據(jù)的價格曲線改變方向的點,代碼在這個平滑的時間序列中搜索相對最大值和最小值。代碼試圖在平滑數(shù)據(jù)中找到這些極值后,將這些極值映射回原始的非平滑價格數(shù)據(jù)。
它通過檢查平滑數(shù)據(jù)中每個極值點周圍的小窗口來實現(xiàn)這一點,并確定該窗口內(nèi)的價格最高或最低-這些是真正的局部最大值和最小值。在平滑和窗口化處理完成之后,代碼將這些點組織到一個內(nèi)聚輸出中,刪除可能同時存在于最大值和最小值的任何重復點。
可以使用這個結(jié)果來確定交易的進入和退出點。除了在代碼中使用外,該代碼還可以用于更大的策略中,根據(jù)這些發(fā)現(xiàn)觸發(fā)買入或賣出信號。
smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, / price_max_indices, price_min_indices, max_min = find_max_min(prices
smooth_prices包含平滑版本的價格數(shù)據(jù),可以消除噪音,使趨勢更容易識別。
有各種各樣的技術(shù)可用于平滑,包括移動平均線和其他算法。變量smooth_prices_max_indices和smooth_prices_min_indices可能表示平滑價格指數(shù)在局部最大值和最小值列表中的位置。當價格達到這些水平時,在價格反轉(zhuǎn)之前識別潛在的買入或賣出信號是至關(guān)重要的。與前面的變量一樣,price_max_indices和price_min_indices是從原始的、未平滑的價格中計算出來的。
max_min可能是一個數(shù)組或列表,其中包含有關(guān)已識別的最大值和最小值的信息,可能結(jié)合平滑和非平滑數(shù)據(jù),用于根據(jù)本地價格極值確定是否進入或退出頭寸。可以分析金融價格數(shù)據(jù),識別峰值和低谷,并準備數(shù)據(jù)用于算法交易。作為更大的技術(shù)分析系統(tǒng)的一部分,它可以用于基于歷史價格模式的自動交易活動。
下面我們看看上面代碼計算得到的結(jié)果:
fig, ax = plt.subplots(figsize=(20,10), dpi=200) ax.plot(dates, prices, label='Prices') ax.plot(dates, smooth_prices, label='Smoothed Prices', linestyle='dashed') ax.set_xticks(np.arange(0, len(dates), 30)) smooth_prices_max = smooth_prices.loc[smooth_prices_max_indices] smooth_prices_min = smooth_prices.loc[smooth_prices_min_indices] price_max = prices.loc[price_max_indices] price_min = prices.loc[price_min_indices] ax.scatter(dates.loc[smooth_prices_max.index], smooth_prices_max.values, s=20, color='red', label='Smoothed Prices Maxima') ax.scatter(dates.loc[smooth_prices_min.index], smooth_prices_min.values, s=20, color='purple', label='Smoothed Prices Minima') ax.scatter(dates.loc[price_max.index], price_max.values, s=50, color='green', label='Prices Maxima') ax.scatter(dates.loc[price_min.index], price_min.values, s=50, color='blue', label='Prices Minima') ax.legend(loc='upper left') ax.grid()
代碼繪制了具有不同線條風格的實際價格和平滑價格。該圖還顯示了實際和平滑價格數(shù)據(jù)中局部最大值和最小值的位置,可能識別交易進入和退出信號。
為了區(qū)分最大值和最小值,使用較大的符號和不同的顏色。時間軸每隔一段時間顯示在x軸上,以使其更清晰。圖表的圖例解釋了情節(jié)元素,網(wǎng)格有助于分析價格隨時間的變化,這些都是在繪圖中必不可少的工作。
下面一個函數(shù)是Plot_window,它生成一個折線圖,顯示實際價格和平滑價格隨時間的變化。平滑可能有助于識別趨勢并過濾掉噪聲。在這張圖上可以區(qū)分出幾個關(guān)鍵點。顏色和大小用于識別實際和平滑價格曲線的局部最大值和最小高點和低點。交易策略通常關(guān)注這些關(guān)鍵點,因為它們可能預(yù)示著趨勢的逆轉(zhuǎn)或繼續(xù)。
def plot_window(dates, prices, smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, price_max_indices, price_min_indices, start, end, ax=None): if ax is None: fig, ax = plt.subplots(figsize=(20,10), dpi=200) ax.plot(dates.loc[start:end], prices.loc[start:end], label='Prices') ax.plot(dates.loc[start:end], smooth_prices.loc[start:end], label='Smoothed Prices', linestyle='dashed') ax.set_xticks(np.linspace(0, len(dates.loc[start:end]), 10)) ax.tick_params(axis='x', rotatinotallow=45) smooth_prices_max = smooth_prices.loc[smooth_prices_max_indices].loc[start:end] smooth_prices_min = smooth_prices.loc[smooth_prices_min_indices].loc[start:end] price_max = prices.loc[price_max_indices].loc[start:end] price_min = prices.loc[price_min_indices].loc[start:end] ax.scatter(dates.loc[smooth_prices_max.index], smooth_prices_max.values, s=20, color='red', label='Smoothed Prices Maxima') ax.scatter(dates.loc[smooth_prices_min.index], smooth_prices_min.values, s=20, color='purple', label='Smoothed Prices Minima') ax.scatter(dates.loc[price_max.index], price_max.values, s=50, color='green', label='Prices Maxima') ax.scatter(dates.loc[price_min.index], price_min.values, s=50, color='blue', label='Prices Minima') ax.legend(fnotallow='small') ax.grid()
可以在較大的數(shù)據(jù)集中指定一個從開始到結(jié)束的時間窗口,這樣可以查看數(shù)據(jù)的子集。為了清晰起見,在x軸上顯示日期的同時還顯示了一個圖例和一個網(wǎng)格。
plot_window(dates, prices, smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, price_max_indices, price_min_indices, start=18, end=34, ax=None)
下面我們可以尋找一些簡單的模式:
def find_patterns(max_min): patterns = defaultdict(list) for i in range(5, len(max_min)): window = max_min.iloc[i-5:i] # pattern must play out in less than 36 days if window.index[-1] - window.index[0] > 35: continue # Using the notation from the paper to avoid mistakes e1, e2, e3, e4, e5 = window.iloc[:5] rtop_g1 = np.mean([e1, e3, e5]) rtop_g2 = np.mean([e2, e4]) # Head and Shoulders if (e1 > e2) and (e3 > e1) and (e3 > e5) and / (abs(e1 - e5) <= 0.03*np.mean([e1,e5])) and / (abs(e2 - e4) <= 0.03*np.mean([e1,e5])): patterns['HS'].append((window.index[0], window.index[-1])) # Inverse Head and Shoulders elif (e1 < e2) and (e3 < e1) and (e3 < e5) and / (abs(e1 - e5) <= 0.03*np.mean([e1,e5])) and / (abs(e2 - e4) <= 0.03*np.mean([e1,e5])): patterns['IHS'].append((window.index[0], window.index[-1])) # Broadening Top elif (e1 > e2) and (e1 < e3) and (e3 < e5) and (e2 > e4): patterns['BTOP'].append((window.index[0], window.index[-1])) # Broadening Bottom elif (e1 < e2) and (e1 > e3) and (e3 > e5) and (e2 < e4): patterns['BBOT'].append((window.index[0], window.index[-1])) # Triangle Top elif (e1 > e2) and (e1 > e3) and (e3 > e5) and (e2 < e4): patterns['TTOP'].append((window.index[0], window.index[-1])) # Triangle Bottom elif (e1 < e2) and (e1 < e3) and (e3 < e5) and (e2 > e4): patterns['TBOT'].append((window.index[0], window.index[-1])) # Rectangle Top elif (e1 > e2) and (abs(e1-rtop_g1)/rtop_g1 < 0.0075) and / (abs(e3-rtop_g1)/rtop_g1 < 0.0075) and (abs(e5-rtop_g1)/rtop_g1 < 0.0075) and / (abs(e2-rtop_g2)/rtop_g2 < 0.0075) and (abs(e4-rtop_g2)/rtop_g2 < 0.0075) and / (min(e1, e3, e5) > max(e2, e4)): patterns['RTOP'].append((window.index[0], window.index[-1])) # Rectangle Bottom elif (e1 < e2) and (abs(e1-rtop_g1)/rtop_g1 < 0.0075) and / (abs(e3-rtop_g1)/rtop_g1 < 0.0075) and (abs(e5-rtop_g1)/rtop_g1 < 0.0075) and / (abs(e2-rtop_g2)/rtop_g2 < 0.0075) and (abs(e4-rtop_g2)/rtop_g2 < 0.0075) and / (max(e1, e3, e5) > min(e2, e4)): patterns['RBOT'].append((window.index[0], window.index[-1])) return patterns
迭代DataFrame中的條目,同時考慮5個數(shù)據(jù)點。確定每個5點窗口的模式是否在36天內(nèi)發(fā)生。如果沒有,則進入到下一個窗口。我們這里有幾種類型的技術(shù)分析圖表模式:
這是一種反轉(zhuǎn)圖表模式,通常表示股價在漲勢中即將反轉(zhuǎn)。它包括一個中間峰(頭)和兩個較低的峰(肩),形成一個上升趨勢的結(jié)束信號。
與頭肩頂相反,這是一種底部反轉(zhuǎn)圖表模式。它包括一個中間洼地(倒頭)和兩個較低的洼地(倒肩),形成一個下降趨勢的結(jié)束信號。
這是一種表示不穩(wěn)定市場的圖表模式,由兩個趨勢線分散開來形成。它可能表示市場波動性增加,預(yù)示價格的不確定性。
與擴頂形態(tài)相反,這是一種表示不穩(wěn)定市場的圖表模式,由兩個趨勢線逐漸匯聚。它可能表示市場波動性增加,預(yù)示價格的不確定性。
這是一種形成在上升趨勢中的圖表模式,由兩個趨勢線收斂形成三角形。它可能表示價格即將下降。
與三角形頂部相反,這是一種形成在下降趨勢中的圖表模式,由兩個趨勢線收斂形成三角形。它可能表示價格即將上升。
這是一種在上升趨勢中形成的圖表模式,由水平線形成一個矩形。它表示市場可能經(jīng)歷一段橫盤整理,價格可能會下跌。
與矩形頂部相反,這是一種在下降趨勢中形成的圖表模式,由水平線形成一個矩形。它表示市場可能經(jīng)歷一段橫盤整理,價格可能會上升。
上面的這些模式是根據(jù)這些局部最大值和最小值的相對位置和值來識別的,檢測到的每個模式都存儲在一個字典中,模式名稱作為鍵,窗口的開始和結(jié)束索引作為值。這些索引元組存儲在每個模式末尾的字典中。
這樣的代碼在算法交易中很有用,當它自動檢測與某些市場行為相關(guān)的歷史模式時,允許交易者根據(jù)這些模式的存在做出明智的決策。
patterns = find_patterns(max_min) patterns
上面這些專有名字可能不太容易理解,所以我們可以使用代碼把它們進行可視化
def visualize_patterns(dates, prices, smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, price_max_indices, price_min_indices, patterns, shorthand_fullname_dict): for name, end_day_nums in patterns.items(): print('Pattern Identified: {} /nNumber of Observations: {}'.format(shorthand_fullname_dict[name], len(end_day_nums))) rows = int(np.ceil(len(end_day_nums)/2)) fig, axes = plt.subplots(rows, 2, figsize=(20,5*rows), dpi=200) fig.subplots_adjust(hspace=0.5) axes = axes.flatten() i = 0 for start_date, end_date in end_day_nums: plot_window(dates, prices, smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, price_max_indices, price_min_indices, start=start_date-1, end=end_date+1, ax=axes[i]) i += 1 plt.show() visualize_patterns(dates, prices, smooth_prices, smooth_prices_max_indices, smooth_prices_min_indices, price_max_indices, price_min_indices, patterns, shorthand_fullname_dict)
可以看到各種模式是不一樣的,這對我們這些剛?cè)腴T金融行業(yè)的人來說更容易理解。通過圖形化分析股票價格走勢和算法識別模式的工具,可以有助于我們更直觀地理解市場行為隨著時間的推移,這對算法交易至關(guān)重要。
本文鏈接:http://www.tebozhan.com/showinfo-26-38734-0.html使用Python代碼識別股票價格圖表模式
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 騰訊發(fā)布自研彈幕引擎“芯魔方”:用于鬼吹燈《南海歸墟》,跟隨劇情變換特效
下一篇: 如何在組織中有效地使用低代碼工具?