lukovkin · December 2, 2015 08:19
diff --git a/mem-ts-RNN.py b/mem-ts-RNN.py
 # Code for Jupyter/IPython Notebook environment

 from keras.models import Sequential  
 from keras.layers.core import TimeDistributedDense, Activation, Dropout  
 from keras.layers.recurrent import GRU
 import numpy as np
 from keras.utils.layer_utils import print_layer_shapes

 %matplotlib inline
 import matplotlib.pyplot as plt

 # pip install Quandl #to get Quandl Python API
 import Quandl

 def _load_data(data, steps = 40):  
    docX, docY = [], []
    for i in range(0, data.shape[0]/steps-1):
        docX.append(data[i*steps:(i+1)*steps,:])
        docY.append(data[(i*steps+1):((i+1)*steps+1),:])
    alsX = np.array(docX)
    alsY = np.array(docY)
    return alsX, alsY
    

 def train_test_split(data, test_size=0.15):  
    #    This just splits data to training and testing parts
    X,Y = _load_data(data)
    ntrn = round(X.shape[0] * (1 - test_size))
    perms = np.random.permutation(X.shape[0])
    X_train, Y_train = X.take(perms[0:ntrn],axis=0), Y.take(perms[0:ntrn],axis=0)
    X_test, Y_test = X.take(perms[ntrn:],axis=0),Y.take(perms[ntrn:],axis=0)
    return (X_train, Y_train), (X_test, Y_test) 
    
 # Get prices from Quandl
 prices = Quandl.get('WIKI/VZ') # Quandl returns DataFrame
 _prices = prices[['Open', 'Close']]
 print(_prices.values.shape)

 plt.plot(_prices.values)

 # For debug purposes
 (X, Y) = _load_data(_prices.values)
 print(X.shape)
 print(Y.shape)

 for i in range(0, X.shape[0]):
    plt.plot(np.arange(i*40,i*40+40), X[i])
    
 for i in range(0, 5):
    plt.plot(np.arange(i*40,i*40+40), X[i])
    
 np.random.seed(0)  # For reproducability
 #data = np.genfromtxt('closingAdjLog.csv', delimiter=',')
 (X_train, y_train), (X_test, y_test) = train_test_split(_prices.values)  # retrieve data
 print "Data loaded."

 print(X_train.shape)
 print(y_train.shape)

 # Simplier model than in initial post
 in_out_neurons = 2  
 hidden_neurons = 2

 model = Sequential()  
 model.add(GRU(hidden_neurons, input_dim=in_out_neurons, return_sequences=True))
 model.add(Dropout(0.2))
 model.add(TimeDistributedDense(in_out_neurons))  
 model.add(Activation("linear"))  
 model.compile(loss="mean_squared_error", optimizer="rmsprop") 
 print "Model compiled."

 print_layer_shapes(model, input_shapes =(X_train.shape))

 # and now train the model. 
 model.fit(X_train, y_train, batch_size=30, nb_epoch=200, validation_data=(X_test, y_test))  
 print_layer_shapes(model, input_shapes =(X_train.shape))
 predicted = model.predict(X_test)  
 print np.sqrt(((predicted - y_test) ** 2).mean(axis=0)).mean()  # Printing RMSE
	# Code for Jupyter/IPython Notebook environment

	from keras.models import Sequential
	from keras.layers.core import TimeDistributedDense, Activation, Dropout
	from keras.layers.recurrent import GRU
	import numpy as np
	from keras.utils.layer_utils import print_layer_shapes

	%matplotlib inline
	import matplotlib.pyplot as plt

	# pip install Quandl #to get Quandl Python API
	import Quandl

	def _load_data(data, steps = 40):
	docX, docY = [], []
	for i in range(0, data.shape[0]/steps-1):
	docX.append(data[isteps:(i+1)steps,:])
	docY.append(data[(isteps+1):((i+1)steps+1),:])
	alsX = np.array(docX)
	alsY = np.array(docY)
	return alsX, alsY


	def train_test_split(data, test_size=0.15):
	# This just splits data to training and testing parts
	X,Y = _load_data(data)
	ntrn = round(X.shape[0] * (1 - test_size))
	perms = np.random.permutation(X.shape[0])
	X_train, Y_train = X.take(perms[0:ntrn],axis=0), Y.take(perms[0:ntrn],axis=0)
	X_test, Y_test = X.take(perms[ntrn:],axis=0),Y.take(perms[ntrn:],axis=0)
	return (X_train, Y_train), (X_test, Y_test)

	# Get prices from Quandl
	prices = Quandl.get('WIKI/VZ') # Quandl returns DataFrame
	_prices = prices[['Open', 'Close']]
	print(_prices.values.shape)

	plt.plot(_prices.values)

	# For debug purposes
	(X, Y) = _load_data(_prices.values)
	print(X.shape)
	print(Y.shape)

	for i in range(0, X.shape[0]):
	plt.plot(np.arange(i40,i40+40), X[i])

	for i in range(0, 5):
	plt.plot(np.arange(i40,i40+40), X[i])

	np.random.seed(0) # For reproducability
	#data = np.genfromtxt('closingAdjLog.csv', delimiter=',')
	(X_train, y_train), (X_test, y_test) = train_test_split(_prices.values) # retrieve data
	print "Data loaded."

	print(X_train.shape)
	print(y_train.shape)

	# Simplier model than in initial post
	in_out_neurons = 2
	hidden_neurons = 2

	model = Sequential()
	model.add(GRU(hidden_neurons, input_dim=in_out_neurons, return_sequences=True))
	model.add(Dropout(0.2))
	model.add(TimeDistributedDense(in_out_neurons))
	model.add(Activation("linear"))
	model.compile(loss="mean_squared_error", optimizer="rmsprop")
	print "Model compiled."

	print_layer_shapes(model, input_shapes =(X_train.shape))

	# and now train the model.
	model.fit(X_train, y_train, batch_size=30, nb_epoch=200, validation_data=(X_test, y_test))
	print_layer_shapes(model, input_shapes =(X_train.shape))
	predicted = model.predict(X_test)
	print np.sqrt(((predicted - y_test) ** 2).mean(axis=0)).mean() # Printing RMSE