amarquand
diff --git a/‎blr.m
Lines changed: 97 additions & 0 deletions b/‎blr.m
Lines changed: 97 additions & 0 deletions
diff --git a/‎blr.m~
Lines changed: 93 additions & 0 deletions b/‎blr.m~
Lines changed: 93 additions & 0 deletions
diff --git a/‎blr.old.m
Lines changed: 66 additions & 0 deletions b/‎blr.old.m
Lines changed: 66 additions & 0 deletions
diff --git a/‎sp_blr_cluster_job.m
Lines changed: 67 additions & 0 deletions b/‎sp_blr_cluster_job.m
Lines changed: 67 additions & 0 deletions
diff --git a/‎sp_blr_cluster_job.sh
Lines changed: 32 additions & 0 deletions b/‎sp_blr_cluster_job.sh
Lines changed: 32 additions & 0 deletions
diff --git a/‎sp_blr_cluster_job_cfun.mat
353 Bytes b/‎sp_blr_cluster_job_cfun.mat
353 Bytes
diff --git a/‎sp_blr_cluster_job_comp
6.28 MB b/‎sp_blr_cluster_job_comp
6.28 MB
@@ -0,0 +1,97 @@
+function [varargout] = blr(hyp, X, t, xs)
+
+% Bayesian linear regression
+%
+% Fits a bayesian linear regression model, where the inputs are:
+%    hyp : vector of hyperparmaters. hyp = [log(beta); log(alpha)]
+%    X   : N x D data matrix
+%    t   : N x 1 vector of targets 
+%    xs  : Nte x D matrix of test cases
+%
+% The hyperparameter beta is the noise precision and alpha is the precision
+% over lengthscale parameters. This can be either a scalar variable (a
+% common lengthscale for all input variables), or a vector of length D (a
+% different lengthscale for each input variable, derived using an automatic
+% relevance determination formulation).
+%
+% Two modes are supported: 
+%    [nlZ, dnlZ, post] = blr(hyp, x, y);  % report evidence and derivatives
+%    [mu, s2, post]    = blr(hyp, x, y, xs); % predictive mean and variance
+%
+% Written by A. Marquand
+
+if nargin<3 || nargin>4
+    disp('Usage: [nlZ dnlZ] = blr(hyp, x, y);')
+    disp('   or: [mu  s2  ] = blr(hyp, x, y, xs);')
+    return
+end
+
+[N,D]  = size(X);
+beta   = exp(hyp(1));     % noise precision
+alpha  = exp(hyp(2:end)); % weight precisions
+Nalpha = length(alpha);
+if Nalpha ~= 1 && Nalpha ~= D
+    error('hyperparameter vector has invalid length');
+end
+
+if Nalpha == D
+    %Sigma  = diag(alpha);      % weight prior precision
+    %iSigma = diag(1./alpha);   % weight prior covariance
+    Sigma  = diag(1./alpha);   % weight prior covariance
+    iSigma = diag(alpha);      % weight prior precision
+else    
+    Sigma  = 1./alpha*eye(D);  % weight prior covariance
+    iSigma = alpha*eye(D);     % weight prior precision
+end
+
+XX = X'*X;
+A  = beta*XX + iSigma;     % posterior precision
+Q  = A\X';
+m  = beta*Q*t;             % posterior mean
+
+if nargin == 3
+    nlZ = -0.5*( N*log(beta) - N*log(2*pi) - log(det(Sigma)) ...
+                 - beta*(t-X*m)'*(t-X*m) - m'*iSigma*m - log(det(A)) );
+    
+    if nargout > 1    % derivatives?
+        dnlZ = zeros(size(hyp));
+        b    = (eye(D) - beta*Q*X)*Q*t;
+        
+        % noise precision
+        dnlZ(1) = -( N/(2*beta) - 0.5*(t'*t) + t'*X*m + beta*t'*X*b - 0.5*m'*XX*m ...
+                     - beta*b'*XX*m - b'*iSigma*m -0.5*trace(Q*X) )*beta;
+        
+        % variance parameters
+        for i = 1:Nalpha
+            if Nalpha == D % use ARD?
+                dSigma      = zeros(D); 
+                %dSigma(i,i) = 1              % if alpha is the variance
+                dSigma(i,i) = -alpha(i)^-2;   % if alpha is the precision
+            else
+                dSigma = -alpha(i)^-2*eye(D);
+            end
+            
+            F = -iSigma*dSigma*iSigma;
+            c = -beta*F*X'*t;
+            
+            dnlZ(i+1) = -( -0.5*trace(iSigma*dSigma) + beta*t'*X*c - beta*c'*XX*m ...
+                - c'*iSigma*m - 0.5*m'*F*m - 0.5*trace(A\F) )*alpha(i);
+        end
+        post.m = m;
+        post.A = A;
+    end
+    if nargout > 1
+        varargout = {nlZ, dnlZ, post};
+    else
+        varargout = {nlZ};
+    end
+    
+else % prediction mode
+    ys     = xs*m;
+    s2     = 1/beta + diag(xs*(A\xs'));
+    post.m = m;
+    post.A = A;
+    varargout = {ys, s2, post};
+end
+
+end
@@ -0,0 +1,93 @@
+function [varargout] = blr(hyp, X, t, xs)
+
+% Bayesian linear regression
+%
+% Fits a bayesian linear regression model, where the inputs are:
+%    hyp : vector of hyperparmaters. hyp = [log(sn2); log(alpha)]
+%    X   : N x D data matrix
+%    t   : N x 1 vector of targets 
+%    xs  : Nte x D matrix of test cases
+%
+% The post
+%
+% Two modes are supported: 
+%    [nlZ, dnlZ, post] = blr(hyp, x, y);  % report evidence and derivatives
+%    [mu, s2, post]    = blr(hyp, x, y, xs); % predictive mean and variance
+%
+% Written by A. Marquand
+
+if nargin<3 || nargin>4
+    disp('Usage: [nlZ dnlZ] = blr(hyp, x, y);')
+    disp('   or: [mu  s2  ] = blr(hyp, x, y, xs);')
+        return
+end
+
+[N,D]  = size(X);
+beta   = exp(hyp(1));     % noise precision
+alpha  = exp(hyp(2:end)); % weight precisions
+Nalpha = length(alpha);
+if Nalpha ~= 1 && Nalpha ~= D
+    error('hyperparameter vector has invalid length');
+end
+
+if Nalpha == D
+    %Sigma  = diag(alpha);      % weight prior precision
+    %iSigma = diag(1./alpha);   % weight prior covariance
+    Sigma  = diag(1./alpha);   % weight prior covariance
+    iSigma = diag(alpha);      % weight prior precision
+else    
+    Sigma  = 1./alpha*eye(D);  % weight prior covariance
+    iSigma = alpha*eye(D);     % weight prior precision
+end
+
+XX = X'*X;
+A  = beta*XX + iSigma;     % posterior precision
+Q  = A\X';
+m  = beta*Q*t;             % posterior mean
+
+if nargin == 3
+    nlZ = -0.5*( N*log(beta) - N*log(2*pi) - log(det(Sigma)) ...
+                 - beta*(t-X*m)'*(t-X*m) - m'*iSigma*m - log(det(A)) );
+    
+    if nargout > 1    % derivatives?
+        dnlZ = zeros(size(hyp));
+        b    = (eye(D) - beta*Q*X)*Q*t;
+        
+        % noise precision
+        dnlZ(1) = -( N/(2*beta) - 0.5*(t'*t) + t'*X*m + beta*t'*X*b - 0.5*m'*XX*m ...
+                     - beta*b'*XX*m - b'*iSigma*m -0.5*trace(Q*X) )*beta;
+        
+        % variance parameters
+        for i = 1:Nalpha
+            if Nalpha == D % use ARD?
+                dSigma      = zeros(D); 
+                %dSigma(i,i) = 1              % if alpha is the variance
+                dSigma(i,i) = -alpha(i)^-2;   % if alpha is the precision
+            else
+                dSigma = -alpha(i)^-2*eye(D);
+            end
+            
+            F = -iSigma*dSigma*iSigma;
+            c = -beta*F*X'*t;
+            
+            dnlZ(i+1) = -( -0.5*trace(iSigma*dSigma) + beta*t'*X*c - beta*c'*XX*m ...
+                - c'*iSigma*m - 0.5*m'*F*m - 0.5*trace(A\F) )*alpha(i);
+        end
+        post.m = m;
+        post.A = A;
+    end
+    if nargout > 1
+        varargout = {nlZ, dnlZ, post};
+    else
+        varargout = {nlZ};
+    end
+    
+else % prediction mode
+    ys     = xs*m;
+    s2     = 1/beta + diag(xs*(A\xs'));
+    post.m = m;
+    post.A = A;
+    varargout = {ys, s2, post};
+end
+
+end
@@ -0,0 +1,66 @@
+function [varargout] = blr(hyp, X, t, xs)
+
+% Bayesian linear regression
+%
+% Fits a bayesian linear regression model, where the inputs are:
+%    X is an N x D data matrix
+%    t is an N x 1 vector of targets 
+%    xs is an Nte x D matrix of test cases
+
+if nargin<3 || nargin>4
+    disp('Usage: [nlZ dnlZ] = blr(hyp, x, y);')
+    disp('   or: [mu  s2  ] = blr(hyp, x, y, xs);')
+        return
+end
+
+[N,D]  = size(X);
+beta   = exp(hyp(1));     % noise precision
+alpha  = exp(hyp(2:end)); % weight precisions
+Sigma  = diag(alpha);     % weight prior covariance
+iSigma = diag(1./alpha);  % weight prior precision
+
+if size(X,2) ~= D
+    
+end
+
+XX = X'*X;
+A  = beta*XX + iSigma;     % posterior precision
+Q  = A\X';
+m  = beta*Q*t;             % posterior mean
+
+if nargin == 3
+    nlZ = -0.5*( N*log(beta) - N*log(2*pi) - log(det(Sigma)) ...
+                 - beta*(t-X*m)'*(t-X*m) - m'*iSigma*m - log(det(A)) );
+    
+    if nargout > 1    % derivatives?
+        dnlZ = zeros(size(hyp));
+        b    = (eye(D) - beta*Q*X)*Q*t;
+        
+        % noise precision
+        dnlZ(1) = -( N/(2*beta) - 0.5*(t'*t) + t'*X*m + beta*t'*X*b - 0.5*m'*XX*m ...
+                     - beta*b'*XX*m - b'*iSigma*m -0.5*trace(Q*X) )*beta;
+        
+        % variance parameters
+        for i = 1:D
+            dSigma = zeros(D); dSigma(i,i) = 1;
+            
+            F = -iSigma*dSigma*iSigma;
+            c = -beta*F*X'*t;
+            
+            dnlZ(i+1) = -( -0.5*trace(iSigma*dSigma) + beta*t'*X*c - beta*c'*XX*m ...
+                - c'*iSigma*m - 0.5*m'*F*m - 0.5*trace(A\F) )*alpha(i);
+        end
+        post.m = m;
+        post.A = A;
+    end
+    varargout = {nlZ, dnlZ, post};
+    
+else % prediction mode
+    ys     = xs*m;
+    s2     = 1/beta + diag(xs*(A\xs'));
+    post.m = m;
+    post.A = A;
+    varargout = {ys, s2, post};
+end
+
+end
@@ -0,0 +1,67 @@
+function [NLML, DNLML, Hyp, Yhat, S2, Yhattr, S2tr] = sp_blr_cluster_job(hyp0,X,Y,opt,Xs)
+
+ones(10)*ones(10); % stupid hack to get matlab to work properly
+
+T   = size(Y,2);  % number of tasks
+
+% -----------------------------
+% defaults
+% -----------------------------
+try opt.type2ml; catch, opt.type2ml = true; end
+try opt.maxEval; catch, opt.maxEval = 100;  end
+try opt.debug;   catch, opt.debug   = false;end  
+    
+D = size(X,2);
+
+Hyp   = zeros(T,length(unwrap(hyp0)));
+NLML  = zeros(T,1); 
+DNLML = zeros(length(unwrap(hyp0)),T);
+
+if nargin > 4 && nargout > 2
+    N      = size(X,1);
+    Ns     = size(Xs,1);
+    Yhat   = zeros(Ns,T);
+    S2     = zeros(Ns,T);
+    Yhattr = zeros(N,T);
+    S2tr   = zeros(N,T);
+end
+for t = 1:T
+    if opt.debug; fprintf('processing case %d of %d ...\n',t,T); end
+    y    = Y(:,t);
+    hyp  = zeros(D+1,1);
+    nlml = NaN;
+    
+    if opt.type2ml
+        try
+            %[hyp,nlml] = minimize(hyp, @gp, opt.maxEval, opt.inf, opt.mean, opt.cov, opt.lik, X, y);
+            [hyp,nlml] = minimize(zeros(D+1,1), @blr, opt.maxEval, X, y);
+            
+            % check gradients
+            fun   = @(lh)blr(lh,X,y);
+            [~,g] = blr(zeros(D+1,1),X,y);
+            gnum  = computeNumericalGradient(fun,zeros(D+1,1));
+        catch
+            warning('Optimisation failed. Using default values');   
+        end
+    end
+    if nargin > 4
+        %[yhat, s2] = gp(hyp,opt.inf,opt.mean,opt.cov,opt.lik, X, y, Xs, zeros(Ns,1));
+        [yhat, s2] = blr(hyp, X, y, Xs);
+        
+        Yhat(:,t) = yhat;
+        S2(:,t)   = s2;
+        if nargout > 5
+            %[yhattr, s2tr] = gp(hyp,opt.inf,opt.mean,cov,opt.lik, X, y, X, zeros(N,1));
+            [yhattr, s2tr] = blr(hyp, X, y, X);
+            Yhattr(:,t) = yhattr;
+            S2tr(:,t)   = s2tr;
+        end
+    else % just report marginal likelihood and derivatives
+        %[nlml, dnlml] = gp(hyp,opt.inf,opt.mean,opt.cov,opt.lik, X, y);
+        %DNLML(:,t)    = unwrap(dnlml);
+        [nlml,DNLML(:,t)] = blr(hyp, X, y);
+    end
+    
+    NLML(t)  = min(nlml);
+    Hyp(t,:) = hyp';%unwrap(hyp)';
+end
@@ -0,0 +1,32 @@
+#!/bin/sh
+# script for execution of deployed applications
+#
+# Sets up the MCR environment for the current $ARCH and executes 
+# the specified command.
+#
+exe_name=$0
+exe_dir=`dirname "$0"`
+echo "------------------------------------------"
+if [ "x$1" = "x" ]; then
+  echo Usage:
+  echo    $0 \<deployedMCRroot\> args
+else
+  echo Setting up environment variables
+  MCRROOT="$1"
+  echo ---
+  LD_LIBRARY_PATH=.:${MCRROOT}/runtime/glnxa64 ;
+  LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${MCRROOT}/bin/glnxa64 ;
+  LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:${MCRROOT}/sys/os/glnxa64;
+  export LD_LIBRARY_PATH;
+  echo LD_LIBRARY_PATH is ${LD_LIBRARY_PATH};
+  shift 1
+  args=
+  while [ $# -gt 0 ]; do
+      token=$1
+      args="${args} \"${token}\"" 
+      shift
+  done
+  eval "\"${exe_dir}/sp_blr_cluster_job_comp\"" $args
+fi
+exit
+