THZCi.lua

local ffi = require 'ffi'

ffi.cdef([[
typedef struct float2 cuComplex;
typedef struct THZCudaStorage
{
    cuComplex *data;
    long size;
    int refcount;
    char flag;
    THAllocator *allocator;
    void *allocatorContext;
    struct THZCudaStorage *view;
} THZCudaStorage;

typedef struct THZCudaTensor
{
    long *size;
    long *stride;
    int nDimension;

    THZCudaStorage *storage;
    long storageOffset;
    int refcount;

    char flag;

} THZCudaTensor;

void THZCudaTensor_abs(THCState *state, THCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_arg(THCState *state, THCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_norm(THCState *state, THCudaTensor *self, THZCudaTensor *src);

void THZCudaTensor_real(THCState *state, THCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_imag(THCState *state, THCudaTensor *self, THZCudaTensor *src);

void THZCudaTensor_zabs(THCState *state, THZCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_zarg(THCState *state, THZCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_znorm(THCState *state, THZCudaTensor *self, THZCudaTensor *src);

void THZCudaTensor_zreal(THCState *state, THZCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_zimag(THCState *state, THZCudaTensor *self, THZCudaTensor *src);

float THZCudaTensor_normall(THCState *state, THZCudaTensor *self, float value);
void THZCudaTensor_normDim(THCState *state, THZCudaTensor *self, THZCudaTensor *src, float value, long dimension);

void THZCudaTensor_polar(THCState *state, THZCudaTensor *self, THCudaTensor *src1, THCudaTensor *src2);

void THZCudaTensor_cim(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, THCudaTensor *src2);
void THZCudaTensor_cre(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, THCudaTensor *src2);

void THZCudaTensor_copy(THCState *state, THZCudaTensor *self, THZCudaTensor *src);

void THZCudaTensor_copyIm(THCState *state, THZCudaTensor *self, THCudaTensor *src);
void THZCudaTensor_copyRe(THCState *state, THZCudaTensor *self, THCudaTensor *src);

void THZCudaTensor_copyByte(THCState *state, THZCudaTensor *self, THByteTensor *src);
void THZCudaTensor_copyChar(THCState *state, THZCudaTensor *self, THCharTensor *src);
void THZCudaTensor_copyShort(THCState *state, THZCudaTensor *self, THShortTensor *src);
void THZCudaTensor_copyInt(THCState *state, THZCudaTensor *self, THIntTensor *src);
void THZCudaTensor_copyLong(THCState *state, THZCudaTensor *self, THLongTensor *src);
void THZCudaTensor_copyFloat(THCState *state, THZCudaTensor *self, THFloatTensor *src);
void THZCudaTensor_copyDouble(THCState *state, THZCudaTensor *self, THDoubleTensor *src);
void THZCudaTensor_copyZFloat(THCState *state, THZCudaTensor *self, THZFloatTensor *src);
void THZFloatTensor_copyZCuda(THCState *state, THZFloatTensor *self, THZCudaTensor *src);
void THZCudaTensor_copyZCuda(THCState *state, THZCudaTensor *self, THZCudaTensor *src);
void THZCudaTensor_copyAsyncZFloat(THCState *state, THZCudaTensor *self, THZFloatTensor *src);
void THZFloatTensor_copyAsyncZCuda(THCState *state, THZFloatTensor *self, THZCudaTensor *src);

void THZCudaTensor_fft(THCState *state, THZCudaTensor *self, THZCudaTensor *result);
void THZCudaTensor_fftBatched(THCState *state, THZCudaTensor *self, THZCudaTensor *result);

void THZCudaTensor_ifft(THCState *state, THZCudaTensor *self, THZCudaTensor *result);
void THZCudaTensor_ifftBatched(THCState *state, THZCudaTensor *self, THZCudaTensor *result);

void THZCudaTensor_ifftU(THCState *state, THZCudaTensor *self, THZCudaTensor *result);
void THZCudaTensor_ifftBatchedU(THCState *state, THZCudaTensor *self, THZCudaTensor *result);

void THZCudaTensor_fftShiftedInplace(THCState *state, THZCudaTensor *self);
void THZCudaTensor_fftShifted(THCState *state, THZCudaTensor *self, THZCudaTensor *result);

void THZCudaTensor_fftShiftInplace(THCState *state, THZCudaTensor *self);
void THZCudaTensor_fftShift(THCState *state, THZCudaTensor *self, THZCudaTensor *result);
void THZCudaTensor_ifftShiftInplace(THCState *state, THZCudaTensor *self);
void THZCudaTensor_ifftShift(THCState *state, THZCudaTensor *self, THZCudaTensor *result);

void THZCudaTensor_fillim(THCState *state, THZCudaTensor *self, float value);
void THZCudaTensor_fillre(THCState *state, THZCudaTensor *self, float value);

void THZCudaTensor_add(THCState *state, THZCudaTensor *self, THZCudaTensor *src, float _Complex value);
void THZCudaTensor_mul(THCState *state, THZCudaTensor *self, THZCudaTensor *src, float _Complex value);
void THZCudaTensor_div(THCState *state, THZCudaTensor *self, THZCudaTensor *src, float _Complex value);

void THZCudaTensor_addcmul(THCState *state, THZCudaTensor *self, THZCudaTensor *t, float _Complex value, THZCudaTensor *src1, THZCudaTensor *src2);
void THZCudaTensor_addcdiv(THCState *state, THZCudaTensor *self, THZCudaTensor *t, float _Complex value, THZCudaTensor *src1, THZCudaTensor *src2);

void THZCudaTensor_cmul(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, THZCudaTensor *src2);
void THZCudaTensor_cmulZR(THCState *state, THZCudaTensor *self,
                                   THZCudaTensor *src1, THCudaTensor *src2);
void THZCudaTensor_cadd(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, float _Complex value, THZCudaTensor *src2);
void THZCudaTensor_cpow(THCState *state, THZCudaTensor *self_, THZCudaTensor *src1, THZCudaTensor *src2);
void THZCudaTensor_cdiv(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, THZCudaTensor *src2);
void THZCudaTensor_cdivZR(THCState *state, THZCudaTensor *self, THZCudaTensor *src1, THCudaTensor *src2);
void THZCudaTensor_narrow(THCState *state, THZCudaTensor *self,
                                   THZCudaTensor *src, int dimension_,
                                   long firstIndex_, long size_);
void THZCudaTensor_select(THCState *state, THZCudaTensor *self,
                                   THZCudaTensor *src, int dimension_,
                                   long sliceIndex_);
THZCudaTensor *THZCudaTensor_newNarrow(THCState *state, THZCudaTensor *tensor,
                                                                          int dimension_, long firstIndex_,
                                                                          long size_);
THZCudaTensor *THZCudaTensor_newSelect(THCState *state,THZCudaTensor *tensor, int dimension_, long sliceIndex_);

 THZCudaTensor *THZCudaTensor_new(THCState *state);
 THZCudaTensor *THZCudaTensor_newWithTensor(THCState *state,
                                                    THZCudaTensor *tensor);
/* stride might be NULL */
 THZCudaTensor *THZCudaTensor_newWithStorage(THCState *state, THZCudaStorage *storage_, long storageOffset_, THLongStorage *size_, THLongStorage *stride_);
 THZCudaTensor *THZCudaTensor_newWithSize4d(THCState *state, long size0_, long size1_, long size2_, long size3_);
 THZCudaTensor *THZCudaTensor_newClone(THCState *state,  THZCudaTensor *self);
 void THZCudaTensor_free(THCState *state, THZCudaTensor *self);
 THZCudaTensor *THZCudaTensor_newWithSize(THCState *state, THLongStorage *size_, THLongStorage *stride_);
 void THZCudaTensor_resize(THCState *state, THZCudaTensor *tensor,
                                    THLongStorage *size, THLongStorage *stride);
 void THZCudaTensor_resizeAs(THCState *state, THZCudaTensor *tensor, THZCudaTensor *src);
 void THZCudaTensor_resize4d(THCState *state, THZCudaTensor *tensor, long size0_, long size1_, long size2_, long size3_);
 void THZCudaTensor_sign(THCState *state, THCudaTensor *self,
                                 THZCudaTensor *src);
float _Complex THZCudaTensor_dot(THCState *state, THZCudaTensor *self, THZCudaTensor *src);                                  void THZCudaTensor_maskedFill(THCState *state, THZCudaTensor *tensor, THCudaTensor *mask, float _Complex value);
]])


C = ffi.load('THZC')

local Storage = torch.getmetatable('torch.ZCudaStorage')
local Storage_tt = ffi.typeof('THZCudaStorage**')

rawset(Storage, "cdata", function(self) return Storage_tt(self)[0] end)
rawset(Storage, "data", function(self) return Storage_tt(self)[0].data end)
-- Tensor
local Tensor = torch.getmetatable('torch.ZCudaTensor')
local Tensor_tt = ffi.typeof('THZCudaTensor**')

rawset(Tensor, "cdata", function(self) return Tensor_tt(self)[0] end)

rawset(Tensor, "data",
       function(self)
          self = Tensor_tt(self)[0]
          return self.storage ~= nil and self.storage.data + self.storageOffset or nil
       end
)
return C