这是我正在尝试使用的功能:
#define SIZE_X 512
#define SIZE_Y 512
int cl_ctx;
int cl_prg;
int cl_krn;
int cl_mem;
float ExponentialMA( const int position,
const int period,
const double prev_value,
const double &price[]
)
{
//---
float result[];
ArrayResize(result,1);
float pr=2.0/(period+1.0);
Print( "Reality: :) ", (float)price[position]*pr+prev_value*(1-pr) );
if ( period > 0 ) //--- calculate value
{
//--- initializing OpenCL objects
if((cl_ctx=CLContextCreate(CL_USE_GPU_ONLY))==INVALID_HANDLE)
{
Print("OpenCL not found: ", GetLastError() );
return(0);
}
string str;
if((cl_prg=CLProgramCreate(cl_ctx,cl_src,str))==INVALID_HANDLE)
{
CLContextFree( cl_ctx ); Print("OpenCL program create failed: ", str);
return(0);
}
if((cl_krn=CLKernelCreate(cl_prg,"Calculation"))==INVALID_HANDLE)
{
CLProgramFree( cl_prg );
CLContextFree( cl_ctx ); Print("OpenCL kernel create failed");
return(0);
}
if((cl_mem=CLBufferCreate(cl_ctx,SIZE_X*SIZE_Y*sizeof(int),CL_MEM_READ_WRITE))==INVALID_HANDLE)
{
CLKernelFree( cl_krn );
CLProgramFree( cl_prg );
CLContextFree( cl_ctx ); Print("OpenCL buffer create failed");
return(0);
}
int offset[2]={0,0};
int work [2]={SIZE_X,SIZE_Y};
CLSetKernelArg( cl_krn, 0, period );
CLSetKernelArg( cl_krn, 1, (float) price[position] );
CLSetKernelArg( cl_krn, 2, (float)prev_value );
CLSetKernelArgMem( cl_krn, 3, cl_mem );
Print( period, " ", price[position], " ", prev_value );
//--- rendering the frame
CLExecute( cl_krn, 2, offset, work );
CLBufferRead( cl_mem, result );
ArrayPrint( result );
CLBufferFree( cl_mem );
CLKernelFree( cl_krn );
CLProgramFree( cl_prg );
CLContextFree( cl_ctx );
}
//---
return( result[0] );
}
这是 cl_src
:
const string cl_src=
"__kernel void Calculation(int period, \r\n"
"float price, \r\n"
"float prev_value, \r\n"
"__global float *result) \r\n"
"{ \r\n"
" float pr=2.0/(period+1.0); \r\n"
" printf(\"Functional value: %f\",price); \r\n"
" result[0]=price*pr+prev_value*(1-pr); \r\n"
"} \r\n";
期望的输出是 Exponential Moving average
的值,它必须是进程后的某个值 . 但在输出中我得到的值为 0.0000
.
这不是预期的 Value .
甚至 cl_src
中的 printf() 函数也没有给出输出 . 我的猜测是该过程没有收到该值 . 我不明白我错过了什么 .
请建议我能做些什么 . 或者我在内存管理方面做了什么?我如何才能使其多核心可行?
1 回答
OpenCL内核,与CUDA / GPU内核完全相同,代码在OpenCL设备内编译和传输并在那里执行"remotely" . 因此,除非某些特定于平台的技巧作为OpenCL驱动程序扩展存在,否则无法使"remote" -execution引擎"deliver" - printf() -output重新回到主要断开连接/取消同步的异步异构分布式计算生态系统(MetaTrader终端平台与"remote"流程无关,反之亦然) .
因此,除非经过平台验证的工具可用,否则最好避免任何内核“打印”
接下来是接口:OpenCL / MQL5互操作性被记录为仅使用 buffer -mappedped工具来移入数据并返回数据输出 .
最好的下一步:
重新编译简化的OpenCL内核,无需任何打印,并重新测试最简单的步骤:将一个简单的简单值(使用简单值-1)移动到单个数组单元中,以验证工作流程和所有呼叫签名首先匹配,然后进入更多细节,好吗?