部署步骤 将模型转化成ggml.bin格式 初始化设备,指定设备号,分配context,backend的内存 构建model框架 构建计算图 推理 运行 mkdir build cd build && cmake .. && make cd .. ./build/bin/main