您好,在学习项目代码的时候,我发现对于answer的格式,无论是测试用例还是格式奖励构造好像都允许输出多个answer块,且前面的answer块为空或者是‘and’,默认取最后一个answer的内容,请问这是为什么
您好,在学习项目代码的时候,我发现对于answer的格式,无论是测试用例还是格式奖励构造好像都允许输出多个answer块,且前面的answer块为空或者是‘and’,默认取最后一个answer的内容,请问这是为什么