奖励模型和批评模型的相关问题？ #2

Open

opened

on Oct 16, 2023

你好，看了数据集都是英文的，请问用英文训练的奖励模型是批评模型是否能用于中文呢？后续是否会开源中文的RLHF数据集？

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Type

No type

Fields

No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests