Skip to content

请问多轮对话的数据集,该如何组织结构比较好,且Loss计算更有效果 #208

Open
@RyanOvO

Description

@RyanOvO

请问多轮对话的数据集,该如何组织结构比较好,且Loss计算更有效果。查看了大佬的仓库,对多轮对话涉及比较少,想咨询下多轮对话场景,尤其是长对话下,sft的loss计算怎么合适,且按什么结构来组织数据集会比较合适(alpaca、sharegpt)。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions