请问多轮对话的数据集,该如何组织结构比较好,且Loss计算更有效果。查看了大佬的仓库,对多轮对话涉及比较少,想咨询下多轮对话场景,尤其是长对话下,sft的loss计算怎么合适,且按什么结构来组织数据集会比较合适(alpaca、sharegpt)。