请问多轮对话的数据集，该如何组织结构比较好，且Loss计算更有效果

请问多轮对话的数据集，该如何组织结构比较好，且Loss计算更有效果。查看了大佬的仓库，对多轮对话涉及比较少，想咨询下多轮对话场景，尤其是长对话下，sft的loss计算怎么合适，且按什么结构来组织数据集会比较合适（alpaca、sharegpt）。