Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

无法复现原文Fig3结果 #4

Open
realzehuali opened this issue Jul 26, 2024 · 8 comments
Open

无法复现原文Fig3结果 #4

realzehuali opened this issue Jul 26, 2024 · 8 comments

Comments

@realzehuali
Copy link

您好,感谢开发csMR!我对csMR非常感兴趣!

我在7.21日完全按照readme安装了csMR(目前Github最新版),在默认参数跑通example数据后,又用默认参数对BMI全染色体数据、8种脑细胞全染色体数据、全脑全染色体数据进行了测试(结局还是example的两套数据)。

但结果与原文Fig3的T2DM和CAD列有不同,具体阳性如下(P为IVW的P值):
T2DM:全脑(0.049)、星形胶质细胞(0.022)、ODC(0.016)、OPC(0.022)、InN(0.049)
冠心病:星形胶质细胞(0.017)、ODC(4.96e-11)、小胶质细胞(0.045)、周皮细胞(0.016)、ExN(0.009)

想请教:
1、参数对于结果影响是否显著?
2、是否需要使用早期csMR版本?
3、csMR鲁棒性如何?

期待回复,谢谢~

@realzehuali
Copy link
Author

是的,FDR也和原文结果不符,主要怕我哪步出错

@rhhao
Copy link
Owner

rhhao commented Jul 30, 2024

抱歉没有及时回复。

请问你用的reference genome是1000G吗?原文中我用的ref是来自uk biobank的,method部分有说明。由于ukb的数据不是公开的,所以我只提供了1000G的数据来测试软件。我猜测是由于ref不同,导致LD矩阵会有差异,coloc计算过程需要用到LD,因此coloc的结果也会不一致。你可以看看coloc pph4>0.8的点是否与supplementary data 2中的一致?

@realzehuali
Copy link
Author

@rhhao 感谢回复!
是的,我用的1000G。我的COLOC/Susie_coloc.BMI_Giant_UKB.results.coverage.0.9.PPH4.0.8里确实只有666个点,SPdata2里有4206个点,肯定不一样的。

@ariczhou1989 1.5h测试example(40 threads),36h测试完整数据(40 threads)

@rhhao
Copy link
Owner

rhhao commented Aug 8, 2024

抱歉没有及时回复。
请问你用的reference genome是1000G吗?原文中我用的ref是来自uk biobank的,method部分有说明。由于ukb的数据不是公开的,所以我只提供了1000G的数据来测试软件。我猜测是由于ref不同,导致LD矩阵会有差异,coloc计算过程需要用到LD,因此coloc的结果也会不一致。你可以看看coloc pph4>0.8的点是否与supplementary data 2中的一致?

如果你这个回答被杂志社知道了,会不会被撤稿,以及被ukb知道了,会不会被撤稿

感谢提问。

你可以再仔细看一下原文,在Method部分“Colocalization analyses”这一节中我们明确说了文章使用uk biobank的数据来计算LD matrix,并不存在隐瞒。我们拥有ukb数据的使用权限,Acknowledgements部分有引用我们的申请号。但ukb数据不是公开获取的,我们并没有权力将基因型数据公开。

@jasmine327
Copy link

您好,感谢开发csMR!我对csMR非常感兴趣!

我在7.21日完全按照readme安装了csMR(目前Github最新版),在默认参数跑通example数据后,又用默认参数对BMI全染色体数据、8种脑细胞全染色体数据、全脑全染色体数据进行了测试(结局还是example的两套数据)。

但结果与原文Fig3的T2DM和CAD列有不同,具体阳性如下(P为IVW的P值): T2DM:全脑(0.049)、星形胶质细胞(0.022)、ODC(0.016)、OPC(0.022)、InN(0.049) 冠心病:星形胶质细胞(0.017)、ODC(4.96e-11)、小胶质细胞(0.045)、周皮细胞(0.016)、ExN(0.009)

想请教: 1、参数对于结果影响是否显著? 2、是否需要使用早期csMR版本? 3、csMR鲁棒性如何?

期待回复,谢谢~

@rhhao 感谢回复! 是的,我用的1000G。我的COLOC/Susie_coloc.BMI_Giant_UKB.results.coverage.0.9.PPH4.0.8里确实只有666个点,SPdata2里有4206个点,肯定不一样的。

@ariczhou1989 1.5h测试example(40 threads),36h测试完整数据(40 threads)

您好,请问你是使用了1000G作为ref来测试example数据吗,有出现如下的报错吗:运行 susie_finemap.py出现错误:Error in susie_suff_stat(XtX = XtX, Xty = Xty, n = n, yty = (n - 1) * :
susie_suff_stat(XtX = XtX, Xty = Xty, n = n, yty = (n - 1) * 中的错误:
The estimated prior variance is unreasonably large.
估计的先验方差过大。
This is usually caused by mismatch between the summary statistics and the LD matrix.
这通常是由于汇总统计量与 LD 矩阵之间不匹配造成的。感谢您的回复

@ANGUR1
Copy link

ANGUR1 commented Mar 21, 2025

你好,原始的脑单细胞eqtl数据,是没有MAF和SE数据的,但是代码要求MAF和SE数据,对于这么大量的snp再加上这么多文件,MAF和SE数据是如何处理出来的呢?我想问下你们是怎么解决的呢

@Mokiya522
Copy link

您好,感谢开发csMR!我对csMR非常感兴趣!

我在7.21日完全按照readme安装了csMR(目前Github最新版),在默认参数跑通example数据后,又用默认参数对BMI全染色体数据、8种脑细胞全染色体数据、全脑全染色体数据进行了测试(结局还是example的两套数据)。

但结果与原文Fig3的T2DM和CAD列有不同,具体阳性如下(P为IVW的P值): T2DM:全脑(0.049)、星形胶质细胞(0.022)、ODC(0.016)、OPC(0.022)、InN(0.049) 冠心病:星形胶质细胞(0.017)、ODC(4.96e-11)、小胶质细胞(0.045)、周皮细胞(0.016)、ExN(0.009)

想请教: 1、参数对于结果影响是否显著? 2、是否需要使用早期csMR版本? 3、csMR鲁棒性如何?

期待回复,谢谢~

你好,请问可以发我一份example的数据吗?现在去下载这个链接已经失效了。还有我想请问一下原始的eqtl数据是没有maf值的,请问你们是怎么处理的呢?

@Mokiya522
Copy link

你好,原始的脑单细胞eqtl数据,是没有MAF和SE数据的,但是代码要求MAF和SE数据,对于这么大量的snp再加上这么多文件,MAF和SE数据是如何处理出来的呢?我想问下你们是怎么解决的呢

你好,请问你有下载example数据吗,可以发我一份吗,谢谢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants